2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Tableauで10億件データを集計してみた【Dr.Sum】

Last updated at Posted at 2021-09-21

最初に

日本で20年以上も愛されている、国産の超高速集計データベースであるDr.Sum
世界でも日本でも大人気のセルフサービスBIツールの代表格であるTableau

2021年9月22日のDr.Sumのバージョンアップにより、この2つのツールの接続が可能になりました。

さっそく動きを見てみたくて、実際につないでみました❗️

Dr.Sum とは

【詳細はこちら】**Dr.Sum**は10億件のデータを1秒台で集計できる超高速データベースツールです。
高速のディスク集計と、ハイブリッドで使える超高速のメモリ集計をつかいながら、最適な運用コストでのパフォーマンスを実現します。 ![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/657414/e8924330-f537-38f2-e276-ecdd0d96341d.png)

また、Dr.Sumは集計速度だけでなく、データベース構築経験の少ない方でもGUI操作でDBをつくったり、データを取り込んだりできます。
データベース周りにそこまで強くないぼくのような人間でも、気軽にデータハンドリングができるところが素敵です。

さて、Dr.Sumという製品は単純にデータベースがあるだけではなく、様々なオプション製品を加えることで、多様な使い方が可能です。

image.png

詳しくは公式ホームページをご参照いただきたいのですが、
✅ データを抜いて
✅ データを加工して
✅ データを貯めて
✅ データを高速集計する
ことが可能となります。

製品の一覧はこちら

Tableau とは

【詳細はこちら】**Tableau**は世界で愛される、直感的操作でデータ分析が実現できるBIツールです

ぼくが思う、Tableauの素晴らしい点は2つ。
ひとつは、個人がデータを武器に価値を創造していくときの最強のツールであるという点
もうひとつは、コミュニティーという共通の目標を持つ企業をまたいだ社会の実現の両者を兼ね備えている点です。
個のスキルを高め、集団で収斂するという考えです。

ツールだけで見ても、「データを分析する」という視点に立ち、データの準備が簡単にできたり、
直感的に操作で、思考を止めずにデータの分析ができるという優れものです。

DataSaberという資格制度が特徴的で、師匠が弟子を育てる形で企業を超えたTableau文化が根付いております。
ツールの性能やそのコミュニティー、どれも世界クラスの製品です。

 

2021年9月22日の段階では、Dr.Sum接続はTableau PrepとTableau Onlineには対応していません。
本記事もTableau Serverとの接続を記載します。

2023年追記
現在ではTableau Prepとの接続も可能になっています。Tableau Onlineとの接続を待つばかりです。

 

Tableauで超高速集計をしてみた

今回の記事はDr.SumとTableauでどれくらいのデータ件数の分析ができるかを調査したという内容です。

いきなり結論ですが、10億件のデータでこの速度で分析できます。

test1.gif

問題なくサクサク見れてますね。

「いやいやいや、ホントに10億件なの?」って思う方もいらっしゃると思うので、こちらをご覧ください。
Tableauから見たカウント件数はこちらです。

image.png

Dr.Sumから見たカウント件数はこちらです。

image.png

どちらも1,000,000,000件という途方もない数値が表示されているかと思います。
この大量データがサクサク分析できるというのは、データ分析をする皆さんにとってとても嬉しいことだと思います。

Dr.Sumはなんでこんなに早いのか

10億データがサクサク動く。
ここでは見せてないですが、20億や100億というデータでもちゃんと動きます。

Dr.Sumは通常のディスク集計の他にインメモリ集計という機能がございます。
ディスク集計でもじゅうぶんに早いのですが、10億くらいになるとインメモリ集計が望ましいです。

インメモリ集計は、当然ながらメモリ容量を圧迫しますので、必要なテーブルのみをインメモリ化することが望ましいです。

image.png

上の画像では、[ロード済み]と記載のあるテーブルだけインメモリにして、残りはディスク集計です。
このようにハイブリッドで活用できるのがDr.Sumの強みです。

実際にテーブルをメモリに乗せる作業も、テーブルを右クリックして[インメモリ化]とするだけでOKです。
超お手軽です。

最後に

いかがでしたでしょうか。
もしTableauをお使いになられていて、データソース側の問題でレスポンスが出ていない場合、ぜひDr.Sumをご検討してみてはいかがでしょうか?
他にもこのような情報をそろえております。

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?