はじめに
23年2月からTableau案件にアサインされることになったので、理解深化のためにまとめます。
第1回目は、「ディメンジョンとメジャー」について。
筆者の技術力
業界歴半年で、つい2週間前にTableau Desktopをインストール。BIツールはTableauが初めてです。
参考
ディメンジョン
データを切る切り口のこと
例えば、「地域毎、年度毎に分析をしたい」とき、●●毎
の部分がディメンジョンに当たります。
様々な形式や意味合いを持つフィールドがまとまったものがデータソースで、そこからやりたい分析に沿ってデータソースを切って
いく=ディメンジョンで分けていくということですね。
メジャー
集計することに意味のあるデータのこと
例えば、「地域毎、年度毎(ディメンジョン)に売上と粗利の合計が見たい」とき、売上と粗利
の部分がメジャーに当たります。
また、合計
がメジャーの集計方法となります。
Tableauは、データソースに接続したときに、自動的に「このフィールドは、ディメンジョン(メジャー)だな」と判別し振り分けてくれます。
そのため、数値形式で設定された「社員番号」、「電話番号」などがメジャーに含まれることがありますが、上記定義で考えれば、社員番号を集計することに意味はない
ので、これらはディメンジョンであることが分かります。
Tableauが視覚化される仕組み
はじめてTableauを触ったとき、自由自在にグラフが変わっていく様子が楽しく思えました。
Tableauはどのように視覚化しているのでしょうか。
上記で学んだディメンジョンとメジャーを使って一言で表すと、
データをディメンジョンで切り分けた範囲の中で、メジャーを集計し視覚化表示している。
具体例で説明するため、以下に3つのグラフを作ってみました。
それぞれのグラフで、どのように切り分けているでしょうか。
① データ全体の売上(メジャー)を集計
データの切り分けは無し。全てのデータに対して集計を行っている。
② 売上合計を地域別(ディメンジョン)に集計
データの切り分けは「地域」。「地域」毎の範囲で集計を行っている。
③ 地域別集計をカテゴリ別(ディメンジョン)でも集計
データの切り分けは「地域とカテゴリ」。「地域とカテゴリ」毎の範囲で集計を行っている。
まとめ
ディメンジョンとメジャーについてまとめました。
それぞれの違いは明らかになりましたが、グラフを作る上で「データを切り分ける」イメージが難しくもありますので、Tableauを思うがままに触ってイメージを固めたいと思います。
ありがとうございました。