はじめに
分析する際にデータの可視化以上に大切なことがあります. それはデータ加工です. 例えば月別の累積の売上を出したり、利益率を出したりなどです.
今回はTableauの中で必要なデータ加工のテクニックを紹介します
1. LOD
これは level-of-detailの略で"詳細レベル式"と呼ばれるものです. はい、これで理解できる人はまずいないと思います、そしてTableauのマニュアルを見てもすぐ理解できる人は少ないと思います(私もさっぱりでした). 簡単に説明したいと思います.
LODとは
簡単に言うとTableauの標準操作ではできないデータハンドリングを使用というもので、集計をする前に集計する計算式といった具合だと思います.
この計算式の種類は3種類あります.
FIXED :
INCLUDE :
EXECUDE :
それぞれの計算式のイメージを張っておきます(これが一番わかりやすいかも. まずは集計表から作成したほうがわかりやすいですよね)
順に開設していきます
FIXED
- FIXED[カテゴリ]:MAX([売上])
- 売上がカテゴリの中で一番大きい値を取得しています. この時年月は無視して取得しているためすべての年度でおなじ値を取得していることがわかると思います
- FIXED[サブカテゴリ]:MAX([売上])
- 売上がサブカテゴリの中で一番大きい値を取得しています. またカテゴリは複数のサブカテゴリを持っているため、複数のサブカテゴリの中で一番大きい売上を合計(メジャーバリューの属性を見ると合計になっているのがわかるかと思います)の値を表示しています
- またこの値も上記と同様に年度を無視しているのでどの年度も同じ値になっています
INCLUDE
- INCLUDE[カテゴリ]:MAX([売上])
- カテゴリの単位でMAXを計算しています. この場合はINCLUDEがない場合のMAXと結果は同じです
- INCLUDE[サブカテゴリ]:MAX([売上])
- 年度の集計後に、サブカテゴリの単位でMAXをSUMしています. この場合は合計ではなくMEANにした方がいいですね、分析軸をカテゴリの粒度までしか設定していませんがこの式があることでサブカテゴリの最大額の平均などを計算することができます
EXCLUDE
- EXCLUDE[カテゴリ]:MAX([売上])
- 分析軸の年度の範囲内でカテゴリを無視して、最大の売り上げを取得しています
- EXCLUDE[サブカテゴリ]:MAX([売上])
- 分析軸の年度の範囲内でサブカテゴリを無視して、最大の売り上げを取得しています. そのためカテゴリに拘束された売上の最大値を取得しています. (結果として普通のカテゴリのMAXと一致しています)
まとめ
いかがでしたでしょうか. LOD...難しいですよね、私も理解するまで時間がかかりました. ぜひ実務の中で使いながら覚えていこうかと思います. 本当は表計算まで行きたかったのですが次回に使用と思います.