#ご挨拶
ハイサイ
入社1ヶ月半の@nakachi_keigoです。
現在は研修も終盤を迎え業務に移行しつつあります。
そこで、今回は自分が研修時に最も苦戦したLOD関数を
先輩の@oshiro_azusaさんと一緒に勉強したことをまとめてみました!
まだまだ勉強不足なところもありますので、温かい目で見ていただけると幸いです
#LOD関数とは
LOD関数は(Level of Detail)の略で、直訳すると「詳細レベル」という意味になり、
この関数の特徴で粒度を自由に変えれる関数になっています。
LOD関数には
・FIXED (個別レベルで計算)
・INCLUDE (指定したデイメンションを含めて計算)
・EXCLUDE (指定したデイメンションを除外して計算)
の3つがあり、それぞれ異なる特徴があります。
それぞれ例題とともに説明していきます!!!
#よく出てくるTableauの用語を簡単に解説
-
ディメンション
-
集計することのない、日付、番号、区分、名前などが含まれます。(例:顧客名やカテゴリなど)
-
メジャー
-
集計(合計、平均など)できる、数値のフィールドが含まれます。(例:売上や利益など)
-
ビュー
#FIXED
まずはFIXED関数からです!
Tableauの公式の説明を参照します
詳細レベルの式は、
ビュー内のディメンションに関係なく、
指定されたディメンションを使用して値を計算します。
Tableau公式サイト
(ちょっと何言ってるか分からないので)まずは実際に使用してみましょう
データはみんな大好きスーパーストアを使用します。
まず、下記のようなグラフがあったとします。
各地域の平均売り上げを棒グラフで表しています。
ここでFIXED関数を使用してもっと細かく分析してみます
例えば、地域別だけでなく全国平均と比較してみて
どれくらいの地域が全国平均を上回っているのかきになりませんか?
地域別データと全国平均を比較してみましょう
しかし、このままでは**行に地域が入ってるので全国平均が出せません**
公式の説明にもありましたが、
FIXEDは**行とか列の入ってるものはガン無視して指定した値を計算**してくれます!
なので、次のように計算式を作成します。
{ FIXED : AVG ([売上]) }
これで全国を平均売上を計算してくれます!
上記の計算式を作成し、先程の売上(AVG)の横におきます
左がさっきのグラフで、その隣に全国平均を出してみました!(赤い矢印)
地域と全国という異なる粒度を同じグラフ内で確認する事ができます!
地域だけで比較するより広い視野で分析ができますね
FIXED関数は既に指定したディメンション(項目)に影響される事なく個別に計算する事ができます。
お次はINCLUDEの説明をなかっちが担当します!
#INCLUDE
バトンを受け取りました!なかっちがINCLUDEについてご解説させていただきます!
Tableau公式HPによると
『INCLUDE 詳細レベルの式は、ビューに含まれるディメンションに加えて、指定されたディメンションを使用して値を計算します。』
Tableau公式サイト
とのこと…
この記事を読んだ時の僕の心境としましては
「は?全然分からん…」という感じでしたw
なので、文章からではなく実際にTableauを動かしながら学んでいきましょう!
1.INCLUDEの計算式
まず、今回使用するデータはTableauでお馴染みのスーパー・ストアを使用していきます。
{INCLUDE【指定したいデイメンション】:<集計式>}
上記のような式を使っていきます。
では、早速Tableauで動かしてみましょう!
まず初めは地方別の平均売上をINCLUDEとAVG関数を利用して比較していきます。
下記の計算式を使います。
AVG売上:AVG([売上])
INCLUDEの平均売上:{ INCLUDE [カテゴリ]:AVG([売上])}
上記のグラフを見比べてみると両方とも同じ値になっています。
「だったら、AVG関数使った方が簡単じゃん!」って思いますよね!
そこで、次はどのような場面で利用できるか見ていきましょう。
2.INCLUDEの活用方
1.で行ったグラフでは違いが分かりませんでした。
その理由としては列行にカテゴリーがあったためです。AVG関数は平均を出す関数そして列にカテゴリーが設定されINCLUDEの計算式と同じ意味になったからです。
そこで次は都道府県別の顧客平均売上を出して行きます。
まず、INCLUDEから出していきます。
下記の計算式を使います。
INCLUDE:AVG({ INCLUDE [顧客 Id]:SUM([売上])})
上記のグラフを見てみると顧客IDを行や列、テーマに設定していなくても都道府県別で顧客1人あたりの平均売上を出すことができています。
上記のグラフを見てみると先ほどのグラフとの値の違いが分かります。
3.まとめ
2.で作った2つグラフは同じ手順を踏んでいますがグラフの表す意味が異なります。では、なぜ?違う数値になったのかを説明していきます。
スケールを小さくして説明すると
AスーパーにI,Q,Lさんの三人が買い物に来たとします。
上記の購入データからAスーパーの平均売上を出すとすると下記の計算式になります
(売上の合計金額) ÷ 購入回数
7560÷8=945
よってAスーパーの平均売上は945円ということになります。
これは、2.で作ったAVG関数のグラフとなります。
しかし、上記の購入データには誰が何円分購入したのかが分かります。
なので顧客別の平均売上を出していきます。下記が計算式になります。
(売上の合計金額)÷ 客数
7560÷3=2520
よってAスーパーの顧客1人あたりの平均売上は2520円問ことになります。
これが、2.で作ったINCLUDEのグラフとなります。
AVG関数だけだと何に対する数値なのかがデイメンションによって左右され不明確です。しかし、INCLUDEのように計算式でデイメンションを指定し明確にしたことで、Iさんが5回、Qさんが11回、Lさんが100回購入したとしても購入者は3人ということが固定されます。
このように、INCLUDEでは何に対する(デイメンション)数値なのかを明確に指定することができるのです。
では、いよいよ最後のLOD関数のEXCLUDEのご説明を大城さんお願いします!
#EXCLUDE
こちらもまずは公式の説明を一部抜粋し記載します。
EXCLUDE 詳細レベルの式は、宣言されたディメンションをビューから省略します。
EXCLUDE 詳細レベルの式は、行レベルの式 (省略するディメンションがない式) では使用できませんが、
ビュー レベルの計算またはそれらの中間の計算 (つまり、EXCLUDE 計算を使用して他の詳細レベルの式からディメンションを削除できます) のいずれかを変更するのに使用できます。
Tableau公式サイト
やっぱり難しいので、実際に試してみます
下記のようなグラフがあったとします.
オーダー月ごとの売上を、カテゴリ別に表示しています。
ここにどの月が売上が高いかを色で判断したい時にEXCLUDEを使います
すでに、行にオーダー日は入っていますが、
列にカテゴリーが入っている事で、カテゴリーごとに集計されてしまいます
カテゴリーはいらなので、EXCLUDEで除外します!
計算式は下記になります!
{ EXCLUDE [カテゴリ] : SUM([売上]) }
売上が高い月は棒グラフの色が濃くなり、低い月は淡い色になります
カテゴリ別の売上だけではなく、どの月の売上が高いのかも一目でわかります
EXCLUDEはビュー内にある除外したい項目を指定して計算することができます。
#最後に
この記事を書くにあたり、
苦手意識のあったLOD関数を勉強するいい機会となりました
今後は勉強した事を業務でも実践していけるように頑張ります
この記事が、私達のようにLOD関数に苦戦した方の
参考に少しでもなったら幸いです
また、今回ご紹介させていただいた例題はほんの一部なので
もっと多種多様使な使い方ができるので是非試してみてください
では素敵なイブイブをお過ごし下さい
#参考リンク
・高度な集計(LOD)