Tableauっていろんな機能がありますよね。
機能を使いこなす上でTableau以外の知識も必要だなーと感じています。
さて、今回試してみたのは次の3つです。
* セカンダリ計算
* アドホック計算
* 百分位
なお、検証結果はこちらで公開しています。
セカンダリ計算
簡易表計算は普段からよく使うのですが、「セカンダリ計算」はどう使うのか
よくわからなかったので避けていましたが、せっかくなので使ってみました。
使ってみたらそんな気難しい機能ではありませんでした。
単純に、表計算で算出した値を使って、さらに計算をしたいときに使います。
機能としては単純なんですが、その使いどころを考えるのが難しいと感じました。
そんな中でたどり着いたのが「パレート分析」です。
「〇%の売り上げは、△%のお客様によって構成されている」みたいなことを
調べるときに使います。たぶん皆さんご存じですよね。
今回はサンプル - スーパーストアのデータを使って、お客様別の売上構成比率を
見てみようと思います。
まずはメジャーに売上高の合計を置いて、ディメンションに「顧客名」を置き、
売上の高い順にソートします。
ここからCtrlキーを押しながら「合計(売上)」ドラッグ&ドロップして
このグラフでは線グラフは売上の累計を表していて、今回は全体の売上高に対する割合を
見たいので、ここでセカンダリ計算の出番です。
「セカンダリ計算の追加」にチェックを入れて、セカンダリ計算タイプに
「合計に対する割合」を選択し、「次を使用して計算」に「表(横)」を
選択すればOKです。
RUNNING_SUM(SUM([売上])) / TOTAL(SUM([売上]))
という項目を作ってくれました。
アドホック計算
設定したピルをダブルクリックして計算式を編集できる、という機能です。
いちいち計算フィールドを作らなくてもサクッと加工ができるので、とても便利です。
上のセカンダリ計算で作った「合計(売上)」をCtrlキーを押しながらマークカードの色に
ドラッグ&ドロップして
試しに売上構成比率80%の境目を色で表現するために
RUNNING_SUM(SUM([売上])) / TOTAL(SUM([売上])) <= 0.8
と入力してみます。
「売上目標を超えた」とかの閾値をまたいだかどうか?を
簡単に見たいときに使えると思います。
百分位
誤った説明をしてしまいそうなので、「百分位」の詳しいことはWebで検索してください。
標本全体を昇順で並べて、全体を100%として、特定の標本以下のデータが
全体の何%を占めるか?を表す値、といった感じでしょうか。
今回は購入額の大きい順に並んだお客様に順序をつけて、
標本数で均等に5つのグループに分けてみます。
5等分するのでクインタイル(Quintile、Quintがラテン語で5)分析と呼ぶそうです。
全体を100%として、5等分しているので、1つのグループは20%です。
計算フィールドで「percentile」という関数を使ってもできるのですが、
表計算の百分位を使って簡易的に表現します。
売上をマークカードの色にドラッグ&ドロップして、表計算で百分位を選択します。
上で配置した「合計(売上)」の▼ボタンを押して、「表計算の編集」をクリックし、
「降順」を選択します。
これは、購入額の大きい順に並べているためです。
次にマークカードの色をクリックし、色の編集をクリックします。
ここで「ステップド カラー」にチェックを入れて、「5 ステップ」にします。
これで、売上合計に対する割合が80%との境目にいる人は上位53.7%のところに
位置していることがわかります。
「サンプル - スーパーストア」の場合、上位20%のお客様が売上合計の80%を占めるみたいな
偏りはないみたいなことがわかったりします。
まとめ
今回はパレート分析やクインタイル分析を実現するために、というところで
* セカンダリ計算
* アドホック計算
* 百分位
を試してみました。
Tableauはいろんな使い方ができるので、Tableauそのもののテクニックも覚えないと
いけないですし、そのテクニックを有効活用するためにいろんな分析手法も
覚えていかないといけないですね。
そーやって自分の引き出しが増えれば、得られるInsightも増える、
といいなーと思って、前向きに勉強していこうと思います。