はじめに
moriwakunと申します。(X:moriwakun1799)
Tableau DATASaberBridge3rdに挑戦中です。
DATASaberのカリキュラムでは「サンプル スーパーストア」を用いた課題を解いていくのですが、そこに結合できる顧客データ「Customer_Master.csv」にカリキュラムで使わなかったデータが色々ありましたので、遊んでみようかと思います。
→ 「カレーの食べ方」、気になりますね。(元データは「別盛り・せき止め派」のように1つにまとまっていましたのでカスタム分割を行いました)
- 年齢分析編 ← 今回はこちら
- 謎データ編 ← やるかも?
顧客の年齢分析をしてみる
確認したいこと
- 顧客の年齢と売上・利益・割引率をまとめたい
- 地域で顧客の年齢に特色があるのか?
- 地域マネージャーが分析に使えるようなVizを作りたい
データの前処理
購入時年齢の算出
「Customer_Master.csv」を顧客IDをキーにして購入情報に紐づけている関係上、「Customer_Master.csv」の年齢は現在の年齢ということになります。そこで、購入時点での年齢を算出することで正しい分析が行えるのでは?と考えました。
→ オーダー日時点での年齢ではないことがデータから確認できました
計算フィールドから、購入日時点での年齢を
DATEDIFF('year',[誕生日],[オーダー日])
で定義し、こちらを使っていこうと思います。
→ うまくいってそうですね
ビジュアライズの作成
顧客の年齢層による分布
先ほどの「購入日時点での年齢」についてビン(サイズ:10)を作成し、○代のオーダーが多いのかを可視化してみます。
同様に、年代ごとの合計売上額を可視化してみます。
割引率は80代を除くと、どの年代もあまり変わらないことが分かりました。
以上の3つに加え、利益を追加してをまとめると以下のようになります。ビンを使わない方が何となく分かりやすい気がします。Vizではこちらを採用します。
ついでに標準偏差(0.5σ)のリファレンスバンドを追加してみました。売上においては40代後半・60代前半への販促に課題がありそうです。利益については54歳の顧客が著しく低かったり、割引率については24歳の顧客へ高くなっていることがわかります。これらについては原因特定が必要かもしれません。
地域によるフィルター
円を重ねることで折れ線グラフを少し見やすくし、0.5σの表記を外しスッキリさせました。この状態で関西地方でフィルタリングしてみます。
Vizをつくってみる
地域マネージャーが日常の顧客分析に使えるようなVizを作ってみます。
メインは先ほどの折れ線グラフ。
これだけだと物足りないため、地域売上の全国比を出せる棒グラフを右下に入れてみます。
→ まとまりよくなった気がしますね!これで完成としましょう!
作成したVizはこちら