DataSaberプログラムの一環と自分がやってきたことの振り返りを兼ねて
メモを残しておこうと思います。
Ord1
Q1
バインダー(サブカテゴリ)
事務用品(カテゴリ)
売上
これらがキーになる。
列:カテゴリ、サブカテゴリを配置
行:売上(売上)を配置
※フィールドの順序について
カテゴリ→サブカテゴリの並びで配置。カテゴリの方が大きい集合なので
データのグルーピングがしやすい
サブカテゴリ→カテゴリの並びで配置。個々のデータの属性は見えるが
グループ内での比較は視覚的には難しい。
今回はカテゴリ内での比較をしたい。
Viz内で何を見せたいか?は一生の命題なので見せ方には細心の注意を払う。
Q2
列:地域
行:割引率(平均)
割引率をそのまま入れると合計が出てしまうのでメジャーから平均を選択する
指定はされていないがマークにて割引率のラベルを表示するようにすると
各エリアの割引率をVizに表示させることもできる
Q3
列:年(オーダー日) ←不連続
行:カテゴリ
このとき各カテゴリに顧客IDがどれだけ存在したか。そしてその合計はいくつかを表示する
顧客IDの数をカウントしたいので顧客IDをメジャー(カウント個別)する。
Q4
列:合計(売上)
行:オーダID
※行と列が逆でもよいですが長い文字列を表示させる場合などは
横向きの棒グラフが見やすかったりします。
売上トップ10さえ見れればよいので全データを表示する必要はないので
上位10にフィルターで絞ります。
フィルターの条件設定でフィールド指定にチェックを入れ
売上合計が上位10のデータのみを選択します
Q5
列:年(オーダー日)、月(オーダー日)
行:合計(売上)
前年比成長率を見たいので簡易表計算から前年比成長率を選択
カテゴリごとに色分けをしておく。
傾向を見たいので傾向線をつけておく
Q6
DataSaber全般に言えることだけど問題文の日本語が難解なことが多い。
製品IDに付与されているカテゴリでちゃんとカテゴライズしてね、とのことなので
文字成分抽出のため製品IDにカスタム分割を実施する。
※どういう命名規則になっているかはデータをちゃんと見てみること。
Q7
まずは1つ1つグラフを作ってみると良い
列:サブカテゴリ
行:売上、利益、数量
売上と利益は同じ単位でまとめやすそう…と考えることもできるのでまとめる。
売上を利益の軸のところまでもっていきドラッグアンドドロップ
異なる単位のデータを1つのグラフ内で表現するために二重軸を使ってみる
Q8
列:顧客区分
行:地域、合計(売上)
地域の比較をしやすくしたい、とある。
自分たちで好きにデータのグルーピングができる。
※もちろん自分の会社で区分けしているエリアのようなグルーピングでもよい。
Viz上の並びは自由に並び替えができるので
せっかくなら北→南という並びに並べ替えてみる
桁数表示についてはなるべくシンプルに書式設定で単位を変えてみる
(個人的には百万という単位が欲しい)
Q9
列:月(オーダー日)
行:合計(数量)
累計を見たいとのことなので簡易表計算から累計を選択する。
線グラフで見てみると徐々に差が現れているのがよく見て取れる
Q10
列:合計(売上)
行:個別のカウント(顧客名)
マーク:サブカテゴリ
2つのメジャーデータの関連性が見たいとのことなので散布図を見てみる。
アナリティクスから線形の傾向線を選択し、相関関係を見てみる。
※一般的に正の相関があれば右肩上がり、負の相関があれば右肩下がり
相関がみられない場合はほぼ横ばいとなる。
Q11
列:曜日(オーダー日)
行:個別のカウント(顧客Id)
Tableauは日付から曜日を割り出してくれるので曜日ごとの分析ということも容易。
データの大小を比較する際、値が近いもの同士だと線グラフや円グラフなどではわかりにくくなる。
棒グラフによる高低での表現というのは強力な視覚化方法の1つ
Q12
利益率の考え方について
×:SUM(利益/売上)
〇:SUM(利益)/SUM(売上)
列:年(オーダー日)、曜日(オーダー日)
行:利益率
アナリティクスから定数線で利益率=0.15となる線をVizに表示させておく
Q13サブカテゴリと顧客区分で相対的に割引率が高いものはどれか?
→相対比較をしてみる
ステップドカラー(2色分割)とグルーピング(すべてのディメンション)
作成したグループごとに売り上げの伸びと利益率の年月推移を割引率のジャッジを行う
割引率の高いグループはあまりにも売り上げが伸びていないしなんなら利益割れてる。
割引率下げろ!
割引率の高いグループを割り出してみる
列:顧客区分
行:サブカテゴリ
マーク:平均(割引率)で色分け
ステップドカラー2色にするとグルーピングができて便利。
割引率が高いデータをグループ化して、もう一つグラフを作る
列:年(オーダー日)、月(オーダー日)
行:合計(売上)、合計(利益率)
マークに先ほどのグループをセット、色わけもしておく。
おおかた予想通りの結果が見えてくる。
Q14
列:年(オーダー日)、月(オーダー日)
行:合計(売上)
アナリティクスペインから全月の平均を出しておき、表示させておく
Viz上で2点を指定すると、その2点の平均を表示させることができる
(インスタントアナリティクス)
全月の平均
指定した2点の平均
Q15
まずはクロス集計表を作成しておく
列:年(オーダー日)
行:顧客区分、カテゴリ、サブカテゴリ
Q14で作成したグラフとクロス集計表をダッシュボードに表示させる。
ダッシュボード上で何かしらの操作をした際にデータを処理したい場合はアクションを追加する
・○○年△△月でフィルターしたい場合。
・○○年でフィルターしたい場合
フィルタ内容を選択したいのでメニューを選択しておく。
※正しく動作させるためにはフィルタ側の粒度(年月)とデータソース側の粒度(年月)は
一致させておくこと
Q16
出荷日数というのは元データに存在しないので以下の通り計算しておく
datediff('day',[オーダー日],[出荷日])
これを基に各カテゴリで出荷日数が長いエリアを見ていく。
※都道府県ではなくエリアで見たい…というような場合は
階層構造を使うことで任意のエリア区分を作成することも可能
Q17
まずは製品名単位で売上と利益の相関を見てみる
列:合計(売上)
行:合計(利益)
製品IDをマークに入れる
次にクラスター分析して売上の高いグループを割り出してみる
※ここではグループ数は2としておく
ここではオレンジ色のデータが売上の高いグループとして読み取れる。
今回は目視確認でよい、とのことなので
カテゴリでハイライトしておく。
※フィルターを使用してしまうと全体との特定カテゴリのデータだけを取り出してしまうので
比較が難しくなる。
全体に対して各カテゴリがどの程度存在するかを浮かび上がらせるならハイライトの方が
効果が高い
・フィルター
フィルターする前と比較してどうだった?と問われても完全に記憶してるわけでもなければ
辛いものがある…