今回はちょっと趣旨を変えて、実際にData Saberで学ぶ中でいいなと思ったtableauのテクニックなどを紹介していきたいと思います。
tableauのテクニックについてがっつり紹介というよりは実務の分析の場面で起こりうるような状況で使えそうなテクニックにはこんなのがあるよ、って感じのものになります。
はじめに
売上と品目カテゴリ、クリック数と時間帯など何かと何かの関係に意味があるのかを考える場面は普段の業務でも多くあると思います。
そのような場面で活用いただきたいのが「相関係数」です。
相関係数とは
相関係数とは「2種類のデータ間の関連性(相関関係)の強さを示す指標」のことです。x軸、y軸に各々データを並べたときにどのような分布になるかで相関の強さがわかります。
参考記事)相関係数とは?意味や求め方、エクセルでの計算方法をわかりやすく解説
https://data-viz-lab.com/correlation-coefficient
プロットされた点がまとまりがあって線形のようであれば関係が強いと言え、
逆にばらばらだと相関は弱いと言えます。(このプロットされた図を「散布図」と言います。)
さらに、直線が右上がりだと正の相関で右下がりだと負の相関となります。学生の頃にならった一次関数ですね。
関係の強さを表す指標が「相関係数」と言い
1に近ければ強い正の相関、-1に近れば強い負の相関、ゼロだと関係なしということになります。
相関係数、tableauなら一瞬でできる!
先程の記事 「相関係数とは?意味や求め方、エクセルでの計算方法をわかりやすく解説」
にかかれているように、相関係数はもちろんエクセルでも算出できます。
ですが、tableauならドラッグ&ドロップで散布図を作るだけですぐにできちゃいます!
こちらの動画で実際に散布図を作っているのでご覧いただけたらと思います。
Tableauタブロー入門 散布図とヒストグラム
https://youtu.be/bsR3gvcODro?t=188
※注意
この動画を見て注意が必要だと思ったのは、「交番の数」と「犯罪の発生件数」の相関が強いとしているのですが、
あくまで「交番の数」と「犯罪の発生件数」の相関であって、「因果」ではないことに注意しておく必要があります。
つまり、動画の説明では「交番の数」が多いと「犯罪の発生件数」が多くなる傾向があるとも思えなくもないですが、そういうことではないということです。(現実的にそんなことあってたまるか。)
むしろ「犯罪の発生件数」が多いから「交番の数」も多くしているというのが実情かと。
今回の動画はとりあえず散布図を作る様子がわかるのでその点だけ抑えていただけたらよいかなと…
散布図ができたら
画面左の「アナリティクス」ペインから「傾向線」を選ぶと一瞬で線が入れられます。
そして、線をクリックすると表示が現れ、「R−2乗」という表記が出ます。これが相関係数です。(この図では0.109…なのであまり関係性はないという感じです)
参考記事)Pearson 相関 タブロー編 | smalldata
https://data-analyzer.net/2021/01/03/person-tableau/
以上、お粗末さまでした。