Edited at

データ分析に欠かせない五つの考え方【データ分析手法をたくさん知っても活用できない根本理由】


はじめに

お久しぶりの更新です。

【学習計画】十週間で知識ゼロからのデータ分析入門シリーズでは、データ分析の考え方(第一週)、Excel上級(第二週)を省略して、データベースとSQL入門(第三週)から書き始めました(省略した理由は前に説明した)。

でも、Twitterで読みたい記事のテーマについての投票結果によると、データ分析の考え方にする方が多いので、やはりその部分を書いてみます。

あくまで自分の経験談ですから、間違っているがあるかもしれません。いつでもご意見大歓迎。


データ分析の重要性が高まるにつれて、便利なデータ分析ツールや手法が次々に現れています。しかし、効率的にデータ分析を行うためには、一定の思考と手順の流れが必要とされます。それを知らないと、多機能の分析ツールや手法に振り回されて、「分析のために分析」になりがちです。

ルート(√)、因数分解、解の公式などの解き方で二次方程式を解けるように、データ分析にも「解き方」が存在してます。

では、早速データ分析に必要な五つの考え方を説明しましょう。


考え方①:因数分解

皆さんきっと因数分解による二次方程式の解き方を知っているでしょう。データを分析する際に、起きている現象を、いくつかのさまざまな切り口で因数分解することで、その現象を引き起こしている原因となっている要素を見つけ出すことができます。

ここで、ECサイトの売上公式を例に分析してみます。

1.商品売上=販売量×単価

2.販売量=販売チャネルAの販売量+販売チャネルBの販売量+販売チャネルCの販売量

3.販売チャネルの販売量=クリック数×成約率

4.クリック数=表示回数×クリック率

ステップ①:売上減少の要因を見つける。

商品売上=販売量×単価。販売量が低いか、それとも単価が低いか?

ステップ②:販売量をもう一歩分解してみる。

販売チャンネル毎の販売量を分析して、どちらが下げたかを確認します。

ステップ③:販売チャンネルの販売量減少の要因を分析する。

クリック数が低いか、それとも成約率が低いか?もし成約率が低い場合、そのチャンネルのターゲット顧客が商品のターゲット顧客に一致するかを再確認しないといけません。

ステップ④:クリック数に影響する要因を分析する。

表示回数が足りないか、それともクリック数が低い?クリック数が低ければ、広告内容を改善したらどうですか?

このように、ゴールを因数分解しながら、データ分析の深堀りによって、過程から結果に至るまでフローして評価するのです。データ分析が苦手な人が絶対この考え方を頭には入れておいた方がいいと思います。

そのほかの例:

(資料提供:FineReport


考え方②:比較

これは普段無意識でやっている人も多いと思うんですが、ある数字がいいか悪いかっていうのは、比較することで判断できるものだと考えています。

孤立したデータには意味がなくて、データを比較して、どこが違いうのかをわかるようになります。長さ、高さ、幅など、物事の特徴を述べる変数がありますが、比較による得る増加率、効率、利益などの指標こそ、データを分析する際によく使われるものです。


  • 時間軸での比較(前年比、前月比...)

  • 競合相手との比較(競合他社との売上比較、社内のサービス間での利益比較...)

  • ユーザ属性での比較(20代と50代、男性と女性、関東と関西...)

  • カテゴリ間の比較(...)

問題が起きているデータと、問題が起こっていないデータを比較することで、違いがなにによって発生しているのかを発見できます。それはよく他のデータ分析方法と組み合わせて利用されます。

例えば、ウェッブページの『直帰率55%』という数字だけでよいか悪いかを判断するのは難しいです。この場合、他のデータと並べて見て、「直帰率が70%よりはいい」と比較することで、よいか悪いかの説明ができます。他のデータ”をどうやって得るのか?自分のサイトの同じ性質のページ同士を比較して、あるページが直帰率40%なのにあるページは90%なら、改善できる可能性を考えられそうです。


考え方③:4象限マトリクス

4象限マトリクスとは、横軸、縦軸をそれぞれの中心点で交差させた図表のもので、課題の現状と改善方法(例えば、商品分析、市場分析、顧客管理など)を説く際に使われます。コンサルタントが好んで使うことが多いです。

(資料提供:https://growthhackjournal.com/)

例えば、上記の広告効果測定はCTR、CVRの二つの要素を横軸、縦軸として、広告効果を四つの象限に分類して、それぞれに適切なユーザ獲得施策を打ち出すことで、広告効果を上げていくというわけです。

また、4象限マトリクスより複雑なRFM分析は実際にRecency (最終購入日)、Frequency(累計購入回数)、Monetary (累計購入金額)三つの要素を選択して軸にする8象限マトリクスです。

(資料提供:https://images.app.goo.gl/J2otUSWcLyK3avzy7)

RFM分析については、以下のような一般的解釈がされます。顧客を9種類にグループ化した上で、、それぞれのグループの性質を知って、マーケティング施策を取れます。


Rが高い顧客ほど将来の収益に貢献する可能性が高い

Rが低ければFやMが高くても他社に奪われ離反している可能性が高い

Rが同じならFが高いほど常連客になっている

Rが同じならFやMが高いほど購買力がある顧客

RやFが高くてもMが少ない顧客は購買力が低い

Fが低くMが高い顧客はRの高い方が良い顧客

Fが上がらないか下がっている顧客は他社に奪われている可能性が高い

RFMすべてが低い顧客は切り捨てることも検討


参考:奥瀬喜之 久保山哲二(2012)『経済・経営・商学のための「実践データ分析」』講談社


考え方④:パレートの法則(80:20の法則)

パレートの法則は、2割の要素が、全体の8割を生み出しているという状態を示す経験則です。例えば、皆さんご存知の通り、世界の富の80%は世界の20%の富裕層が所有しているという事実です。パレートの法則はさまざまな事象に当てはまるといっても言い過ぎではありません。

データ分析をやっても無駄?実例から見る本当のデータ分析~【連載-1】の商品ABC分析もパレートの法則の一つの応用例です。つまり、商品の売上の8割は、全商品のうちの2割で生み出していることです。ABC分析で「売れ筋商品」や「死に筋商品」を割り出し、在庫管理や販促に活用します。

ABC分析では、商品と売上を区分するだけでなく、顧客とその取引額を区分することもできます。例えば、企業に 80%の利益をもたらした顧客はどのぐらいですか。20% と想定すると、リソースが限られている場合に、この 20%の顧客に重点を置く必要があります。

現代でビジネスにおいて使われるパレートの法則の例:


  • 売上の8割は、全従業員のうちの2割で生み出している。

  • 仕事の成果の8割は、費やした時間全体のうちの2割の時間で生み出している。

  • Webサイトは、2割のページにサイト全体の8割のアクセスが集中する

  • あるソフトウエアの利用者の8割は、全体の2割の機能しか使っていない

パレートの法則によって、物事の重点を捉えて、特徴を発見してから、残りの 80% を 20% に変換する方法を考えてください。


考え方⑤:ファンネル

ファンネルとは、新規顧客の獲得、商品とサービスの購買過程などをフェーズ分けしたものをモデル化したものです。それは「プロセス化」の思考法です。

 

上図のマーケティングファンネルは顧客の獲得から購入へのコンバージョンまでの全体的な流れを示しています。コンバージョン率で各ステップのパフォーマンスを定量化してから、異常な指標から問題が起きているステップを発見することができます。それから、問題を解決して、そのステップを最適化して、最終的に購入のコンバージョン率を向上させる目的に達するのです。

実際に、ファンネルモデルのコールは分解と定量化にあります。グロースハックにおいて、最も有名なモデル「AARRR(アー)」モデルは同じくファンネルです。サービス全体をユーザの行動に合わせた5段階のステージに分け、各段階の離脱率をファネルの形で整理したものです。

以下のAARRR モデル図はユーザ全体のライフサイクルが徐々に減少する傾向を示しています。ユーザのライフサイクルを分解して定量化することによって、データを横方向と縦方向で分析できます。それによってどの段階に問題が存在するのかが明確になり、最適な施策を打つことが可能になります。


(資料提供:https://images.app.goo.gl/XXVRwuZFFHP4wnjU9)

しかし、単一のファンネル分析は何の結果も得られないので、競合相手との比較、カテゴリ間の比較など、他の方法と組み合わせる必要があります。

下図の通り:

(資料提供:FineReport


まとめ

上記の五つの考え方の役割をまとめます。実際の状況に応じて活用してみてください。

①因数分解:あるゴール、指標に影響する要素を見つけ出し、過程から結果までフローして評価する

②比較:データ間の違いそして違いがなにによって発生しているのかを発見する。

③4象限マトリクス:課題や問題をいくつかのパターンに分類して理解することで、細かい管理を実現する。

④パレートの法則:物事の重点を捉えることでリソースを集中して主な問題を解決する。

⑤ファンネル:全体のプロセス化、定量化および可視化によって、どの段階に問題が存在するかを明確化する。


おまけに:

【学習計画】十週間で知識ゼロからのデータ分析入門シリーズ、今迄の記事:

Excelと統計学について、さまざまな書籍やオンライン学習コースがあるので、書かないことにしたいです。もし書いてほしいなら、コメントかTwitterのメッセージをいただければ幸いです。

最後に、読みたい記事のテーマに関して、Twitterで投票お願いします!