データ分析
DataScience
データサイエンス
ロジカルシンキング
DataAnalysis

データ分析を業務で1ヶ月間やってみて学んだ大原則

データ分析エンジニアになった

今までサーバーサイドエンジニア・インフラエンジニアとして仕事をしながら、簡単なデータ分析をして、施策に落としたり施策の効果を測定したりしていました。そして、ちょうど1ヶ月前からデータ分析エンジニアとして業務のほぼ100%をデータ分析関連の仕事に費やすことになりました。ここでは、データ分析に1ヶ月間のめり込んだことで見えた発見を記したいと思います。

ちなみに、自分がデータ分析としてやっていることは、

  • iOS/Androidアプリ
    • DAU/WAU/MAU(日/週/月のアクティブユーザー数)分析
    • RR(再訪率)分析
    • アプリ内課金分析

です。これらのKPIの可視化から、施策出し、施策の効果計測などを担当しています。

データ分析に対して感じていたこと

データ分析を実際に専任で始めるまでは、データ分析=SQL・統計・機械学習・python・数学など色々な単語が頭に浮かんでいました。高度な分析力を磨かないといけないと思っていました。

しかし、データ分析において基本中の基本はここではありませんでした。それは、

「仮説を立てること」「あえてスタンスを取ること」

の2つだという結論に行きつきました。もちろん上の統計などの力がとても効果を発揮する場面は多々ありますし、あって損は絶対にないスキルセットだと思います。しかし、プロダクトを伸ばすためのデータ分析にはもっと大切な大原則があることに気づきました。

仮説を立てて、あえてスタンスをとる

実際の業務上の例で考えてみます。「今月のメインページからの売り上げが落ちた」という問題があるとしましょう。アプリ内で課金に至る動線は色々ある中で、全体の80%を占めるページからのCV(コンバージョン)が下がっているというところまでわかっていたとします。この問題をデータ分析を用いて施策に落とし、解決するというのが分析のゴールです。

まずデータを探索するという誤り

さて、どうしますか?ここでいきなりデータを見るという誤りを起こしがちです。

  • メインページに訪れるユーザーの属性を先月と比べてみよう
  • ユーザーの滞在時間を先月と比べてみよう
  • メインページのレスポンスタイムをみてみようか

このやり方はとても効率が悪いやり方です。データとその切り口は無限大であり、手当たり次第データを分析してみて正解を見つけるのはとても困難です。

仮説を立てる

手当たり次第データに手をつけないためにも、まずやることは「仮説を立てる」ことです。
メインページのCVが落ちたということは、メインページのUUが減ったか、CVRが落ちたかのどちらかです。このように、まずはロジカルに問題を分解してみます。

Screen Shot 2018-05-15 at 10.55.34.png

問題の分解に使える手法としてロジックツリーとMECEがあります。

ロジックツリー

「ロジックツリー」は、ある1つの課題や問題があるときに、どのような道筋でその事象を解決するのが適切なのか?を導き出すフレームワークです。
http://www.i-i-b.jp/blog/2903/logictree/

MECE

MECE(ミーシー、またはミッシー)は「Mutually Exclusive and Collectively Exhaustive」の略で、直訳すると「お互いに重複せず、全体に漏れがない」となります。
https://ferret-plus.com/4387

あえてスタンスを取る

CVが下がったという問題を、UUが下がったもしくはCVRが下がったという問題に分解しました。この原因となる仮説をさらに掘っていきたいところですが、ここでとても大切なことは、「あえてスタンスをとる」ということだと思っています。何を言いたいかというと、

  • 絶対これが原因でこの問題が起こっているんだと断言できてしまうレベルまで仮説を具体的にする
  • 分析をして根拠を出せばそのままレポートになってしまう

つまり、なんとなくで仮説をだすのではなく、一種の確信みたいなものが持てるくらい深いレベルの仮説に仕上げる必要があります。実際やって見るとかなりキツイのですが、あえてスタンスを取りに行かないと分析が曖昧になったり、分析が意味のないものになりがちです。

Screen Shot 2018-05-15 at 10.55.42.png

もはや、「きっとこの4つの原因のどれか数個が影響してメインページからのCVが落ちたんだろうな」というレベルまで落とし込んでしまいます。

分析する

あえてスタンスをとった仮説を出せたらあとはそれをデータを用いて検証していくだけです。あえてスタンスを取ったため分析が大変楽で簡潔なものになっていると思います。

  • 検索ボリュームの大きいキーワードのSEO順位が下がったから
    • 先月と今月で狙っているキーワードのSEOの順位を比較して見る
  • 先月トップページからこのページへの導線を変えたから
    • 先月と今月でトップページからこのページへの流入数・割合を比較して見る
  • 先月CVボタンの色を変えたから
    • 色を変えたボタン経由のCVRを比較して見る
  • 先月サイドバーにあったCVポイントをヘッダーに移したから
    • 先月と今月でページ内のCVポイントごとのCVRを比較して見る

あえてスタンスを取って「これが原因だ!!」と宣言してみたからこそ、見るべき指標は4つまで絞れています。そしてそれぞれの分析はとても簡単なものです。
もし、分析をした結果が満足のいくものではなかったら、その分析結果を示唆としてまた仮説を立て直してみてください。

アウトプットから考える

データ分析においては、ボトムアップにデータから何が導けるか...と考えがちですが、大切なのはトップダウンに進めること、これを「仮説を立ててあえてスタンスをとる」と表現しています。ゴールをシャープにすることで、見るべきデータをグッと絞り込むことが大切です。

イシューから始めよ

「イシューから始めよ」という本がこれらの考え方をとてもわかりやすく説明しています。


Screen Shot 2018-05-15 at 11.55.26.png

また、圧倒的に生産性の高い人(サイエンティスト)の研究スタイルという、この本のベースとなった記事もとてもわかりやすいです。

これらの考え方はデータ分析に限らず、とても汎用的かつ強力なものだと思います。

まとめ

この1ヶ月データ分析に取り組む中で、「仮説を立てろ」「スタンスをとれ」と言われ続けていました。すぐにデータに飛びついてしまいたくなる気持ちを抑えて、苦しいけれどあえてスタンスをとるような仮説を構築することで、分析がスムーズに進むことを感じました。

また3ヶ月、半年という節目で気づいたことをアウトプットしていきたいと思います。

ぜひブログもみてください!
筋肉をこよなく愛するエンジニアのブログ