データ分析する前に考えたいこと
ここ最近ちょっと忙しく、半年ぶりの投稿です。
そして、コードではなくデータ分析する前に考えたいこと、というテーマです。
(Qiita的に良いのかな、、、)
仕事柄何かと「分析できませんか?」と言われることが多いのですが、データ分析や統計モデルは何も魔法ではないので、データがないと何も出来ないし、データが有ってもアプローチが悪い場合には、結果をミスリードする可能性が高いんですね。
衝動買される商品の広告効果
例えば、「広告の効果でどれだけ売上が上がったか知りたいです!」というお題の場合、
「なぜ広告打つ → 売上が上がる」となるのかがすごく大事です。
例えば、コカ・コーラやいろはすの新味などは衝動買いも多い商材なので、
「広告接触によって、認知が高まり、購買につながる」ということは十二分に考えられます。広告接触から購入までのタイムラグもそんなになさそうです。
なので、この場合は「広告効果=売上」としても何かしら良い結果は出せそうです。
在庫があるような商品の広告効果
一方、家に常に在庫があるような商品、マヨネーズやドレッシングの場合、
広告接触したからと言って、すぐに購入につながるとは考えにくです。
もちろん、マヨネーズが切れていて買わなきゃ!と思い出して買う人もいるかと思いますが、基本的には家にあるマヨネーズが消費され、すぐには購入に繋がらないのではないでしょうか?(もちろん、長いスパンで見ると広告接触によって、在庫買いや家庭のマヨネーズの消費が刺激され、購入につながると思います。しかし週次や月次ではなかなか見えなさそう、という意図です)
なので、この場合は単純に「広告効果=売上」とすると、「効果なし」という結論が出てしまいかねません。
そのため、「広告接触によって消費者がどんな行動をするのか?それはそのくらいの期間で起こるのか?」というのをよく詰めないと、誤ったアプローチになりかねません。
マヨネーズの広告の効果とは?
また、「CMを見て、消費者はマヨネーズを使った料理を作る。広告の効果は使用の刺激」と考えている場合、「CMの効果 = マヨネーズの使用量」で良いのでしょうか?
マヨネーズは「マヨネーズのCMを今日は3回見たし、マヨネーズたくさん使っちゃおう!!」という商材でもないので、おそらく使用量も少し遠い変数と言えます。
「CMを見る → マヨネーズを使った料理を作ろうと思う → ○人分を□日分作ろう」というフローが想定され、マヨネーズの使用量は作る量に大きな影響を受けるはずです。
今回の仮定の場合は、「CMの効果 = マヨネーズ使用料理を作る可能性の増加」が一番素直な効果量と言えそうです。
現実はそう簡単ではない
ここまで書きましたが、現実は「クライアントの要望」「データが取れない」等様々な要因があり、因果が遠そうな変数を用いざるを得ないことが多々あります。
ただ、前者に関しては上手く説得するスキルを身に着けたいものです。分析する側としても「クライアントのためになる(少なくともミスリードはしなそうな)分析」をしたいので、、