- 因果推論:因果推論とは何か?予測と因果の違いについて
- 因果推論とは何か?
- 予測とは何か
- 因果とは何か
- なぜ因果推論は難しいのか
- 交絡という問題
- 因果推論の核心
- まとめ
因果推論:因果推論とは何か?予測と因果の違いについて
今回は因果推論とは何かについて考えてみたいと思います。
所要時間は20分ほどとなっています。
それでは、さっそく始めていきましょう!
因果推論とは何か?
データサイエンスを学んでいると、
- 「売上予測」
- 「需要予測」
- 「離脱予測」
など、“予測” の話題は非常に多く登場します。
一方で実務では、しばしば次のような問いが現れます。
- 広告を打ったら売上は本当に増えたのか?
- クーポン配布は再来店率を改善したのか?
これらは単なる予測ではありません。「因果」の問いです。
この記事では、因果推論の最初の入口として、
- 予測と因果の違い
- なぜ観察データだけでは因果が難しいのか
を整理します。
予測とは何か
予測とは、
観測された情報Xから、未知のYを当てること
です。
例えば:
- 過去売上から来月売上を予測する
- 顧客属性から離脱を予測する
- 在庫数から欠品リスクを予測する
などです。
ここで重要なのは、
「当てること」
が目的である点です。
予測モデルでは、
- RMSE
- MAE
- AUC
などの精度が重要になります。
因果とは何か
一方、因果は違います。
因果とは、
Xに介入したとき、Yがどう変化するかを推定すること
です。
例えば:
- 広告費を増やしたら売上はどう変わるか
- アプリ導入で利益は改善するか
- クーポン配布で来店頻度は増えるか
などです。
ここで重要なのは、
「変えたらどうなるか」
を考えている点です。
つまり因果推論は、
未来を当てる技術
ではなく、
介入効果を推定する技術
です。
なぜ因果推論は難しいのか
ここからが重要です。
因果推論が難しい理由は、
「比較対象が公平ではない」
ことです。
例えば、
| 店舗 | アプリ導入 | 棚卸評価損 |
|---|---|---|
| A | 導入 | 小さい |
| B | 未導入 | 大きい |
という結果だったとします。
これだけ見ると、
アプリ導入で改善した
と言いたくなります。
しかし、本当にそうでしょうか?
交絡という問題
例えば、
- 優秀な店舗だけ先に導入された
- データ活用文化が強い店舗だけ導入された
- 元々在庫管理が上手い店舗だった
可能性があります。
すると実際には、
優秀店舗 → アプリ導入優秀店舗 → 利益改善
だっただけかもしれません。
このように、
XにもYにも影響する第三の変数
を 交絡因子(confounder) と呼びます。
因果推論の核心
因果推論の本質は、
「介入以外の条件が同じ世界を比較したい」
という点にあります。
本当は、
同じ店舗
について、
- アプリ導入した世界
- アプリ導入しなかった世界
の両方を観測できれば理想です。
しかし現実には不可能です。
同じ店舗は、どちらか片方しか観測できません。
そのため因果推論では、
「どれだけ公平な比較対象を作れるか」
が重要になります。
まとめ
この記事で最も重要なのは次の2点です。
1. 予測と因果は違う
- 予測 = 当てる
- 因果 = 変えたらどうなるか
です。
2. 因果推論は「公平な比較」を作る学問
因果推論が難しいのは、
「導入群」と「未導入群」が最初から違う
からです。
つまり因果推論とは、
“比較可能な世界をどう作るか”
を考える学問と言えます。