因果推論:DAGとは何か
「因果関係を図で表現する」
今回はDAGについて考えたいと思います。
所要時間は20分ほどとなっています。それでは、さっそく始めていきましょう!
DAGとは何か
DAGとは:
Directed Acyclic Graph
の略です。
日本語では:
有向非巡回グラフ
と呼ばれます。重要なのは、
「何が何へ影響するか」
を図で表現することです。
DAGの基本構造
DAGは、
- ノード(変数)
- 矢印(因果方向)
で構成されます。
例えば:
広告費 → 売上
なら、
広告費が売上へ因果的影響を与える
という意味です。
矢印は「相関」ではない
ここは非常に重要です。
DAGの矢印は、
相関がある
という意味ではありません。
矢印の意味
矢印は:
「原因側から結果側へ影響する」
という仮定です。
つまり:
広告費 → 売上
は、
広告費を変えると売上が変わる
という意味になります。
相関と因果は違う
例えば:
アイス売上 ↔ 溺水事故
には相関があります。
しかし:
アイス → 溺水
ではありません。
本当は:
気温 → アイス売上気温 → 溺水事故
です。
つまり:
- 相関がある
- 因果がある
は別問題なのです。
DAGは「世界の構造仮説」
ここも非常に重要です。
DAGは:
データから自動的に出てくる真実
ではありません。
DAGは、
「世界はこういう因果構造になっている」
という仮説です。
実務で考えるDAG
例えば、
需要予測アプリ導入で棚卸評価損は減るか?
を考えます。
単純には:
需要予測アプリ導入 → 棚卸評価損
です。
しかし現実には
例えば:
- 担当者のコスト削減意識
- DX文化
- 店舗運営能力
なども影響します。
例えば:
コスト削減意識 → アプリ導入コスト削減意識 → アプリ導入 → 棚卸評価損
という構造かもしれません。
この構造が意味することは、この場合
アプリ導入店舗の方が評価損が小さい
としても、
アプリ効果
だけではなく、
元々コスト削減意識が高い
影響も混ざる可能性があります。
これが:
交絡
です。
DAGの重要性
DAGを描くことで、
どこに交絡があるか
を可視化できます。
つまり、
「なぜ単純比較が危険なのか」
を図で考えられるようになります。
「Acyclic(非巡回)」とは何か
DAGの「非巡回」とは、
ぐるぐる循環しない
という意味です。
つまり:
A → B → C → A
のような循環は作りません。
なぜ非巡回なのか
因果推論では通常、
原因 → 結果
を一方向で考えます。
そのため、
未来が過去の原因になる
ような循環は避けます。
DAGは因果推論の地図
ここが今日の核心です。
DAGは、
「何を調整すべきか」
を考えるための地図になります。
まとめ
この記事で最も重要なのは次の3点です。
1 . DAGは因果構造を図で表現するもの
DAGでは:
| 要素 | 意味 |
|---|---|
| ノード | 変数 |
| 矢印 | 因果方向 |
を表します。
2 . 矢印は「相関」ではない
DAGの矢印は、
「原因から結果への影響」
を表しています。
つまり:
相関 ≠ 因果
です。
3 . DAGは「何を調整すべきか」を考える地図
DAGを描くことで、
交絡
を可視化できます。