因果推論:ATE・ATT・ATCとは何か?
「誰に対する効果なのか」を区別する
今回は、因果推論において非常に重要な、
- ATE
- ATT
- ATC
について整理します。
所要時間は20分ほどとなっています。それでは、さっそく始めていきましょう!
なぜ「誰に対する効果」が重要なのか
例えば次の問いを考えます。
要予測モデルは効果があるのか?
一見シンプルな問いですが、実はここには重要な曖昧さがあります。
それは、
誰に対する効果を知りたいのか
です。
例えば:
- 全店舗へ導入した場合の効果なのか
- 実際に導入した店舗への効果なのか
- 未導入店舗へ今後導入した場合の効果なのか
で、意味が変わります。
つまり因果推論では、
「効果」は1種類ではない
のです。
ATEとは何か
ATE(Average Treatment Effect)は、
全体集団に対する平均因果効果
です。
数式では: ATE = E [Y(1) − Y(0)]
と表されます。
ATEの意味
例えば:
「全店舗へ需要予測モデルを導入した場合、
全店舗で導入しなかった場合と比較して、
平均的にどれくらいコスト削減できるか」
を知りたい。これがATEです。
ここで重要なのは、
全体
を対象にしている点です。
ATTとは何か
ATT(Average Treatment Effect on the Treated)は、
実際に介入を受けた集団への平均効果
です。
数式では:ATT = E [Y(1)−Y(0) ∣ T=1]
です。
ATTの意味
例えば:
「実際に需要予測モデルを導入した店舗では、
導入しなかった場合と比較して、
どれくらいコスト削減できたか」
を知りたい。これがATTです。
ここで重要なのは、
実際に導入された店舗
を対象にしている点です。
ATEとATTは同じではない
ここは非常に重要です。
例えば:
| 店舗 | DXレベル |
|---|---|
| 導入店舗 | 高い |
| 未導入店舗 | 低い |
だったとします。
すると:
- 導入店舗はデータ活用能力が高い
- 現場運用が強い
- モデルを使いこなしやすい
可能性があります。
つまり、
導入店舗だけ効果が大きい
かもしれません。その結果例えば:
| 指標 | 効果 |
|---|---|
| ATT | +20% |
| ATE | +5% |
のようなことが普通に起きます。
つまり、
PoCでは成功した
からといって、
全店舗展開でも同じ効果
とは限らないのです。
ATCとは何か
ATC(Average Treatment Effect on the Controls)は、
まだ介入していない集団に、
もし介入したらどうなるか
を表します。
数式では:
ATC = E [ Y(1) − Y(0) ∣ T = 0 ]
です。
ATCの意味
例えば:
「未導入店舗へ需要予測モデルを導入した場合、
導入しなかった場合と比較して、
どれくらいコスト削減が期待できるか」
を知りたい。これがATCです。
なぜATCが重要なのか
例えば未導入店舗が:
- 小規模店舗
- 人員不足
- DX文化が弱い
場合、
既存導入店舗ほど効果が出ない
可能性があります。
つまり:
ATT ≠ ATC
が起きます。
因果効果は均一とは限らない
ここが今日の核心です。
因果推論では、
全員に同じ効果
を仮定しないことが重要です。
例えば広告でも:
| 顧客 | 広告効果 |
|---|---|
| 興味が強い顧客 | 大きい |
| 興味が弱い顧客 | 小さい |
| 既存ヘビーユーザー | ほぼゼロ |
などが普通にあります。
つまり:
「誰に効くのか」
を考える必要があります。
実務で非常に重要なポイント
実務では:
PoC店舗で大成功!
という報告があっても、
まず確認すべきは:
それはATEなのか?ATTなのか?
です。
PoC店舗だけ優秀だった可能性があるからです。
つまり:
「誰に対する効果か」
を明示しないと、因果効果の解釈は曖昧になります。
まとめ
この記事で最も重要なのは次の2点です。
1. 因果効果は1種類ではない
| 指標 | 意味 |
|---|---|
| ATE | 全体への平均効果 |
| ATT | 実際に介入した集団への効果 |
| ATC | 未介入集団へ介入した場合の効果 |
です。
2. 「誰に対する効果か」を明示する必要がある
因果推論では、
効果がある
だけでは不十分です。
重要なのは、
「誰に対して効果があるのか」
です。