はじめに
因果推論を行う上で共変量を考慮するべきか否かに関するメモ書きです。
アウトカム、処置、共変量3つの組み合わせの中で、一番シンプルな例を挙げてまとめてみました。
本題
以下、
- $Y$: アウトカム
- $T$: 処置
- $X$: 共変量
とします。
$T$から$Y$への処置効果を考えたい場合、以下の4通りの関係が考えられます。
(a)は、そもそも$X$の影響を受けていないので、考慮するべき共変量は存在しません。(ランダム割り付けがなされている状態)
(b)は、1番厄介で「交絡」が生じている場合です。この場合は共変量を無視して推測しようとすると、処置効果の推定にバイアスが生じてしまいます。したがって、共変量を調整する必要があります。(調整方法については、いつか別途まとめる予定です)
(c)は、効果の修飾(modification)があると言い、$X$をmodifierと呼びます。この場合、共変量を考慮しなくても処置効果をバイアスなく推定することはできますが、共変量を考慮した方が推測の効率が上がります。そのため、可能であれば共変量を取り込むことが推奨されます。
(d)は、$X$を無視して$Y$の分布のみによって推測を行なっても結果は変わらないため、特に共変量を考慮する必要はありません。
まとめると、「共変量を考慮するか否か」という問いに対する結論は以下の通りになります。
おわりに
最後まで読んでいただきありがとうございました。
zennにて「Python×データ分析」をメインテーマに記事を執筆しているので、ご一読いただけますと幸いです。
また、過去にLTや勉強会で発表した資料が下記リンクにてまとめてありますので、こちらもぜひご一読くださいませ。
参考文献
- 岩崎(2015)「統計的因果推論」朝倉書店
- 星野(2009)「調査観察データの統計科学」岩波書店