はじめに
東北大学/株式会社Nospareの石原です.今回は,共変量を用いた平均処置効果 (average treatment effect; ATE) の推定方法について紹介します.本記事では,条件付き独立の仮定 (conditional independence assumption) の下で ATE が識別できることを示し,その識別方法に基づいた regression adjustment という推定方法を紹介します.
反実仮想フレームワーク
処置を受けたときに実現するであろう潜在的な結果変数を $Y_{i}(1)$,処置を受けなかったときに実現するであろう潜在的な結果変数を $Y_{i}(0)$ と表記し,$D_i$ を処置を受けたかどうかを表すダミー変数とします.このとき,観測できる結果変数 $Y_i$ は
Y_i = D_i Y_i(1) + (1-D_i) Y_i(0)
と書くことができます.このとき,$Y_i(1)-Y_i(0)$ は処置による結果変数への影響であると考えられるので,$\tau_{\text{ATE}} = E[Y_i(1)-Y_i(0)]$ は平均処置効果 (ATE) と呼ばれます.
処置 $D_i$ と潜在的な結果変数 $Y_i(0), Y_i(1)$ が次の条件を満たすとき,ATE が識別できることが知られています:
\newcommand{\indep}{\perp\hspace{-1em}\perp} D_i \ \indep \ (Y_i(0), Y_i(1))
実際,この独立性が成り立つとき,
\begin{align}
E[Y_i|D_i=1] - E[Y_i|D_i=0] &= E[Y_i(1)|D_i=1] - E[Y_i(0)|D_i=0] \\
&= E[Y_i(1)] - E[Y_i(0)] = \tau_{\text{ATE}}
\end{align}
となります.したがって,$D_i$ が $Y_i(0), Y_i(1)$ と独立なら,$E[Y_i|D_i=1] - E[Y_i|D_i=0]$ を推定することで ATE を推定することができます.
このような仮定が成り立つ例として,ランダム化比較実験があります.ランダム化比較実験では処置が無作為に割り当てられており,$D_i$ と $Y_i(0), Y_i(1)$ は独立になります.一方で,実験以外で集められたデータではこの独立性の仮定は現実的ではありません.潜在的な結果変数は個人の属性等の様々な要因の影響を受けており,処置を受けるかどうかという決定も同様に個人の属性等の影響を受けているからです.以降では,この仮定の代わりに,観測できる共変量で条件付けた下で $D_i$ と $Y_i(0), Y_i(1)$ が独立になるという仮定を用いて ATE を推定する方法を紹介します.
共変量の仮定
観測できる共変量を $X_i$ とします.$X_i$ には観測できる個人の属性等の変数が含まれていると考えることができます.このとき,次の仮定を条件付き独立の仮定といいます:
\newcommand{\indep}{\perp\hspace{-1em}\perp} D_i \ \indep \ (Y_i(0), Y_i(1)) \ | \ X_i \hspace{1in} (1)
この仮定は,観測できる共変量 $X_i$ で条件付ければ,処置 $D_i$ と潜在的な結果変数 $Y_i(0), Y_i(1)$ は独立になるということを意味しています.また,(1) の仮定は unconfoundedness や ignorability と呼ばれることもあります.
条件付き独立の仮定は,処置が無作為に割り当てられているという仮定よりは現実的な仮定となっています.処置と潜在的な結果変数の両方の決定要因となりうる変数が $X_i$ に含まれていれば,実験以外で集められたデータに対しても (1) が成り立つことが期待されます.一方で,処置と潜在的な結果変数の両方の決定要因となる重要な変数が観測できない場合には,この仮定も満たされない可能性があります.
条件付き独立の仮定に加えて,次の仮定も必要になります:
0 < P(D_i=1|X_i) < 1 \hspace{1in} (2)
この仮定をオーバーラップの仮定といいます.この仮定がない場合,共変量がある特定の値を取るグループですべての個人が $D_i=1$(または,$D_i=0$)となる可能性があります.この後の議論で,このような場合には ATE が識別できないことが確認できます.
Regression adjustment 法
条件付き独立の仮定とオーバーラップの仮定の下で ATE が識別できることを示し,その識別方法に基づいた推定方法を紹介します.条件付き独立の仮定から,
\begin{align}
& E[Y_i|D_i=1, X_i=x] - E[Y_i|D_i=0, X_i=x] \\
=& E[Y_i(1)|D_i=1, X_i=x] - E[Y_i(0)|D_i=0, X_i=x] \\
=& E[Y_i(1)|X_i=x] - E[Y_i(0)|X_i=x] = \tau_{\text{ATE}}(x)
\end{align}
が成り立ちます.ここで,$\tau_{\text{ATE}}(x) = E[Y_i(1)-Y_i(0)|X_i=x]$ としています.したがって,条件付き独立の仮定から,$X_i=x$ で条件付けた平均処置効果 $\tau_{\text{ATE}}(x)$ が識別できることが分かります.どんな $x$ の値に対しても $\tau_{\text{ATE}}(x)$ が識別できるためには,$X_i=x$ を満たすグループの中に 処置を受ける人 ($D_i=1$) と処置を受けない人 ($D_i=0$) のどちらも存在しなければなりません.したがって,どんな $x$ の値に対しても $\tau_{\text{ATE}}(x)$ が識別できるためにはオーバーラップの仮定が必要となります.すべての $x$ に対して $\tau_{\text{ATE}}(x)$ が識別できれば,繰り返し期待値の法則から
E[\tau_{\text{ATE}}(X_i)] = E[ E[Y_i(1)-Y_i(0)|X_i]] = E[Y_i(1)-Y_i(0)] = \tau_{\text{ATE}}
となります.以上から,条件付き独立の仮定とオーバーラップの仮定の下で ATE が識別できることが確認できました.
上で紹介した識別方法に基づく推定方法は regression adjustment 法と呼ばれています.regression adjustment 法では,次のような手順で推定量を求めます:
- パラメトリックまたはノンパラメトリックな手法で $m_d(x)=E[Y_i|D_i=d,X_i=x]$ の推定量 $\hat{m}_d(x)$ を構成する.
- 手順 1 で求めた $\hat{m}_0(x)$ と $\hat{m}_1(x)$ を用いて,$\tau_{\text{ATE}}(x)$ の推定量 $\hat{\tau}_{\text{ATE}}(x)$ を構成する.
- $\hat{\tau}_{reg} = \frac{1}{n} \sum_{i=1}^n \hat{\tau}_{\text{ATE}}(X_i)$ を用いて ATE を推定する.
このようにして得られる推定量 $\hat{\tau}_{reg}$ が regression adjustment 推定量です.手順 1 の $\hat{m}_0(x)$ と $\hat{m}_1(x)$ を求める最も簡単な方法は線形回帰モデルを用いることです.つまり,$D_i=0$ と $D_i=1$ のそれぞれのグループに対して
\begin{align}
Y_i &= \alpha_0 + \beta_0' X_i + \epsilon_{0i}, \hspace{0.3in} \text{$D_i=0$ の場合}\\
Y_i &= \alpha_1 + \beta_1' X_i + \epsilon_{1i}, \hspace{0.3in} \text{$D_i=1$ の場合}
\end{align}
というモデルを仮定して $m_0(x)$ と $m_1(x)$ を推定するという方法です.$\hat{\alpha}_0, \hat{\alpha}_1, \hat{\beta}_0, \hat{\beta}_1$ をこのモデルの係数の推定量とすると,
\hat{\tau}_{reg} = (\hat{\alpha}_1-\hat{\alpha}_0) + (\hat{\beta}_1-\hat{\beta}_0)' \bar{X}
となります.この推定量は,$Y_i$ を定数項,$D_i$,$(X_i-\bar{X})$,$D_i (X_i-\bar{X})$ に回帰したときの $D_i$ の係数の推定量に一致します.この方法はシンプルで実行するのも簡単ですが,条件付き期待値 $m_0(x)$ と $m_1(x)$ が線形でない場合には上手くいきません.regression adjustment 推定量では,$m_0(x)$ と $m_1(x)$ を上手く推定できるかどうかが重要となります.
カーネル法などのノンパラメトリックな方法で $m_0(x)$ と $m_1(x)$ を推定する場合,パラメトリックな推定方法と異なり,条件付き期待値関数の特定化の失敗はありません.しかし,(1) の仮定を満たすためには多くの共変量を用いる必要があるので,カーネル法などの通常のノンパラメトリックな手法では上手く推定できない場合もあります.
最後に
今回は,条件付き独立の仮定の下での平均処置効果の推定方法として regression adjustment 法を紹介しましたが,regression adjustment 法以外にも様々な推定方法が提案されています.次回は,傾向スコアという値を用いた平均処置効果の推定方法等を紹介したいと思います.
株式会社Nospareでは統計学の様々な分野を専門とする研究者が所属しております.統計アドバイザリーやビジネスデータの分析につきましては株式会社Nospareまでお問い合わせください.