はじめに
東北大学/株式会社Nospareの石原です.今回は,計量経済学などで研究されている Difference-in-Differences 推定(DID 推定,または,差の差推定)について紹介します.DID 推定とは,パネルデータ等が利用できるときに因果効果を求めるためによく用いられている推定方法です.本記事では,DID 推定に必要な仮定やその解釈について解説します.
問題の設定
2期間 ($t=0,1$) のパネルデータが利用可能であり,$t$ 期の処置を受けたときに実現するであろう潜在的な目的変数を $Y_{it}(1)$,処置を受けなかったときに実現するであろう潜在的な目的変数を $Y_{it}(0)$ と表記します.また,観察個体は二つのグループ ($D_i=0, 1$) に分けられており,$D_i=1$ のグループ(処置群)は 0 期と 1 期の間にプログラム介入を受けるという状況を考えます.一方で,$D_i=0$ のグループ(対照群)はプログラム介入の影響を受けないとします.このとき,観測できる結果変数 $Y_{it}$ は次のように書くことができます:
\begin{align}
Y_{i0} &= Y_{i0}(0) \\
Y_{i1} &= D_i Y_{i1}(1) + (1-D_i) Y_{i1}(0)
\end{align}
つまり,$t=0$ では,どの観察個体もプログラム介入を受けておらず,$t=1$ で処置群のみプログラム介入の影響を受けるという状況です.
このような設定が成り立つ例としては,次のような状況が考えられます.ある大学には A と B という2つの学部が存在し,学部 A にだけ2年生の夏休みの語学研修が義務付けられたとします.また,学生 $i$ の1年生後期の英語の点数を $Y_{i0}$,2年生後期の英語の点数を $Y_{i1}$ とします.このとき,1年生後期の時点では,すべての学生が語学研修を受けていないので,$Y_{i0} = Y_{i0}(0)$ となります.一方,2年生後期の時点では,学部 A に属している ($D_i=1$) 学生は $Y_{i1}=Y_{i1}(1)$ となり,学部 B に属している ($D_i=0$) 学生は $Y_{i1}=Y_{i1}(0)$ となります.このように,介入を受けるグループと受けないグループの介入前後のデータがあるときに DID 推定を行うことができます.
DID 推定量
処置群と対照群の $1$ 期の結果変数を比較すると,次のような式を得ることができます:
\begin{align}
E[Y_{i1}|D_i=1] - E[Y_{i1}|D_i=0] &= E[Y_{i1}(1)|D_i=1] - E[Y_{i1}(0)|D_i=0] \\
&= \underbrace{E[Y_{i1}(1)-Y_{i1}(0)|D_i=1]}_{\text{ATT}} \\
& \hspace{0.5in} + \underbrace{E[Y_{i1}(0)|D_i=1]- E[Y_{i1}(0)|D_i=0]}_{\text{セレクションバイアス}}
\end{align}
ここで,$E[Y_{i1}(1)-Y_{i1}(0)|D_i=1]$ は average treatment effect on the treated (ATT) と呼ばれており,処置群に対するプログラム介入の因果効果と解釈することができます.一方,$E[Y_{i1}(0)|D_i=1]- E[Y_{i1}(0)|D_i=0]$ はセレクションバイアスと呼ばれており,セレクションバイアスが 0 でない限り $E[Y_{i1}|D_i=1] - E[Y_{i1}|D_i=0] = \text{ATT}$ とならないことが分かります.つまり,セレクションバイアスが存在する場合,処置群と対照群の $1$ 期の結果変数を比較しても介入の因果効果 (ATT) を識別できないことが分かります.語学研修の例では,もし語学研修がなかったとしても学部 A と B の学生の2年生後期の英語の学力に差があるなら,セレクションバイアスは 0 にならないと考えられます.したがって,学部 A と B の学生の英語の学力に差があるなら,処置群と対照群の $1$ 期の結果変数を比較しても因果効果を推定することはできません.
もしセレクションバイアスの値を知ることができれば,$E[Y_{i1}|D_i=1] - E[Y_{i1}|D_i=0]$ からセレクションバイアスの値を引くことで ATT を識別することができます.問題の設定から処置群の $Y_{i1}(0)$ は観測できないので,$E[Y_{i1}(0)|D_i=1]$ を直接求めることはできません.したがって,セレクションバイアスの値を直接求めることはできません.しかし,0 期には処置群も対照群も介入の影響を受けていないので,$E[Y_{i0}(0)|D_i=1] - E[Y_{i0}(0)|D_i=0]$ は求めることができます.実際に,
E[Y_{i0}|D_i=1] - E[Y_{i0}|D_i=0] \ = \ E[Y_{i0}(0)|D_i=1] - E[Y_{i0}(0)|D_i=0]
が成り立ちます.以上から,もし $E[Y_{i1}(0)|D_i=1]- E[Y_{i1}(0)|D_i=0]$ が $E[Y_{i0}(0)|D_i=1] - E[Y_{i0}(0)|D_i=0]$ と等しいのなら,$E[Y_{i1}|D_i=1] - E[Y_{i1}|D_i=0]$ から $E[Y_{i0}|D_i=1] - E[Y_{i0}|D_i=0]$ を引くことで ATT を識別することができます.
上で紹介したアイデアから,次のような推定量を得ることができます:
\begin{align}
\widehat{\text{ATT}} &= \left( \overline{Y}_{T,1} - \overline{Y}_{C,1} \right) - \left( \overline{Y}_{T,0} - \overline{Y}_{C,0} \right) \\
&= \left( \overline{Y}_{T,1} - \overline{Y}_{T,0} \right) - \left( \overline{Y}_{C,1} - \overline{Y}_{C,0} \right) \hspace{0.4in} (1)
\end{align}
ここで,$\overline{Y}_{T,1}$ は処置群の $Y_{it}$ の標本平均であり,$\overline{Y}_{C,t}$ は対照群の $Y_{it}$ の標本平均です.この推定量は Difference-in-Differences 推定量(DID 推定量,または,差の差推定量)と呼ばれています.
平行トレンドの仮定
処置群と対照群のサンプルサイズが大きくなれば,DID 推定量は
\left( E[Y_{i1}|D_i=1] - E[Y_{i1}|D_i=0] \right) - \left( E[Y_{i0}|D_i=1] - E[Y_{i0}|D_i=0] \right)
に確率収束します.したがって,上で議論したように,もし
E[Y_{i1}(0)|D_i=1] - E[Y_{i1}(0)|D_i=0] = E[Y_{i0}(0)|D_i=1] - E[Y_{i0}(0)|D_i=0] \hspace{0.4in} (2)
が成り立つなら,(1) の DID 推定量は ATT の一致推定量となることが分かります.また,(2) 式を変形することで,次の式を得ることができます:
E[Y_{i1}(0) - Y_{i0}(0)|D_i=1] = E[Y_{i1}(0)-Y_{i0}(0)|D_i=0] \hspace{0.4in} (3)
つまり,(3) が成り立つときに DID 推定量が正当化されることが分かります.(3) の仮定は,処置群と対照群でプログラム介入がなかったときの潜在的な結果変数のトレンドが等しいことを意味しており,平行トレンドの仮定 (parallel trend assumption) と呼ばれています.
下の図は平行トレンドの仮定による ATT の識別方法のイメージです.平行トレンドの仮定の下では,もし介入がなかったとしたら,処置群の結果変数はオレンジの点線のように青色の実線(対照群のトレンド)と平行に変化すると考えられます.ここで,$E[Y_{i1}|D_i=1]=E[Y_{i1}(1)|D_i=1]$ なので,$t=1$ でのオレンジ色の実線と点線の差が ATT となります.したがって,処置群の変化(オレンジ色の実線の変化)と対照群の変化(青色の実線の変化)の差が ATT となることが分かります.
語学研修の例では,$E[Y_{i1}(0) - Y_{i0}(0)|D_i=1]$ は学部 A の学生の語学研修がなかったときの平均点の伸び幅となります.つまり,平行トレンドの仮定は,もし学部 A の学生も語学研修が義務付けられていなかったら,学部 A の学生の平均点は学部 B の伸び幅と同じだけ増加するということを意味しています.一方で,平行トレンドの仮定は,学部 A と学部 B の点数の水準が異なることを許しています.つまり,学部 A と学部 B の語学研修がなかったときの平均点の伸び幅が同じであれば,学部 A の方が学部 B より英語が得意な学生が多くても平行トレンドの仮定は成り立ちます.したがって,入学時の英語の成績には差があっても,語学研修以外の学部 A と学部 B の英語のカリキュラムが同じであれば平行トレンドの仮定は成り立つかもしれません.
平行トレンドの仮定は直接確認することができないことに注意する必要があります.上で議論したように,処置群の $Y_{i1}(0)$ は観測できないので,(3) が成り立つかどうかをデータから直接確認することはできません.ただし,$t=0$ 以前のデータがあれば平行トレンドの仮定が成り立っていそうかどうかを間接的に確認することができます.実際に,多くの実証研究では,プログラム介入以前 ($t \leq 0$) のデータで処置群と対照群のトレンドが同じかどうかを検定することで平行トレンドの仮定を間接的に検定しています.この方法で厳密に (3) の平行トレンドの仮定を検証できるわけではありませんが,プログラム介入以前のデータで平行トレンドの仮定が成り立っていれば, (3) が成り立つという主張も説得力があると考えられます.
最後に
今回は,DID 推定に必要な仮定やその解釈について解説しました.今回は共変量がなく 2 期間のデータしかない非常にシンプルなケースの DID 推定を紹介しましたが,実際の実証分析では共変量や 3 期間以上のデータがある場合もあります.そのような状況での分析についても様々な推定方法が提案されています.また,以前の記事で紹介した Changes-in-Changes モデルのように,平行トレンドの仮定を拡張したモデルも提案されています.DID 推定は計量経済学では非常に有名な手法であり,"Mostly Harmless Econometrics" などの多くのテキストで紹介されているので,より詳しく知りたい方はテキストやサーベイ論文などを読んでみてください.
株式会社Nospareでは統計学の様々な分野を専門とする研究者が所属しております.統計アドバイザリーやビジネスデータの分析につきましては株式会社Nospareまでお問い合わせください.