未観測共通変数を回帰式に含めないことにより発生するバイアス=OVB
因果効果推定時に結果変数に影響する必要な変数を回帰式に入れなかった場合、OVB(Omitted Variables Bias,脱落変数バイアス)が発生する。
例えば、教育年数と年収の関係を考えるときに、その2つの変数に影響する能力という交絡変数が存在するが、この交絡変数は観測することができないため、推定結果にバイアスが生じてしまう。このような時に下図のZのような変数を用意することでバイアスをコントロールして推定することができる。この時Zを操作変数と呼ぶ。この操作変数を見つけるのは非常に難しく、操作変数法の鬼門は如何にして操作変数を見つけるかにある。
操作変数法(またはinstrumental variable method, IV法)とは
操作変数を用いてバイアスをの影響を取り除きながら、因果効果を推定する手法のこと。
操作変数法で推定する$\beta_{iv}$を数式で表現する。Yが目的変数、Dが介入変数、Aが共変量
真のモデル: Y_i = \alpha + \beta * D_i + \gamma * A_i +
\varepsilon とする\\
\beta_{iv} = \frac{Cov(Y,Z)}{Cov(D,Z)} \\
= \frac{Cov(\alpha + \beta * D_i + \gamma * A_i +
\varepsilon,Z)}{Cov(D,Z)} \\
= \frac{1}{Conv(D,Z)}[\beta * Cov(D,Z) + \gamma * Cov(A,Z) + Cov(\varepsilon, Z)]
ここで下記の操作変数の仮定である除外制約より$Cov(A,Z)=0かつCov(\varepsilon, Z)=0$となり、操作変数と介入変数には相関があるので、$Cov(D,Z)\neq0$となり$\beta_{iv} = \beta $となる。
また$\beta_{iv}$は2つの回帰式で求められた回帰係数の比でも表現できる。
Yが目的変数。Zが操作変数。Dが介入変数。
\beta_{iv} = \frac{Cov(Y,Z)}{Cov(D,Z)} \\
= \frac{\frac{Cov(Y,Z)}{Var(Z)}}{\frac{Cov(D,Z)}{Var(Z)}} \\
= \frac{\rho}{\Phi}
$\Phiと\rho$は下記の2つの回帰式から求めることができる。
1段目: D_i = \alpha_1 + \Phi * Z_i + e_{1i} \\
誘導型: Y_i = \alpha_0 + \rho * Z_i + e_{0i}
注意点として、2段階回帰式と操作変数法は異なっているである。ただし、操作変数の数と説明変数の数が一致しているとき、2つ回帰方法が推定する$\beta$は一致する。詳しくは下記スライドを参照。2段階回帰の式は下記。
操作変数法と2段階回帰分析の関係は、操作変数法が2段階回帰分析をベースにしている点にある。すなわち、操作変数法は、2段階回帰分析を用いて因果関係を推定する手法の一つ。
1段階目:D_i = \alpha_i + \Phi * Z_i + e_{1i} \\
2段階目:Y_i = \alpha_0 + \beta_{2段階回帰} * \hat{D_i} + e_{0i}
以上により、操作変数法によりOVBを避けて因果効果を推定できる
操作変数法の幾何学的イメージ
上記の2つの回帰式を幾何学的イメージに落とし込む。前提として、まずデータ数が3つの時の重回帰式が推定している幾何学的イメージについては十分知っているものとする。勉強になるので下記参照。
バイアスがある回帰の画像は下。誤差項uと説明変数xに相関がある場合=バイアスが生じており、右下の図のようにxとuが直交していない。操作変数法はそこに一手間加える。
操作変数により、バイアスを減らした回帰式の画像は下図。誤差項uとx(x,$\beta$)に直交するような新たな変数を用意する。この図から下に記述した仮定を説明することもできる。
より引用
操作変数法の仮定3つ
①操作変数Zは処置Dと関連する(強い相関がある)
相関の検定で確認可能。
②除外制約(唯一経路)
Zは処置Dを通してのみ、Yに影響する。バックドアパスもない。数字で証明することはできないので、論理を尽くして説明する必要がある。
③単調性がある。
Zが増加するとDも増加し、Zが減少するとDも減少する。またはZの値に関わらず、Zは常に0か1の時も単調性を満たす。
以上の3つの条件の時推定できる効果はLATE(一部のサンプルの因果効果という意味)。下記の追加条件2つを満たすとき、操作変数法で平均因果効果を推定できる。
④全個体がcomplierという仮定。
⑤処置効果が個体によらず一定であること。
参考文献