操作変数について
操作変数の識別戦略をDAGで確認
DとYの間にバックドアパス D ← U → Y が存在
さらに、Uは観測されない変数のためバックドアパスが開いたままとなる。
データがないから諦める前に、パスを通じてVがどのように作用しているか確認
唯一経路
VはDを通してのみYに影響を与えることが出来ることを唯一経路という。
Vが変化するとき、Dが変化して、それがYの変化を引き起こす。
(Vが変化した時にYが変化しても、それはDが変化していると解釈)
VはDを除いてYを決める変数とは独立であることを仮定している「除外制約」
変数Dにおいて、一部の人だけがVの影響を受けて行動を変えたと仮定すると、
VがYの変化を引き起こしているのは、母集団の一部となる。
例えば、操作変数Vが女性の行動だけを変えるのであれば、DのYに対する因果効果は、
男性だけじゃなく女性の選択の因果効果だけを反映している。
強調ポイント
- もし、男性と女性ではYに与える影響が異なるのであれば、VにおけるショックはDのYに対する因果効果の一部を識別しただけに過ぎない。
- Vのショックで変化した人の因果効果なので、全体の一部を見ているということ
操作変数の良し悪しは、どうすればわかるのか
- 事前知識を持つことが重要
事前知識をDAGに書き出して、分析デザインの実現可能性を考える
「除外制約」は検証不可能な仮説なので、理論的に主張できる場合にのみ考える。
理論的な議論が苦手な人は操作変数を使うことを避ける傾向にある。
均質な処置効果
操作変数デザインについて、処置が誰に対しても同じ因果効果を持つ場合で説明
(大学卒業が自分の賃金を10%増加させるなら、同様に大学卒業者の賃金を10%あげることを意味する)
教育年数の収入に対する因果効果に興味があるものとする。
教育年数が未観測な能力によって内生的
このDAGは単純な回帰で表現することが可能
収入の真のモデル
Y_i = \alpha + \delta S_i + \gamma A _i + \epsilon_i
- $Y$ : 収入の対数
- $\delta$ : 均質な処置効果
- $S$ : 教育年数
- $A$ : 個人の能力(未観測な効果)
- $\epsilon$ : 誤差項
欠落しているデータが存在しているので、以下の式となる
Y_i = \alpha + \delta S_i + \eta_i
- $\eta$ : 誤差項
最小二乗法から$\delta$の推定値は
\begin{align}
\hat{\delta} = \frac{C(Y,S)}{V(S)} &= \frac{E[YS]-E[Y]E[S]}{V(S)} \\
&= \frac{E[\alpha + S + S^2\delta + \gamma SA + \epsilon S] - E(S)E[\alpha+\delta S + \gamma A + \epsilon]}{V(S)} \\
&= \frac{\delta E(S^2)-\delta E(S)^2 + \gamma E(AS) - \gamma E(S)E(A) + E(\epsilon S) - E(S)E(\epsilon)}{V(S)}\\
&= \delta + \gamma \frac{C(AS)}{V(S)}
\end{align}
教育年数の係数$\hat{\delta}$は上向きのバイアスがかかっていることになる。
教育年数を増減させるが、学生の能力や構造誤差とは独立している操作変数$Z_i$を見つけたとする
この変数を使って$\delta$を推定することが可能
YとZの共分散を求める
\begin{align}
C(Y,Z) &= C(\alpha + \delta S + \gamma A + \epsilon , Z) \\
&= E[(\alpha + \delta S + \gamma A + \epsilon)Z] + E(Y)E(Z) \\
&= \delta C(S,Z) + \gamma C(A,Z) + C(\epsilon,Z)
\end{align}
右側にある$\delta$を切り出すと、以下の式のように推定可能
$\hat{\delta} = \frac{C(Y,Z)}{C(S,Z)}$
※$C(A,Z)=0$かつ$C(\epsilon,Z)=0$である場合に限る
2段階最小二乗法
操作変数推定量の一つに2段階最小二乗法がある
独立変数と誤差項が相関している場合、通常の最小二乗法(Ordinary Least Squares, OLS)ではバイアスのある推定量が得られてしまうため、この問題を解決するために操作変数推定法が用いられる
【式変換が長いので教科書で】