8
5

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

操作変数法について(1)

Last updated at Posted at 2022-07-28

はじめに

東北大学/株式会社Nospareの石原です.計量経済学でよく用いられる操作変数法(instrumental variable method)という手法を2回に渡って紹介します.前半の本記事では,通常の線形回帰モデルに基づいて操作変数法を紹介します.後半では,反実仮想モデルに基づいて操作変数法の仮定や結果の解釈について紹介します.

線形回帰モデルに基づく操作変数法

次のような線形モデルを考えます:
$$ Y = \beta_0 + \beta_1 X + U $$
このとき,もし $Cov(X,U)=0$ が成り立つなら $Cov(X,Y)=\beta_1 Var(X)$ となるので,
$$ \beta_1 = \frac{Cov(X,Y)}{Var(X)} $$
となります.ここで,$Cov(X,Y) / Var(X)$ はOLS推定量の確率収束先なので,もし $Cov(X,U)=0$ が成り立つなら,OLS推定量を用いれば簡単に $\beta_1$ を一致推定することができます.しかし,$Cov(X,U)=0$ が成り立たない場合,一般的に $\beta_1$ を一致推定することはできません.このような問題に対処するために開発されたのが操作変数法と呼ばれる手法です.

操作変数法には次の2つの条件を満たす操作変数(instrumental variable)と呼ばれる追加の変数 $Z$ が必要となります:

Cov(Z,X) \neq 0 \hspace{1in} (1) \\
Cov(Z,U) = 0  \hspace{1in} (2)

(1) の条件は関連性(relevance)と呼ばれる条件で,操作変数 $Z$ が説明変数 $X$ と相関を持つことを仮定しています.(2) の条件は外生性(exogeneity)と呼ばれており,操作変数 $Z$ と誤差項 $U$ が相関しないことを仮定しています.これらの条件を満たす変数 $Z$ が存在すれば,$\beta_1$ を推定することができることが知られています.

具体的に,操作変数を用いてどのように $\beta_1$ を推定するのか紹介します.(2) の条件から,$Z$ と $Y$ の共分散を計算すると,次の式が成り立ちます:
$$ Cov(Z,Y) = \beta_1 Cov(Z,X) $$
ここで,(1) の条件から $Cov(Z,X) \neq 0$ なので,
$$ \beta_1 = \frac{Cov(Z,Y)}{Cov(Z,X)} $$
が成り立ちます.したがって,$Cov(Z,Y)$ と $Cov(Z,X)$ の標本対応を用いて,
$$ \hat{\beta}_{1}^{IV} = \frac{n^{-1} \sum (Z_i - \bar{Z})(Y_i - \bar{Y})}{n^{-1} \sum (Z_i - \bar{Z})(X_i - \bar{X})} $$
で $\beta_1$ を一致推定できることが分かります.このように,たとえ $X$ と $U$ に相関がある場合でも,(1) と (2) を満たす操作変数 $Z$ があれば $\beta_1$ を推定することができます.

操作変数の例

欠落変数

個人の能力 $A$ をコントロールした下で,教育年数 $X$ が賃金 $Y$ に与える影響を分析したいとします.つまり,次の回帰式に興味がある場合を考えます:
$$ Y = \beta_0 + \beta_1 X + \beta_2 A + \epsilon, \ \ E[\epsilon |X,A] = 0 $$
もし個人の能力 $A$ が観測できるなら,$Y$ を $X$ と $A$ に回帰させることで $\beta_1$ を推定することができます.しかし,$A$ が観測できない場合には,$A$ を無視して $Y$ を $X$ に回帰するとバイアスが生じることが知られています.実際,$Y$ を $X$ に回帰して得られるOLS推定量の確率収束先は
$$ \hat{\beta}_1^{OLS} \to_p \frac{Cov(X,Y)}{Var(X)} = \beta_1 + \beta_2 \frac{Cov(X,A)}{Var(X)} $$
となり,$\beta_2 \neq 0$ と $Cov(X,A) \neq 0$ が成り立つなら,OLS推定量にはバイアスが生じます.このバイアスは欠落変数バイアス(omitted variable bias)と呼ばれています.

上のモデルを次のように書き直すことができます:
$$ Y = \beta_0 + \beta_1 X + U, \ \ U = \beta_2 A + \epsilon $$
このモデルで操作変数 $Z$ が外生性を満たすためには,$Z$ が $A, \epsilon$ と無相関である必要があります.したがって,この例では,教育年数とは相関を持つが,個人の能力とは相関を持たない変数を探す必要があります.このような変数の例として,Angrist and Krueger (1991) は四半期のどの時期に生まれたかを示すダミー変数(quarter-of-birth)を操作変数として用いています.アメリカの義務教育制度では,6歳になる年に入学し,16歳の誕生日を迎えるまで学校を中退できないことになっています.この制度のため,誕生日によって子供が学校に通わなくてはいけない年月に違いが生じます.その結果として,この quarter-of-birth という変数は教育年数と相関を持ち,関連性を満たします.一方で,誕生日が個人の能力に影響を与えるとは考えられないので,外生性も成り立ちます.

観測誤差

変数 $X^{\ast}$ が $Y$ に与える影響を調べたいが,$X^{\ast}$ を直接観測することはできず,観測誤差のある $X$ という変数しか観測できないという状況を考えます.つまり,次のようなモデルを考えます:
$$ Y = \beta_0 + \beta_1 X^{\ast} + \epsilon_1, \ \ X = X^{\ast} + \epsilon_2, \ \ E[\epsilon_1|X^{\ast}] = E[\epsilon_2|X^{\ast}] = 0$$
このモデルでは,$\epsilon_2$ を観測誤差と考えることができます.ここで,このモデルを書き直すと,
$$ Y = \beta_0 + \beta_1 X + U, \ \ U = \epsilon_1 - \beta_1 \epsilon_2 $$
となります.$X$ と $U$ はどちらも $\epsilon_2$ を含んでいるので,$X$ と $U$ は相関すると考えられます.したがって,このような状況では,OLS推定量で $\beta_1$ を一致推定することはできません.

この例では,観測誤差のある変数がもう1つ存在すれば,それを操作変数として用いることができます.例えば,$X$ 以外にもう1つ観測誤差のある変数 $Z = X^{\ast} + \epsilon_3$ があるとしましょう.このとき,$X$ と $Z$ は明らかに相関を持ちます.また,$Z$ の観測誤差 $\epsilon_3$ が $\epsilon_1, \epsilon_2$ と無相関なら,$Z$ と $U$ は無相関となります.

同時方程式

次の需要関数と供給関数の交点で価格 $X$ と数量 $Y$ が決定される場合を考えます:

y_D = \beta_0 + \beta_1 x + \epsilon_D \\
y_S = \gamma_0 + \gamma_1 x + \epsilon_S

つまり,価格 $x$ のときの需要量 $y_D$ は $\beta_0 + \beta_1 x + \epsilon_D$ であるというモデルを考えています.同様に,価格 $x$ のときの供給量 $y_S$ は $\gamma_0 + \gamma_1 x + \epsilon_S$ となります.ここで,$\beta_1 \neq \gamma_1$ として,この方程式を解くと,
$$ X = (\gamma_1 - \beta_1)^{-1} (\beta_0 -\gamma_0 + \epsilon_D - \epsilon_S ) $$
となります.したがって,$X$ は需要関数の誤差項 $\epsilon_D$ と相関することが分かります.つまり,数量 $Y$ を価格 $X$ で回帰しても,需要関数の係数 $\beta_1$ を一致推定することはできません.このように,方程式の解として $X$ と $Y$ が生成されている場合はOLS推定量で一致推定することができない場合があります.

この例では,供給関数にだけ影響を与える変数を操作変数として利用できることが知られています.例えば,供給関数の誤差項 $\epsilon_S$ とは相関を持つが,需要関数の誤差項 $\epsilon_D$ とは相関を持たない変数 $Z$ があるとします.このとき,$X$ は $\epsilon_S$ を含んでいるので,$Z$ が関連性の条件を満たすことが分かります.したがって,何らかの供給ショックを操作変数とすれば,需要関数を推定することができます.

最後に

今回は説明変数と操作変数が1つずつしかない非常に簡単なモデルだけを紹介しました.説明変数や操作変数が複数ある場合の推定方法については,多くの計量経済学のテキストで解説されていると思うので,興味がある人は計量経済学のテキストを読んでみてください.次回は,反実仮想モデルの下での操作変数法について紹介します.

株式会社Nospareでは統計学の様々な分野を専門とする研究者が所属しております.統計アドバイザリーやビジネスデータの分析につきましては株式会社Nospareまでお問い合わせください.

株式会社Nospare

参考文献

  1. Angrist, J. D., & Keueger, A. B. (1991). Does compulsory school attendance affect schooling and earnings?. The Quarterly Journal of Economics, 106(4), 979-1014.
8
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
8
5

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?