- 読んだ本:「原因と結果」の経済学―――データから真実を見抜く思考法
- 本には、↓の項目ごとに実際に行われた効果検証の例が書いてある
目的
後から要点を参照できるようにしておく
目次
- 因果関係を確認する3つのチェックポイント
- 反事実
- 反事実っぽいデータの作り方
- 回帰分析
- その他
内容
因果関係を確認する3つのチェックポイント
「相関はありそうだけど、因果はあるのか?」というのを考えるときに疑ってみるポイント
- 「まったくの偶然」ではないか
- 「第3の変数」は存在していないか
- 「逆の因果関係」は存在していないか
反事実
- 因果関係を説明するのには「反事実」が必要
- 「aをしたからbになった」という事実と、「aをしなかったらどうなっていたか」という反事実を比較する必要がある
反事実っぽいデータの作り方
実際は、反事実は(タイムマシンで過去に戻ってやり直さなければ)観測不可能。そのため、比較可能なデータを作り反事実をもっともらしいデータで置き換える
- その1:ランダム化比較試験
- その2:自然実験(得られたデータから、ランダム化比較試験のような状況を探す)
- その3:実験をまねる「疑似実験」
- 差の差分析
- 対象Aと対象Bを考える。「Aは何か影響を与えられてA1->A2、Bには何もしないでB1->B2」と変化したとき、因果効果として「(A2-A1)-(B2-B1)」を測定する。必要な前提条件は、AとBは、因果効果以外は同じ変化をする(同じトレンド、他に影響がある変化起きていない)ものであること。
- 操作変数法
- 「原因を通してのみ結果に影響を与える」操作変数によって介入群と比較群を比較する。必要な前提条件は、「操作変数は原因には影響を与えるが、結果には直接影響しないこと」「操作変数と結果両方に影響するような第4の変数が存在しないこと(存在していても、データがあれば良い)」
- 回帰不連続デザイン
- 恣意的に決めた値をカットオフ値として介入群と比較群を分けて、因果効果として「カットオフ値前後でのジャンプ値」を測定する。必要な前提条件は、カットオフ値周辺で結果に影響を与えるような他のイベントが起きていないこと
- マッチング法
- 結果に影響を与えるような共変数を用いて、介入群と似た比較群を選出し、比較する方法。必要な前提条件は、結果に影響を与える共変数がすべて観察可能であること
- 共変数:原因と結果以外のすべての変数
- 共変数が複数あったら、まとめて比較する方法もある(プロペンシティ・スコア・マッチング)。必要な前提条件は、「結果に影響を与えるようなすべての共変数がデータとして測定され、手元にあること」「すべての共変数がプロペンシティ・スコアの計算に用いられていること」
- 差の差分析
回帰分析
- 単回帰分析
- 原因と結果だけで近似直線引いて、因果効果として傾きを計測する
- 重回帰分析
- 交絡因子(原因と結果に影響を与える変数)も含めて回帰分析する。交絡因子の影響を消して、原因と結果の関係を見ることができる。
- 計算とかはコッチ参照
その他
- 分析の妥当性と限界
- 内的妥当性:研究対象となった集団に同じことをしたら、同じ結果を得られるか
- 外的妥当性:研究対象以外に同じことをしたら、同じ結果を得られるか(例:アメリカ人を対象に行なった研究の結果が、日本人にも適用できるか)
- ランダム化比較試験もランダムピックアップする対象を厳選しているので、「外的妥当性」という点では完璧ではない
- 因果推論の5ステップ
- 「原因」は何か
- 「結果」は何か
- 「因果関係を確認する3つのチェックポイント」を確認する
- 反事実を作る
- 比較可能になるよう調整する