Update版を書きました
因果推論の3流派
因果推論を初心者が読んでいくと、本によって全然違うことが書いてあって混乱します。実施難しい概念を扱っていることもあるのですが大きく3つの流派があり、この本は〇〇派だよ、と明記してないことが多くそれぞれ概念や用語が異なるのが原因かなと思います。以下時に記載ないものは流派をあまり意識しない入門か概論、それぞれの流儀にはR, P(Cは私が読んでないのでここではなしです)と略記します。
- (1)統計学における因果推論(ルービンの因果モデル)
-
「因果推論とは根本的に“欠損データ”の問題である」
-
- (2)心理学における因果推論(キャンベル)
-
キャンベルは「内的妥当性を脅かすもの(Threats to internal validity)」をリストアップして、研究を始める段階で一つ一つ予防策を講じておくことで正しい因果関係を導くことができると考えました。
-
ルービンがデータが目の前に既にあるものとして、どのように「統計解析」すれば正しい因果推論を行うことができるのかを考えたのに対して、キャンベルはデータを集める前の段階で、どのような「研究デザイン」を計画すれば正しく因果関係を導くことができるかを強調しました。つまり、ルービンとキャンベルの因果推論に関する考え方は対立するものではなく、補完的な意味合いを持っている
-
- (3)疫学の「因果関係ダイアグラム(Causal diagram)(パール)
-
因果関係ダイアグラム
-
出所:
参考
因果推論本の読書ガイド
入門、コード例、事例集、理論書をまとめました。
先述の通り3流派あり、書籍タイトルから内容が類似しているのか違うものなのか分からない、類書が増えた等あり、私なりにまとめてみました。
図の前後関係は必ずしも固定したものではなく大体こういう流れかなという程度の参考です。
ここに紹介していない本で良書もあります。あくまでも私が読んだ範囲内とのことで(『インベンス・ルービン 統計的因果推論(上)(下)』は7月刊行なので読了後Updateします。『統計的因果推論 -モデル・推論・推測-』は未読ですがバイブルなので1つのゴールとして記載しています。)。
入門
- 「原因と結果」の経済学
- データ分析の力 因果関係に迫る思考法
- 政策評価のための因果関係の見つけ方 ランダム化比較試験入門
- 岩波データサイエンス Vol.3 「因果推論」
-
因果推論入門〜ミックステープ
- 本書の特徴は
- ルービン派、パール派に偏らず理論を網羅的に紹介していること
- 数式もありますがそれで押すのではなくコード例で理解を促していること
- 理論の解説がメインですがコード例が豊富。書籍内ではRコードですがサポートサイトにStataやPythonのコード例あり。
- また本文内に類書との差別化として下記があり、本書を読めば因果推論の主だった手法を網羅できると言っているようです。
-
Imbens and Rubin (2015)(青木注『インベンス・ルービン 統計的因果推論』)は潜在アウトカムモデル、実験デザイン、マッチングと操作変数法については解説していますが、非巡回有向グラフ(DAG)、回帰不連続デザイン、パネルデータ、合成コントロール方については扱っていません。一方、Morgan and Winship (2014)は、DAG、潜在アウトカムモデル、操作変数法について解説していますが、回帰不連続デザイン、とパネルデータについては軽くしかふれられていませんし、Athey and Imbens (2017b)が過去15年間で因果推論における重要な革新と呼んだ合成コントロール法についても扱っていません。Angrist and Picheke (2009)は私のニーズにとても近いですが、私が極めて有用と考えている合成コントロール法やグラフィカルモデルについてふれられていません。
-
コード例
Python
R
計量経済学に近い分野
読み物
汎用・理論
ルービン派
パール派
ビジネス・マーケティング
- 【再掲】効果検証入門 〜正しい比較のための因果推論/計量経済学の基礎
- A/Bテスト実践ガイド 真のデータドリブンへ至る信用できる実験とは
政治・公共
政治
公共
医学
-
世界一わかりやすい「医療政策」の教科書
- 必ずしも因果推論のみではなく医療政策全体についての本です。
- 医療政策に関わる方はもちろんすべて。医療政策にものを言うプロ(政治家、マスコミ、評論家、etc)の基本知識としてほしい)。のみならず、チュートリアルに毛が生えた程度の技術で「データサイエンティスト」を名乗るようななんちゃってではなくて、因果推論等データ分析を深めたいデータ分析関連の方にぜひ進めたい。
- 『「原因と結果」の経済学』の共著者でもある津川先生のブログ医療政策学X医療経済学も因果推論の事例として参考になりますよ。
- 医学のための因果推論I ―一般化線型モデル―
- 医学のための因果推論II ―Rubin因果モデル―
- ロスマンの疫学 第2版
- アドバンスト分析疫学
- その他のデータ分析系の本の紹介 【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本