去年【決定版】因果推論本の読書ガイド31冊〜『インベンス・ルービン 統計的因果推論』和訳記念!を書きましたがその後良書が多数出ましたのでUpdateします。
因果推論の3流派
因果推論を初心者が読んでいくと、本によって全然違うことが書いてあって混乱します。実施難しい概念を扱っていることもあるのですが大きく3つの流派があり、この本は〇〇派だよ、と明記してないことが多くそれぞれ概念や用語が異なるのが原因かなと思います。以下時に記載ないものは流派をあまり意識しない入門か概論、それぞれの流儀にはR, P(Cは私が読んでないのでここではなしです)と略記します。
- (1)統計学における因果推論(ルービンの因果モデル)
-
「因果推論とは根本的に“欠損データ”の問題である」
-
- (2)心理学における因果推論(キャンベル)
-
キャンベルは「内的妥当性を脅かすもの(Threats to internal validity)」をリストアップして、研究を始める段階で一つ一つ予防策を講じておくことで正しい因果関係を導くことができると考えました。
-
ルービンがデータが目の前に既にあるものとして、どのように「統計解析」すれば正しい因果推論を行うことができるのかを考えたのに対して、キャンベルはデータを集める前の段階で、どのような「研究デザイン」を計画すれば正しく因果関係を導くことができるかを強調しました。つまり、ルービンとキャンベルの因果推論に関する考え方は対立するものではなく、補完的な意味合いを持っている
-
- (3)疫学の「因果関係ダイアグラム(Causal diagram)(パール)
-
因果関係ダイアグラム
-
出所:
参考
因果推論本の読書ガイド
- まず、一歩目、概要を知るのみならこれで十分
- データサイエンティストの人や因果推論・因果探索をもう一歩突っ込んでい知りたいならば
- 機械学習による因果推論・因果探索の最新手法を知りたいなら
入門
相関関係と因果関係の違いなどから因果推論の入門まで。数式なく事例に基づいてわかりやすく解説してある。
因果探索を学ぶにしてもまず因果推論の考え方を知ることが大事なのでまずはこれらの本から。
入門書としては2冊ある。それぞれ取り扱っている手法がやや異なるが、特にこだわりがなければ代表的な手法を扱っている 『「原因と結果」の経済学』 がまずはよいと思われる。
「集積分析」「パネルデータ分析」は他に比べるとややマイナーな手法のため。
-
本節での紹介書籍
因果推論手法 | 「原因と結果」の経済学 | データ分析の力因果関係に迫る思考法 |
---|---|---|
RCT | O | O |
自然実験 | O | O |
回帰不連続デザイン | O | O |
集積分析 | X | O |
パネルデータ分析 | X | O |
差分の差 | O | O |
操作変数法 | O | X |
マッチング | O | X |
回帰分析 | O | X |
統計的因果推論
-
専門に扱うのでなければ 『「原因と結果」の経済学』 で十分
-
データサイエンティストとして基礎的に知っておくのでれば 『因果推論』金本 で十分
-
新しい手法も知るのであれば『Pythonライブラリによる因果推論・因果探索[概念と実践]』
-
コード例による実装・検証については「ツール・ライブラリ」の章で扱った通り。
-
本節での紹介書籍
- 入門
- 基礎をしっかりと
- 潜在反応モデル
- 構造的因果モデル
- 両方の理論をしっかりと
- 観察研究に焦点
- 反実仮想機械学習+オフ方策学習
- その他の本
- 読み物
- 『因果推論の科学 「なぜ?」の問いにどう答えるか』
- パールによる本で歴史から学べる
- 『RCT大全』
- RCTの適用例と限界などの事例
- 『因果推論の科学 「なぜ?」の問いにどう答えるか』
- 実験デザインの考え方
- 分野特化
- 傾向スコア
- 構造方程式モデリング
- 部分識別
- 『マンスキー データ分析と意思決定理論 不確実な世界で政策の未来を予測する』
- 読み物として考え方を理解
- 『部分識別入門 計量経済学の革新的アプローチ』
- 和書で唯一?本格的なテキスト
- 『マンスキー データ分析と意思決定理論 不確実な世界で政策の未来を予測する』
- 実装
- Pythonによる
- 『つくりながら学ぶ! Pythonによる因果分析: 因果推論・因果探索の実践入門』
- 当時はよい本だったが、『因果推論』金本、『Pythonライブラリによる因果推論・因果探索[概念と実践]』が出てきたので優先度低か
- 『つくりながら学ぶ! Pythonによる因果分析: 因果推論・因果探索の実践入門』
- Rによる
- 『統計的因果推論の理論と実装』
- 網羅的に解説・コード例がありRで実施するならば必須
- 『統計的因果推論の理論と実装』
- Pythonによる
- 読み物
以下は従来は良く用いられたテキストのようですが、昨今新しいテキストが出てきて不要かなと思い、私が読んでおらずです
- 宮川正巳『シリーズ〈予測と発見の科学〉1 統計的因果推論』
- 岩崎学『統計的因果推論 (統計解析スタンダード)』
統計的因果探索
因果推論よりも因果探索は難しく、「構造的因果モデル」を深く知る必要がある。
- 専門でなく概要を知るのであれば因果探索の章といくつか読み物を。
- 専門に扱うのであれば
- ベイジアンネットワーク 植野 が入り口となるか。
- 機械学習による最新手法は因果推論と同様に
- 本節での紹介書籍
- その他の本
- ベイジアンネットワーク
- Rによる実装
- 『Rと事例で学ぶベイジアンネットワーク〔原著第2版〕』
- 事例が豊富
- 『Rと事例で学ぶベイジアンネットワーク〔原著第2版〕』
- Rによる実装
- ベイジアンネットワーク
統計的因果推論(統計的因果探索)のテキスト一覧
因果探索に特化した本はそれほど多くなく前述のフロー図で説明した通り。
因果推論の本については類似の本が多数あるため、一覧化した。
- Pearl流・Rubin流、両方を解説した本
- 因果推論のみと因果探索含めて解説した本
- 取り扱っている手法の違いなど
- まだ紹介していない本節での紹介本
適用分野ごとの本
因果推論については広い分野に適用されており専門の本がかなり出ている。
定性的な因果分析
社会科学の分野で「質的研究」と呼ばれるうち因果推論・因果探索にあたるところを本調査では取り上げた。
一般に理論的なバックグラウンドが必要であったり、研究者の解釈に重きを置くところが多い。ただ、下記はデータサイエンティストによる因果分析にも参考になると思われる。
- 田村正紀氏の一連の著作とくに『リサーチ・デザイン:経営知識創造の基本技術』はバランスよくまとめられて定性的な因果分析の入門によい。
- 質的比較分析(QCA)は数件から数十件のデータがあれば論理的に導くことができる。そのためデータサイエンティストとしても導入しやすいと思われる。
- 因果ループは『DMMを支えるデータ駆動戦略』でも取り上げていられる通りIT企業内で取り上げる価値もあると思われる。
- 本節での紹介本
- QCA
- ナラティブ・アプローチ
- 因果過程追跡
- 因果ループ
- 計量経済学系の因果推論
- その他因果推論・因果探索以外のデータ分析系の本の紹介