31
31

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

お題は不問!Qiita Engineer Festa 2023で記事投稿!

【決定版】因果推論本の読書ガイド31冊〜『インベンス・ルービン 統計的因果推論』和訳記念!

Last updated at Posted at 2023-06-24

Update版を書きました

因果推論の3流派

因果推論を初心者が読んでいくと、本によって全然違うことが書いてあって混乱します。実施難しい概念を扱っていることもあるのですが大きく3つの流派があり、この本は〇〇派だよ、と明記してないことが多くそれぞれ概念や用語が異なるのが原因かなと思います。以下時に記載ないものは流派をあまり意識しない入門か概論、それぞれの流儀にはR, P(Cは私が読んでないのでここではなしです)と略記します。

  • (1)統計学における因果推論(ルービンの因果モデル)
    • 「因果推論とは根本的に“欠損データ”の問題である」

  • (2)心理学における因果推論(キャンベル)
    • キャンベルは「内的妥当性を脅かすもの(Threats to internal validity)」をリストアップして、研究を始める段階で一つ一つ予防策を講じておくことで正しい因果関係を導くことができると考えました。

    • ルービンがデータが目の前に既にあるものとして、どのように「統計解析」すれば正しい因果推論を行うことができるのかを考えたのに対して、キャンベルはデータを集める前の段階で、どのような「研究デザイン」を計画すれば正しく因果関係を導くことができるかを強調しました。つまり、ルービンとキャンベルの因果推論に関する考え方は対立するものではなく、補完的な意味合いを持っている

  • (3)疫学の「因果関係ダイアグラム(Causal diagram)(パール)
    • 因果関係ダイアグラム

出所:

参考

因果推論本の読書ガイド

入門、コード例、事例集、理論書をまとめました。
先述の通り3流派あり、書籍タイトルから内容が類似しているのか違うものなのか分からない、類書が増えた等あり、私なりにまとめてみました。
図の前後関係は必ずしも固定したものではなく大体こういう流れかなという程度の参考です。
ここに紹介していない本で良書もあります。あくまでも私が読んだ範囲内とのことで(『インベンス・ルービン 統計的因果推論(上)(下)』は7月刊行なので読了後Updateします。『統計的因果推論 -モデル・推論・推測-』は未読ですがバイブルなので1つのゴールとして記載しています。)。

入門

  • 「原因と結果」の経済学
    • まずはぜひこの1冊。
    • 前提知識不要で、相関と因果など間違えやすいところが身につく。データ分析、政策等のかなりの専門家でもかなり間違っている人がいる。因果推論を扱うならまずは本書の内容を頭に叩き込む事が一番重要だと思う。
    • 因果推論の基本の下記概念を数式なしで一通り知ることができます。
      • ランダム化比較実験(RCT)
      • 自然実験
      • 差の差分析
      • 操作変数法
      • 回帰不連続デザイン
      • マッチング法(傾向スコア)
      • 回帰分析
  • データ分析の力 因果関係に迫る思考法
    • 『「原因と結果」の経済学』と被る面もありますが同じくわかりやすい入門書です。
  • 政策評価のための因果関係の見つけ方 ランダム化比較試験入門
    • 「政策評価のための」とはなっていますが因果推論一般にも適用できる内容です。
    • ランダム化比較試験のお話がメインですが、その他の因果推論手法の長所、短所の比較などもあり、迷子になりそうな時に戻る本として良いのではないかと思います。
  • 岩波データサイエンス Vol.3 「因果推論」
    • 因果推論の分野をルービン派、パール派について偏りなく紹介しています。RやPythonのコード例があります。
    • どういう研究分野、ビジネスへの適用事例があるのかざっと把握するのに適した本だと思います。
  • 因果推論入門〜ミックステープ
    • 本書の特徴は
      • ルービン派、パール派に偏らず理論を網羅的に紹介していること
      • 数式もありますがそれで押すのではなくコード例で理解を促していること
      • 理論の解説がメインですがコード例が豊富。書籍内ではRコードですがサポートサイトにStataやPythonのコード例あり。
    • また本文内に類書との差別化として下記があり、本書を読めば因果推論の主だった手法を網羅できると言っているようです。
      • Imbens and Rubin (2015)(青木注『インベンス・ルービン 統計的因果推論』)は潜在アウトカムモデル、実験デザイン、マッチングと操作変数法については解説していますが、非巡回有向グラフ(DAG)、回帰不連続デザイン、パネルデータ、合成コントロール方については扱っていません。一方、Morgan and Winship (2014)は、DAG、潜在アウトカムモデル、操作変数法について解説していますが、回帰不連続デザイン、とパネルデータについては軽くしかふれられていませんし、Athey and Imbens (2017b)が過去15年間で因果推論における重要な革新と呼んだ合成コントロール法についても扱っていません。Angrist and Picheke (2009)は私のニーズにとても近いですが、私が極めて有用と考えている合成コントロール法やグラフィカルモデルについてふれられていません。

コード例

Python

  • つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門~
    • Pythonで因果推論・分析をできる和書ではほぼ唯一と思います。
    • こちらは後述『効果検証入門』よりも範囲が広く因果推論とともに因果探索も扱っている。日本語のコード例の付きの本としては貴重な、LiNGAM、ベイジアンネットワーク、機械学習による因果推論、深層学習による因果探索も扱っている。
    • R『効果検証入門』とPython『Pythonによる因果分析』の違いは
      • 前者は因果推論にしぼり理論も丁寧に解説
      • 後者は因果分析(因果推論と因果探索)について広く俯瞰するイメージで解説は少なめ

R

計量経済学に近い分野

  • 実証分析のための計量経済学
    • 経済学系の本、サイトで推奨されている。計量経済学にも理論を追求する分野と実証分析として具体的な問題を解決するという分野があり、本書は後者。
    • 重回帰を中心に因果関係など複雑な社会上の問題を解き明かしている。
    • 数式は最小限。コード例はなしなので、PythonやRなどを使うなら理論の名前から自分でライブラリを探す必要はある。
  • 実証分析入門 データから「因果関係」を読み解く作法
    • 『実証分析のための計量経済学』と並んでたくさん推薦されている。『実証分析のための計量経済学』より本書は
      • 数値・数式例は少なめ、手法の紹介は多め
      • タイトルだけでも楽しいサブカル感爆発
        • 仮説検定(1): お前はもう死んでいる
        • 目的変数が質的変数の場合: 飛ばねぇ豚はただの豚だ
        • ベイズ統計: ベイジアンは滅びぬ、何度でもよみがえるさ! などなどなど
      • 数式は最小限。コード例はなしなので、PythonやRなどを使うなら理論の名前から自分でライブラリを探す必要はある。(対応を解説する記事を書くかなぁ)

読み物

  • 因果推論の科学 「なぜ?」の問いにどう答えるか
    • なぜ因果ということを考える必要があるのかなど歴史を通じて現状までを解説した本。
    • ただ、「因果推論の入門に良い」という書評がありますが、この本をいきなり読んで理解できるのだろうか疑問。ある程度学んだ後に戻ってきて読むと興味深く読めると思う。
  • マンスキー データ分析と意思決定理論
    • 部分識別(強い仮定をおかず皆が納得できる弱い仮定から何が言えるか、より仮定を強められるかというような理論)という因果推論とはまた別の手法がメインの本だが意思決定について因果推論も交えている。
  • RCT大全
    • 因果推論の中で最強の手法と言われるランダム化比較試験(RCT)の事例についての紹介。
    • 効果的な例、悪用されている例、RCTが強力すぎてRCTを装って実はランダムじゃないものも多いよねなどのお話。
    • 最強の手法ならばRCTすりゃいいじゃんと思いますが一筋縄でいかないよということがわかります。

汎用・理論

ルービン派

パール派

ビジネス・マーケティング

政治・公共

政治

  • 政治学と因果推論
    • 政治学へ因果推論を適用するための入門書
      • 自然実験:台風と投票率
      • 不連続回帰デザイン:選挙と現職効果
      • 操作変数法:投票率と政党得票率の因果効果
      • 差の差法:市町村合併と女性候補者投票率
  • 民主主義の経済学
    • 因果推論の4手法を駆使して民主主義を解明していく
    • 著者によると「因果推論の四天王」は下記とのこと
      • ランダム化比較実験(RCT)
      • 回帰不連続デザイン(RDD)
      • 操作変数法(IV)
      • 差の差法(DID)

公共

  • EBPM エビデンスに基づく政策形成の導入と実践
    • 因果推論と行動経済学を組み合わせて公共政策にどう用いるか、制度上の問題点、海外・国際開発・教育・環境エネルギー・経済政策・地方自治体への適用事例
    • 手法の説明は
      • ランダム化比較試験
      • 差分の差法
      • 回帰不連続デザイン
  • 多数派の専横を防ぐ 意思決定理論とEBPM
    • 『EBPM エビデンスに基づく政策形成の導入と実践』よりも因果推論、医学、経済学、ゲーム理論を絡めて合意形成を以下になすかを論じている。

医学

  • 世界一わかりやすい「医療政策」の教科書
    • 必ずしも因果推論のみではなく医療政策全体についての本です。
    • 医療政策に関わる方はもちろんすべて。医療政策にものを言うプロ(政治家、マスコミ、評論家、etc)の基本知識としてほしい)。のみならず、チュートリアルに毛が生えた程度の技術で「データサイエンティスト」を名乗るようななんちゃってではなくて、因果推論等データ分析を深めたいデータ分析関連の方にぜひ進めたい。
    • 『「原因と結果」の経済学』の共著者でもある津川先生のブログ医療政策学X医療経済学も因果推論の事例として参考になりますよ。
  • 医学のための因果推論I ―一般化線型モデル―
  • 医学のための因果推論II ―Rubin因果モデル―
    • タイトル通り医学のための因果推論のテキスト
    • 扱う手法は
      • 統計の基礎
      • 一般化線型モデル
      • 共変量の選択
      • ランダム化
      • プロペンシティスコア(傾向スコア)
      • 操作変数法
  • ロスマンの疫学 第2版
    • 疫学及び因果推論の入門書だが前書きに「科学的に真実に近づくための原則論」とある通り、ロスマン学とも言うべきどう科学を用いるかという方法論ともなっている。初学者にはやや難しいが研究者へのデータ分析支援を行うのであればこの程度までの知識は求められると思われる。
  • アドバンスト分析疫学
    • 著名な疫学の中級テキスト。
    • 難しい概念を多数の図表で解説している。

31
31
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
31
31

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?