こんにちは。
先日、経済学の修士課程を修了し、社会人として働き始めたものです。
今回は、備忘録的に計量経済学・機械学習系の参考書籍をまとめたいと思います。
私は、2023年から2年間で、計量経済学の実証的手法である因果推論を使って修士論文を書いたり、データサイエンスの副専攻を取得し、機械学習の基本を学んでいました。学校外ではE資格(JDLA)などを取得しました。
学部はもともと経済学系ではなく、工学部で、大学院で初めて勉強し始めました。
そのため、経済系の大学院に進学したい方や、因果推論・機械学習に興味がある方の参考になれば幸いです。
学部
統計学入門
学部は工学部の半導体系でしたので、統計学やデータサイエンスに触れることはほとんどありませんでした。唯一とっていたのが、統計学入門の授業で、そこで使っていた教科書です。
この書籍は、基本的な統計量から、検定の基礎~最尤法まで扱っている入門書です。
大学院1年目 計量経済学の書籍
大学院入試でも計量経済学は選択しなかったので、ほとんど統計について何も知らない&行列計算すらままならない状態で入学しました。
大学院1年目から計量経済学のコアコースが始まったので、最初の半年が、学部の復習+院の計量経済をこなさなければならず、一番大変でした。
今振り返ると、もっと入門の教科書から始めればよかったと思います。
浅野・中村 計量経済学
1年目に一番お世話になった教科書です。演習もほとんど解きました。
古い本なので、現在あまり使わない部分に紙幅が割かれている点もあるのですが、回帰分析の考え方、多重共線性への対処などは現在でも参考になっています。
個人的によかったと思うポイントは、演習で行列計算の復習をすることができたことです。
沖本 計量時系列分析
言わずと知れた、時系列解析の基本の一冊。
結局、研究ではあまり使わなかったのですが、時系列モデルは、マクロ経済実証やマーケティング系の研究に関わる方であれば使用することになるかもしれません。
中妻 入門・ベイズ統計学
1年目に一番苦戦したのがベイズ統計でした。
高校範囲のベイズ統計を復習でき、ベイズ統計を使うとどういうメリットがあるのか、ということを身近な例と数式で解説しています。マルコフ連鎖とモンテカルロ法の解説を経てマルコフ連鎖モンテカルロ法(MCMC)の基礎までを網羅しています。
コードの実装はあった気もするし、なかった気もする。手を動かすというより、数式を交えて、ベイズという概念の理解にお勧めです。
標準ベイズ統計学
授業で扱った、多変量正規モデルがどうしても理解できなくて、この本に頼りました。当時は、標準的な計量経済学の頻度論の考え方に染まっていたので、ベイズの線形回帰について理解が深まりました。
データサイエンスの経済学
2023年に出版された、京大の依田先生の書籍です。
クーポンや情報提供などの介入政策を、誰に行うと効果が高いか?というポリシーターゲティングの研究を紹介しています。
後半ではコウザルフォレストという機械学習を用いた因果推論の手法について解説されています。ポリシーターゲティングは計量経済学と機械学習を掛け合わせたホットな分野だと思っておりますが、それを日本語で学ぶことができる先駆的な教科書だと思います。
大学院1年目 機械学習の書籍
ITエンジニアのための機械学習理論入門
最小二乗法から始まり、ロジスティック回帰やk平均法など基本的な機械学習の手法を少ない数式で解説しています。学部1年生レベルだと思われますが、全く機械学習について触れてこなかった私にはありがたい入門書でした。
筑波大学オープンコースウェア 機械学習
筑波大の佐久間先生による全20講の講義です。修士1年のゴールデンウィークに一気見したことを覚えています。
内容は、基本的な回帰分析から、正則化、SVM、ニューラルネットワークまでです。入門者にとっつきにくい逆誤差伝搬法を分かりやすく解説しています。
よく東大や京大の講義動画や講義資料がインターネット上に流れてきますが、きちんと時間をとって学習する方は少ないのではないでしょうか。分かりやすいことはもちろん、教科書を読んでいるだけでは気づかない点に触れられるというのが授業の強みだと思いますので、自身の大学の講義やオープンアクセスができるコースワークに取り組んでみることをお勧めします。
渡辺澄夫ベイズ理論100問
この書籍をもとに進む授業があったので、100問全部解いてました。強制力がないと完走するのはムズイです。この授業が一番大変でした。
パターン認識と機械学習
機械学習の勉強をするのに有名な本です。上下巻あります。おそらく、多くの大学の図書館にたくさん蔵書されていると思います。
自分は、全部読んだわけではないのですが、読み通すには微積分&線形代数に慣れていることと、時間が必要だと思います。
多変量解析(データサイエンス大系)
当時、主成分分析と因子分析の違いを理解したいと思い、図書館で借りて読みました。サポートベクトルマシンの解説もよかったです。このシリーズの教科書は薄いながらも、最低限の専門的な説明で分かりやすい良書が多いイメージです。
ゼロからつくるディープラーニング
E資格の参考教材になっていたので購入した、通称「ゼロつく」。パーセプトロンとバックプロパゲーションの説明がやたら丁寧だったことを覚えています。
主に、畳み込みニューラルネットワークの解説が中心で、画像処理系の機械学習モデルがメインになっており、(現在は専らAI=LLMのイメージがあるため)時代を感じます。
大学院2年目 計量経済学の書籍
計量経済学 日評ベーシック・シリーズ
理論と実証を意識することができた教科書です。学部3~4年生向けだと思います。
この本を読んでから回帰分析を軽視していた自分を恥じるようになりました。浅野本に書いてあるガチガチの理論を、実証でどう使っていくかについてイメージが見えました。
計量経済学 ミクロデータへの誘い(末石)
神戸大学の末石先生の計量経済学の教科書です。
ブートストラップや手法の仮定についての紙幅が割かれていることからも、実証向けの教科書だと言えます。とくに、モデルの識別の議論は他の教科書で扱われていないことが多く、学部から大学院への橋渡しとして最適な一冊です。
内容が高度であるにもかかわらず、分かりやすく、薄いことが素晴らしい教科書で、おそらく何度読み返しても新しい発見があるような教科書です。
ミックステープ 因果推論
スコットカニンガムの英語版書籍が、サイバーエージェントの経済学チームによって翻訳された教科書です。
因果推論の基本となる、RCT、操作変数法、差の差法、回帰不連続デザインについて実例がたくさん盛り込まれています。盛り込まれすぎてちょっとくどいぐらいですが、初めて因果推論に触れる方ならとてもイメージしやすいと思います。
因果推論を始めたい方にまずおすすめしたい1冊です。
因果推論の計量経済学
2024年に発売されたばかりの書籍です。
この教科書は因果推論の発展的教科書となっており、理想的なRCTが成り立たない時の識別、クラスター割り当て、非遵守者がいる場合の扱いなどに触れています。
レベルは高くなりますが、実際に研究を行うとしたら知っておかなければならないことを網羅的にまとめており、実証と理論どちらの側からも研究の役に立つと思います。
因果推論 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ
ほとんどの計量経済の書籍では、分析はRまたはStataで行うことが前提とされていますが、本書ではPythonを使って因果推論を学ぶことができます。手段の違いなので本質的には変わらないかと思われますが、Pythonは、データ分析を伴うアプリケーションの作成が容易であるというメリットがあります。
因果学習と機械学習の融合、という章があり、メタラーナーやMLOpsなどエンジニア向けの内容があることも他の書籍との違いです。
しかしながら、本書は因果推論の手法を幅広くカバーした分、1つ1つの解説は薄くなっていますので、他の書籍で基礎を学んでいて、Pythonで発展的なトピックを学んでみたい方におすすめです。
Applied Causal Inference Powered by ML and AI
洋書ですが、機械学習を用いた研究を行いたい経済系の大学院生におすすめしたいです。
高次元データの扱いからはじまり、さっそく機械学習と計量経済学の考え方の違いを問われるところから始まります。また、因果推論の基礎について、Pearl流(グラフィカルモデル)とRubin流(潜在結果モデル)のどちらも扱う珍しい書籍であり、因果推論の章だけ読んでも理解が深まります。
私はこれを輪読会で読み、さまざまなバックグラウンドを持つ学生と話しながら理解を深めたことがよかったと思っているので、興味のある学生同士で読んでみるのもおすすめです。
データとモデルの実践ミクロ経済学
経済学の応用を学びたい方にお勧めの書籍です。数式も簡単なもの多い割には、他の書籍ではあまり扱われないトピックがある印象です。(プラットフォームの分析、政治経済など)
おわりに
ここまで読んでいただきありがとうございます。
初っ端から浅野・中村の計量経済を読んでいることからも、初学者むけの学習順ではないので、順番をまねすることはお勧めしません。おそらくは計量経済学の第一歩などから始めるべきでした。
また、本当は大学院で読むべき王道の教科書を読んでいない、ということもあるかと思います(2年間が短すぎて、とにかくスピード重視で理解したのと、実証系の教科書が母語で増え始めたのでWilliam Greeneとかはちょっとしか読んでいません...)。
これを通して私が伝えたかったのは、「この本よかったよ」「この本は入門向けだよ」ということであり、これから計量経済学や機械学習を学ぼうと思っている方の少しでも参考になれば幸いです。