初めに
最近X(旧Twitter)で「CausalMLBook」(V. Chernozhukov, C. Hansen, N. Kallus, M. Spindler, V. Syrgkanis)1)という本が話題?になっています。そこで、この本とそれに関連するウェブサイトについて、概要の説明や、率直な感想を述べたいと思います。
Webサイトの最初にこのように書かれています。
The book introduces ideas from classical structural equation models (SEMs) and their modern AI equivalent, directed acyclical graphs (DAGs) and structural causal models (SCMs), and presents Double/Debiased Machine Learning methods to do inference in such models using modern predictive tools.
翻訳すると
本書は、古典的な構造方程式モデル(SEM)と、現代のAIに相当する有向非循環グラフ(DAG)や構造的因果モデル(SCM)のアイデアを紹介し、現代の予測ツールを用いてこのようなモデルの推論を行うための二重/偏向機械学習法を提示する。
とのことです。
機械学習と因果推論を組み合わせた手法について紹介されており、主に上述のモデルに加え、それらのモデルの推論に、Double/Debiased ML手法についても取り上げています。CausalMLのウェブサイトは、全書PDF、各章、実践ラボ、機械学習とAIによる因果推論を応用するためのパッケージへのリンクが含まれています。
本書と本サイトをみた良い点
・無料
・網羅的で難易度もそこまで??
・実装コードが付いている
上から順に解説していきます。
まずなんといっても無料!!というのが大きいでしょう。著名な先生方の信頼性のある本であり、無料なのは非常にありがたいです。
次に、本書が網羅的である点です。第1章から第11章までで重要なコアコンセプトを解説しており、2、3ヶ月で十分に学習することができます。第12章以降はより高度な内容に触れており、基礎と応用の区別が明確になっていますので、読みやすくなっています。ただし、基本的な計量経済学と機械学習の知識が求められ、ある程度の英語力も必要です。
最後にすごく良いと感じた点は実装コードが掲載されている点です。各章についてコードが書かれたGoogleColaboratoryとRノートブックが提供されているので、理論だけでなく実際に手を動かしながら学習できます。理論を勉強する際は特に数値や問題設定を少し変えてみたときに対応できるか、理解度を示す指標だと考えています。その意味で、この教材は数値や問題設定を実際にいじりながら学習できるため有益だと言えます。
最後に
最後までお読みいただきありがとうございました。
本記事では、CausalMLBookについて紹介をしました。難易度も高すぎるわけでもなく、かつ実装コードを見れる点は学習に有益であり、特に学生にとっては嬉しいのではないでしょうか。余裕があれば、各章に関しての紹介や解説記事も書きますので、ぜひご覧ください。
参考文献
- Chernozhukov, V., Hansen, C., Kallus, N., Spindler, M., & Syrgkanis, V. (2024). Applied Causal Inference Powered by ML and AI. CausalMLBook Website.