Posted at

データ解析のための統計モデリング入門(緑本)の読書メモ(PythonとStanで)

More than 1 year has passed since last update.


読書メモ

「緑本」として有名なデータ解析のための統計モデリング入門の読書会を行ってました。その際に読書メモを作成したので共有します。

GitHubにJupyter Notebookとしてアップしてます。

書籍中のR,WinBUGSのコードは、できるだけPythonやStanで記載してます。

Chap1 データを理解するために統計モデルを作る

Chap2 確率分布と統計モデルの最尤推定

Chap3 一般化線形モデル(GLM)―ポアソン回帰

Chap4 GLMのモデル選択―AICとモデルの予測の良さ

Chap5 GLMの尤度比検定と検定の非対称性

Chap6 GLMの応用範囲をひろげる―ロジスティック回帰など

Chap7 一般化線形混合モデル(GLMM)―個体差のモデリング

Chap8 マルコフ連鎖モンテカルロ(MCMC)法とベイズ統計モデル

Chap9 GLMのベイズモデル化と事後分布の推定

Chap10 階層ベイズモデル―GLMMのベイズモデル化

Chap11 空間構造のある階層ベイズモデル


緑本とは

正式名称、データ解析のための統計モデリング入門。表紙が緑色なので緑本、と呼ばれるそう。

統計モデリング(モデルを作って観測データに当てはめて、現象を理解する方法)についての入門書。

TJOさんのブログ記事などでも紹介されていることが多いと思います。

まえがき曰く、『「数理モデルを現象で表現・説明する」基礎訓練を受けてない人』が想定している読者とのことです。


緑本をお勧めしたい方

普段からデータを触っていて、エクセルで散布図書いて近似曲線引いたりしているが、何やってるのかよくわからない、そんな方が読まれると良いと感じました。

個人的には表紙と書籍のタイトルから難しそうな雰囲気を感じてしまい、読むのをためらってしまっていましたが、読み進めると「入門」の名の通り、とてもわかりやすく書いてくださってました。

東大統計学入門(赤本)などから勉強を始めるよりも、緑本で統計モデリングの流れを把握してから読んだ方がいいかもな、と感じています。


Pythonを使う方でも大丈夫

書籍ではRを用いて解説を進めていますが、ネット上にはPythonで書かれたコードも多数あり、そちらを参考にすれば手元でPythonで動かすことも可能だと思います。(多数のサイトを参考させていただきました、ありがとうございました。)

サンプルデータがRData形式の場合は、R上でCSVに変換したりなどは必要かと思います。

またWinBUGSコードの代わりにStanで書かれたコードもちらほらと見かけます。

5、6章あたりから難しくなってくるかもしれませんが、いい本だと思うので、ぜひ読んでみてください!