Python
ポエム
書籍
ベイズ
統計モデリング

文系エンジニアが0からベイズ統計モデリングを学習するときに読むべき資料まとめ

TL;DR

「Qiitaで炎上するタイトルのつけ方」というテーマを書くのに失敗したので、諦めて最近学習している「ベイズ統計モデリング」に関するメモや書籍をまとめた。

記事のタイトル通り、文系エンジニアが数学知識0からベイズ統計モデリングを勉強するときに読んだ方がいい本や資料を網羅したつもりです。

もしオススメ資料とかあったら追記するので教えてもらえると嬉しいんだな〜(`・ω・´)

前提条件

  • 中学生レベルの数学知識
  • Pythonが少しでもわかるエンジニア力
  • (Rがわかるともっと捗る)

ポイント

  • 書くこと
    • ざっくりな説明とコメント
    • オススメ資料
  • 書かないこと
    • 正確な説明
    • 細かい説明

そもそも(ベイズ)統計モデリングとは?

すでにあるデータを使って未知の値を推定したりするやつです。ざっくり言うと統計と機械学習を合体して最強なやつです(にこり)

詳しくは StanとRでベイズ統計モデリング (Wonderful R) の最初の方読んでください(`・ω・´)

以下ブログでも例題を含めて少し説明しています。

読者タイプ別最初に読むべき本

具体的に何ができるか知りたい(エンジニア向け)

ほぼ数学抜きで具体的に説明している。Pythonでの実例が多いので、具体的にどういうことができるのかイメージしやすい。

以下、英語版はgithubで公開されているので、英語が読める人はこっちの方でもいいかも(と言いつつもやはり日本語版がオススメです)

全体像や理論を理解したい(理論派向け)

ちまたでは「みどり本」と呼ばれる緑色の本。たぶん全体的なプロセスや理論をまず理解したい人にとっては一番わかりやすいと思います。ある程度の数学知識(確率や統計など)を前提としているので、わからないところは後述の本を参照するとよいかも。コードは基本的にRのため、Rがわかると捗る(`・ω・´)

カテゴリ別おすすめ資料

数学

この4冊読んでおけば必要な知識はすべて身につくはず。特に最初の2冊がよい。

統計モデリング

もう少し実践的な(ベイズ)統計モデリングをやりたいならこの本がオススメ。

補足資料としては以下をさらっと読んでおくとよいかも。

MCMC

ベイズ統計モデリングのプロセスで重要なMCMCというサンプリング手法の説明。適当にまとめているので、後で修正したい(`・ω・´)

ベイズ関連

  • PDF: Think Bayes – Green Tea Press: ベイズを理解するのに必要な基礎知識を説明してくれる。日本語版もあるが、訳がよくないので英語版をオススメしている

後でまとめる(`・ω・´)

オンラインコース

動画で勉強するのが好きな人にはやっぱりCourseraがオススメ。他のコースでもいいとは思います。

OSSライブラリ

自分がメインでPythonを使ってるので、現状はPythonのライブラリだけまとめました。

本当はRやStanについてもまとめたいが自分があまりわかってないので必要であれば追記する(`・ω・´)

Python