More than 5 years have passed since last update.

Stanによる統計モデリングの勉強－①

Posted at 2019-04-15

目的

StanとRでベイズ統計モデリングの勉強用のノート。
勉強した内容を中心に、ポイントをノートしていく

まず、Chapter3 で気になる点をノートしておく

複雑なモデルを扱うと、MCMCが収束しない、最尤推定がうまくいかない、などの問題が起きる。
このような問題を避けるために、シンプルなモデルから試すことが定石。

再現性とは、同じ手順に従う限り、だれがいつどこで実行しても結果が再現できる（同じ結果になる）ことを指す。
これは、昨今(2019/3現在)話題の、GAN系のモデルや深層強化学習でも、問題になっている性質ですね。

再現性は、頑健性とも関連している。

具体的には、以下のようなことをチェックするとよい。（１つの例）

グラフィカルモデルを使う。

情報量基準（AIC, BIC, WAIC, WBIC）などを使ってモデル選択することが多い（らしい）。

モデル選択目的では、AIC, BIC を使う理論的妥当性はないらしく、
WAIC, WBIC を使うことが推奨されるとのこと。

情報量基準を使ったモデル選択でも、かならずしもよいモデルが得られるわけではない。（過学習を回避することは、容易ではないため。）

また、情報量基準に頼るがあまり、モデルの探索をおろそかにすることがある点にも注意が必要。

当記事の元書籍では、情報量基準を使うモデル選択の議論をしない、とのこと。