More than 5 years have passed since last update.

ベイズモデリング　〜２群の差の推定〜

Posted at 2016-12-18

２群の差の推定

ベイズモデリングの練習第１弾

いろいろあって時間がなかったが、やっとベイズモデリングに関する練習ができた。

第１回はベイズ統計の２群の差について

参考図書は

です。

使用したデータは有名な「iris」

さらにその中でも「pedal.length」(ガクの長さ？）を用いました。

ベイズモデリングするためのソフトにはstan + python (pystan)を使ってます。

頻度主義の統計として有名なt検定、それをベイズモデリングで行うのが今回の目的です。

観測データをx1、x2とすると、これらは

x1 ~ normal(mu1, sigma1)
x2 ~ normal(mu2, sigma2)

というふうに生成される。

観測値（x1, x2）から推定された母平均、mu1, mu2を比較することで、

それらに差が存在する確率を議論することが可能になる。

まず、元データについて、ヒストグラムと推定したmuとsigmaで正規分布を書いたplotが下の図

versicolor種とvirginica種についてそれぞれ５０データずつ、

確かにplotしただけで、それぞれに差がありそうだとわかる。

次に推定したmu_versicolor, mu_virginicaのプロット

濃い色と薄色があるのは、10サンプルからの推定（薄い方）と30サンプルからの推定（濃い方）の２種類を行ったから。

薄い方が広く分布していることからも、観測数が多い方が、精度の高い推定ができることがわかる。

最後にmu_versicolor - mu_viginicaの10サンプル版、30サンプル版のプロット

青が１０サンプル、緑が３０サンプル

このヒストグラムを要約することで（EAPを求める）

ガクの大きさが〜〜cm以上大きい確率を評価することができる。

やはりサンプル数が多い方が、尖度の高いヒストグラムが得られている。

30サンプルの場合、ほとんどの確率で1.0~1.5の差があると評価できる。

今回はベイズ統計を用いた２値の差を評価したが、なかなか使えそう。

p値だけでなく、どれだけ離れてる確率が~~%と出せるところが良い。

また、データの少なさに対する信頼度の低さも同時に評価できていいですね。

自身の修論にも使いたいな〜〜〜