仮説検定
一言でまとめると ”部分から全体(母集団)を推理する”
目的 母集団を推定する
ケース(すでに、母集団の平均・分散がわかっている場合)
1 仮説(母集団の推測)を立てる
ex ”N枚のコインを投げて、10回表が出た”というデータ(結果)がある。
Q 投げたN枚の回数を推定するとして、妥当な数は?
2(区間で)検定する
普通に(確率的に)考えれば20枚 (二分の一)
・・しかし、結果は常に、確率通りではなくバラつく
故に、+1,2 21枚、22枚 or -1,-2 19枚、18枚と推定しても妥当といえそう。
では・・
Q 母数Nの推定としてどこまでが妥当な数値と言えるか?
これに、答えを出すのが「区間推定」という”検定”の基本的やり方である。
そのために、95%の予言的中区間(=標準偏差 +=1.96の範囲)内か確かめる。
標準正規分布に変換して、以下の数式を解けば、知りたい範囲を出せる。
これを解くと、
(N=16の場合) 4.08 ≦ X ≦ 11.92
となる。
この数値から言えることは、
(N=16)つまり16枚コインを投げた時、
表の出る枚数として 4.08枚〜11.92枚 の範囲になる確率が95%である。
今回のデータは10枚表が出た時
→95%の範囲内なので、16枚投げて表10枚出るのは、普通によく起こること!(=妥当)と言える。
もしN=36枚の場合は、計算してみると 12.12 ≦ X ≦ 23.88
となり、この範囲から外れる。つまり、 想定外のことが起こったと言える。
この結果から言えることは2つ
1 母集団に対する仮説(N=36枚)は正しい。 しかし、想定外(5%)の滅多に起ころないことが起きてしまった。
2 母集団に対する仮説は間違っている
ここで、統計学では、2を選択する。(区間推定の手法を使えば95%でたまたま予想が外れるリスクは承知している上で検定しているため)
N=36は間違いであるため、仮説を棄却する
つまり、N=16枚は妥当であるが、N=36枚は想定しない。という結論を出します。
最初は”検定”の理解に苦しみましたが、まとめてみると
意外とロジカルな探偵の(コンピューター)の論理みたいで、理解してくると面白いと思います!
数式的理解も含めこれから、深めていきたいです。