初めて検定を学ぶので、諸学者向けに記事にしようと思う
#検定とは
統計的仮説検定は確率をもとに結論を導く方法!
検定は「①最初に仮説を立て、②実際に起こった結果を確率的に検証し、③結論を導く」という手順で行う。結論を導くには**「背理法」**を用いる。
#3つのステップ
##1.仮説を立てる
検定を行うにあたっては、まず**「仮説」を立てる。ここでは「渡された2枚のコインは普通のコインである」**とします。この仮説に矛盾が生じた場合、普通のコインではないと結論付けられる。
帰無仮説…統計的仮説検定の際にとりあえず立てる仮説のことで、対立仮説の方が重要であることが多い。**記号「H₀」**として表されることが多い。
ex)H₀:「渡されたのは普通のコインである」
対立仮説…統計的仮説検定において、帰無仮説が棄却されたときに採択される仮説のこと。帰無仮説に対応して**記号「H₁」**と表されることが多い。
ex)H₁:「渡されたのは不正なコインである」
##2.仮説を検定するための「確率」を求める
渡されたコインが普通のコインであった場合、「2枚とも裏」が2回起こる確率は次のようになる。
P値…帰無仮説が正しいとした仮定とき、観測した事象よりも極端なことが起こる確率のこと。
ex)コインの問題では、P値=6.25%
##3.判断基準を元に結論を導く
結論を確定させるために**「“滅多に起こらない”と判断する確率の基準」を設定する。例えばこの基準を「10%」と設定**すると、10%以下の確率で起こる事象については「滅多にないこと」であるため、「仮説が間違っている」と判断される。逆に、10%以上の確率で起こる事象については、「滅多にないことではない=許容できる範囲」となるため、「仮説が間違っているとは言えない」と判断される。
この問題では、**仮説を「渡されたコインは普通のコインである」**とし、観測した事象が起こる確率は6.25%だった。6.25%は判断基準10%より小さいため「渡されたコインは普通のコインであるとは考えられない」という結論を導くことができる。
有意水準…帰無仮説を棄却するための基準となる確率。この数値は検定を行う前に決めておく必要がある。危険率と呼ばれることもある。
**α(アルファ)**で表され、5%(0.05)や1%(0.01)といった値がよく使われる。
言い換えると、「極めて珍しいことが起こった」あるいは「何かしら意味があることである(=”有意である”)」ということを表す。
ex)コインの問題では、「“滅多にない”と判断する確率の基準」がこの有意水準。
しかし、P値が5%以下となったとしても本当に偶然まれな事象が起こった場合もあるので、有意水準αは「本当は帰無仮説H₀が正しいのに、誤ってを棄却してしまう確率」とも言える。この**「本当は帰無仮説H₀が正しいのに、誤ってを棄却してしまうこと」を「第1種の過誤」**といい、は「第1種の過誤を犯す確率」とも呼ばれる。
検出力…有意水準αと対するもの!検出力は1-βで表されるもので、**「帰無仮説H₀が正しくないときに、正しくを棄却する確率」のこと。このβは「第2種の過誤の確率」を表しす。第2種の過誤の確率とは「対立仮説H₁が正しいときに、誤って帰無仮説H₀を棄却しない確率」**のこと。
棄却…仮説を捨てること。P値が有意水準よりも小さい時は、帰無仮説を捨て対立仮説を採択します。すなわち、対立仮説が正しいと結論付けられます。コインの問題では、基準である「10%」と観測した事象の起こる確率「6.25%」を比べた結果、「6.25%」が「10%」より小さいことが分かりました。このとき、帰無仮説「渡されたコインは普通のものである」を「棄却」し、対立仮説「渡されたのは不正なコインである」を採択します。
#注意
##結論
導かれた結論は**「絶対に正しい」と考えることはできない!**
なぜなら、「滅多にないことである」と結論付けられたとしても、6.25%という確率は「仮説が正しくても、16回に1回は起こってもおかしくない」出来事であるとも考えられるからだ。
##判断基準
「滅多にない」とする基準は先に決めておかなくてはならない!
なぜなら、6.25%という確率を知った後で「滅多にない」基準を設定すると、例えば次のような恣意的な誘導ができるからだ。すなわち、後出しじゃんけんのように自由に結論を変えることができるからだ。
##P値 > 有意水準
P値が有意水準よりも大きい時は、**帰無仮説は棄却されない。これは帰無仮説が正しいと結論づけて良いということを意味しない。検定で用いられる方法は「背理法」**なので、「帰無仮説が棄却されない」ことは「帰無仮説が正しいと結論づけて良い」ということにはならない。この場合、「対立仮説が正しいと結論づけることはできない」ということしか言えない。