はじめに
初の「学生対抗アドベントカレンダー」として投稿する。
統計学の初学者が最初に理解に苦しむであろう統計学的仮説検定の初歩的な説明の記事である。
"学生対抗"ということだが、今回の記事はいくらかQiita利用者の学生諸君に有用な記事になるかと思う。
なぜなら、学生が統計学を勉強することは役に立つことが多いからである。
大学院生ならば研究活動においては役に立つ場面も多いだろうし、そうでなくとも、流行りのデータサイエンスで就職したい人には、統計学はまずもって必須な知識となる。
仮説検定を一度でも勉強した経験のある人(あるいは初学者でもお手元のテキストの仮説検定の章を参照しながら)であれば10分もかからずに読める記事になっているので、是非ご覧になっていってください。
概要
この記事は、Z検定と棄却域の作り方にフォーカスした、統計学的仮説検定の初歩的な説明の記事である。
統計学の理論から仮説検定の実践の間の溝を少なく自然な理解が得られることを目指して、わざと独特な論法を取ることにした。しかし、力及ばず、多少物議を醸す議論になっている可能性がある。そう感じた場合は、ぜひ、コメント欄にて忌憚なき意見を伺いたい。
理論
z検定とは、仮説検定方式の一種。
(仮説検定方式とは、標本空間 $\mathcal{X}$を棄却域$R = \lbrace x | H_0を棄却 \rbrace $と受容域$A = \lbrace x | H_0を受容 \rbrace $に分割するルールのことをいう。)
Z検定は、上側Z検定、下側Z検定、両側Z検定の三種類に分けられる。
上側Z検定は、以下のルール要件からなる仮説検定方式である:
- 「第一の誤信の確率(有意水準)」と「標準正規分布(Z分布)の上側確率」を同一視する
下側Z検定は、
- 「第一の誤信の確率(有意水準)」と「標準正規分布(Z分布)の下側確率」を同一視する
両側Z検定は、
- 「第一の誤信の確率(有意水準)」と「標準正規分布(Z分布)の上側確率」$\times 2$を同一視する
標準正規分布の上側パーセント点の値はよく知られているので、その値と上記の分割ルール要件を使って棄却域の境界を逆算すればよい.
例題
品種Aの芋虫のサナギ化直前の体長$X_i$ ($i=1,2,\dots$)が、正規分布$N(\mu, 0.64)$(母分散が既知)に従うとして、その母平均$\mu$について、$\mu = 6$(cm)かそれより小さいかの検定は、以下の構図となる:
帰無仮説$H_0: \mu = 6$ vs 対立仮説$H_1: \mu < 6$
また、ランダムサンプリングの標本サイズは$n=10$であるとする。
(1)この時、有意水準(第一の誤信の確率)を0.05としたときの棄却域を求めよ.
(2)得られた棄却域からいえることは何か?
(3)標本サイズ10でランダムサンプリングしたところ、以下の観測値が得られた:
1.2, 3.5, 6.3, 5.5, 3.6, 6.8, 4.2, 2.5, 7.0 3.2 (cm)
このとき、帰無仮説は棄却されるか?
(1)の解答
有意水準を$0.05$に設定する。
$
\begin{align}
P(X \in R|H_0が正しい) =0.05\
\end{align}
$
これは下側の片側検定であるから、下側Z検定のルールより、「第一の誤信の確率(有意水準)」と「標準正規分布(Z分布)の下側確率」を同一視する:
$
\begin{align}
0.05 = P(X \in R|H_0が正しい) = P(Z < c) \
\end{align}
$
ただし、下側確率が$0.05$の時の下側パーセント点の値を$c$と置いた。
ここで、標準正規分布において下側確率が$0.05$の時の下側パーセント点の値は$-1.645$であることが知られている(持っている統計学の教科書の巻末の標準正規分布表を見よ)ことから、$c = -1.645$と定まる。
よって、
$
\begin{align}
P(X \in R|H_0が正しい) = P(Z < -1.645)
\end{align}
$
ここで、$X_i \sim N(\mu,0.64)$を思い出すと、$ T_{\mu} = T(\vec{X};\mu) =\sqrt{10}(\bar{X}-\mu)/0.8 \sim N(0,1)$である。(ただし$\bar{X} = \frac{X_{1} + \dots + X_{10} }{10}$)
また、領域$R_{T_{\mu}}$を以下の同値関係を満たすように新たに定める:
$
\begin{align}
X \in R \Leftrightarrow T_{\mu} =\sqrt{10}(\bar{X}-\mu)/0.8 \in R_{T_{\mu}}
\end{align}
$
(単に領域に四則演算の連続を施して平行移動、伸び縮みさせているだけなので、一意に定まるとしてよい)
すると、
$
\begin{align}
P(Z < -1.645) &= P(X \in R|H_0が正しい) \\
&=P((T_{\mu} \in R_{T_{\mu}} |\mu = 6 ) \\
&= P(T_{\mu = 6} \in R_{T_{\mu =6}})
\end{align}
$
$T_{\mu = 6} \sim Z \sim N(0,1)$なので、上の等式から、$R_{T_{\mu=6}} = (-\infty,-1.645]$としてよい。
よって、
$
\begin{align}
X \in R &\Leftrightarrow T_{\mu=6} =\sqrt{10}(\bar{X}-6)/0.8 \in R_{T_{\mu=6}}\\
& \Leftrightarrow \sqrt{10}(\bar{X}-6)/0.8 \leq -1.645 \\
& \Leftrightarrow \bar{X} \leq -1.645 \times 0.8/ \sqrt{10} + 6 = 5.584 \\
& \Leftrightarrow X \in \lbrace x \in \mathcal{X} | \bar{x} \leq 5.584 \rbrace
\end{align}
$
よって、棄却域は、
$
\begin{align}
R = \lbrace x \in \mathcal{X} | \bar{x} \leq 5.584 \rbrace
\end{align}
$
である。ちなみに、受容域は、その定義から
$A=\lbrace x \in \mathcal{X} | \bar{x} > 5.584 \rbrace$
である。
(2)の解答
(1)で得られた棄却域より、
サイズ10でランダムサンプリングしたデータの標本平均を取ったときに、
その値が5.584cm より大きい場合は棄却しない。
つまり、6cmより多少小さくても、それが0.4cm程度小さいくらいなら、ほぼ6cmに一致している、と判定する。
(3)の解答
得られたデータから標本平均(実現値)を計算すると、$\bar{x} = 4.38$であり、これは棄却の条件$\bar{X} \leq 5.584$をみたすので、帰無仮説$H_0 :\mu = 6$は棄却される。