検定法の導出
確率変数 $X$ の母集団分布が正規分布 $N(\mu, \sigma^2)$ であり, 母分散 $\sigma^2$ を既知として, 母平均 $\mu$ が $\mu_0$ ではないということを検証する.
帰無仮説を母平均 $\mu$ が $\mu_0$ である. 対立仮説を$\mu$ が $\mu_0$ でないとする.
$$
H_0 : \mu = \mu_0, H_1 : \mu \neq \mu_0
$$
互いに独立な確率変数 $X_1,...,X_n$ の標本平均 $\bar{X}$ は正規分布 $N(\mu, \sigma^2/n)$ に従うことから, 統計量 $Z = \frac {\bar{X} - \mu} {\sqrt{\sigma^2/n}}$ は標準正規分布に従う. ここで帰無仮説が正しいとすると, 統計量 $Z_0 = \frac {\bar{X} - \mu_0} {\sqrt{\sigma^2/n}}$ は標準正規分布に従う. この統計量 $Z_0$ は検定統計量と呼ばれる.
検定の過誤
第一種の過誤 ($\alpha$)
帰無仮説 $H_0$ が正しいのに、帰無仮説を棄却してしまう誤り
第二種の過誤 ($\beta$)
対立仮説 $H_1$ が正しいのに、帰無仮説を受容してしまう誤り
検出力 ($1 - \beta$)
対立仮説 $H_1$ が正しいもとで、正しく帰無仮説を棄却する確率
サンプルサイズ設計
(図の出典 : https://a-m-zyozo.hatenablog.com/entry/2020/09/10/132204)
第1種と第2種の過誤の関係
有意水準 α を小さくすると検出力 β は大きくなる. つまり, 第一種の過誤が増えるが, 第二種の過誤は減る.
逆に, 有意水準 α を大きくすると検出力 β は小さくなる. つまり, 第一種の過誤が減るが, 第二種の過誤は増える.
つまり, α と β はトレードオフの関係にある.
サンプルサイズの導出
帰無仮説 $H_0$ のもとで検定統計量 $Z_0$ の分布は標準正規分布 $N(0,1)$ でああった.
一方, 真の母平均 $\mu$ が対立仮説 $H_1$ の $\mu_1$ が正しいとすると, 検定統計量 $Z_0$ の期待値と分散は以下のようになる.
$$
E[Z_0] = E \bigg[ \frac {\bar{X} - \mu_0} {\sqrt{\sigma^2/n}}\bigg] = \frac {E[\bar{X}] - \mu_0} {\sqrt{\sigma^2/n}} = \frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}
$$
$$
V[Z_0] = V \bigg[ \frac {\bar{X} - \mu_0} {\sqrt{\sigma^2/n}}\bigg] = \frac {n} {\sigma^2} V[\bar{X} - \mu_0] = \frac {n} {\sigma^2} \frac{\sigma^2} {n} = 1
$$
よって, 検定統計量 $Z_0$ の分布は正規分布 $N(\frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}, 1)$ となる.
2 つの分布の平均の差は, $\frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}} - 0 = \frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}$ である. 表より, この差は棄却域と検出力の和である.
帰無仮説のもとで, 検定統計量 $Z_0$ は標準正規分布 $N(0,1)$ に従うので, 片側有意水準 2.5% のときの棄却限界地は 1.96 となる. 一方で対立仮説のもとでは, 検定統計量 $Z_0$ の平均は0とは異なるものの, 分散は1である. したがって, 標準正規分布の表を参照することができ, 第二種の過誤の確率 $\beta=0.2$ に相当する正規分布表の値は0.84となる.
よって,
$$
1.96 + 0.84 = \frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}
$$
$$
n = \frac {(1.96 + 0.84)^2} {(\frac {\mu_1 - \mu_0} {\sigma})^2}
$$
サンプルサイズと第1種と第2種の過誤の関係
対立仮説の正規分布の期待値に注目すると, $\mu_1$ と $\mu_0$ が離れれば、二つの正規分布は離れていく. また分母より, サンプルサイズが大きくなると期待値が大きくなるので、二つの正規分布は離れていく.
したがって, $\alpha$ 固定すれば, サンプルサイズを増やすごとに検出力は大きくなる. つまり、ある程度サンプルサイズを増やすことができれば, H_1が正しいもとで、対立仮説を正しいと判断する確率を一定以上にできる.
例えば, 検出力80%の意味は「治療間で違いがあるときに, 10回の試験のうち8回は有意差が出る」ことを意味するが, サンプルサイズの設計によりこれを達成できる. これがサンプルサイズ設計の目的である.
例題
問10.1
[1]
帰無仮説 $H_0 : p_0 = 0.45$ のもとで, $n$ が大きいとき, 標本支持率 $\hat{p}$ は近似的に正規分布 $N(0.45, (0.45 \times 0.55)/n$ に従うため, 有意水準 5% の両側検定で $n=600$ のとき, 右側の棄却限界域 $c$ は,
$$
c = 0.45 + 1.96 \times \sqrt {\frac {0.45 \times 0.55} {600}} = 0.4898
$$
となる. 対立仮説 $H_1 : p_0 =0.50$ のもとで, $\hat{p}$ は近似的に正規分布 $N(0.50, (0.50 \times 0.50)/n$ に従う. 検出力は, この $\hat{p}$ について $P(\hat{p} \geq c)$ である. 標準化
$$
Z = \frac {\hat{p} - 0.50} {\sqrt {\frac {0.50 \times 0.50} {0.50}}}
$$
を行うことで,
$$
P(\hat{p} \geq c) = P(Z \geq -0.4997) = 1 - P(Z \geq 0.4997)
$$
よって標準正規分布表より, 検出力は0.6915である.
[2]
標準正規分布表より, $z_{0.80} = - z_{0.20} = -0.84$ であるから,
$$
0.45 + 1.96 \times \sqrt {\frac {0.45 \times 0.55} {n}} = 0.50 - 0.84 \times \sqrt {\frac {0.50 \times 0.50} {n}}
$$
これを解くと, $n = 778.51$ となり, 必要な標本サイズは $779$ である.