0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

統計検定準1級・第10章の勉強したことをまとめた

Posted at

検定法の導出

 確率変数 $X$ の母集団分布が正規分布 $N(\mu, \sigma^2)$ であり, 母分散 $\sigma^2$ を既知として, 母平均 $\mu$ が $\mu_0$ ではないということを検証する.
 帰無仮説を母平均 $\mu$ が $\mu_0$ である. 対立仮説を$\mu$ が $\mu_0$ でないとする.

$$
H_0 : \mu = \mu_0, H_1 : \mu \neq \mu_0
$$

 互いに独立な確率変数 $X_1,...,X_n$ の標本平均 $\bar{X}$ は正規分布 $N(\mu, \sigma^2/n)$ に従うことから, 統計量 $Z = \frac {\bar{X} - \mu} {\sqrt{\sigma^2/n}}$ は標準正規分布に従う. ここで帰無仮説が正しいとすると, 統計量 $Z_0 = \frac {\bar{X} - \mu_0} {\sqrt{\sigma^2/n}}$ は標準正規分布に従う. この統計量 $Z_0$ は検定統計量と呼ばれる.

検定の過誤

第一種の過誤 ($\alpha$)
帰無仮説 $H_0$ が正しいのに、帰無仮説を棄却してしまう誤り

第二種の過誤 ($\beta$)
対立仮説 $H_1$ が正しいのに、帰無仮説を受容してしまう誤り

検出力 ($1 - \beta$)
対立仮説 $H_1$ が正しいもとで、正しく帰無仮説を棄却する確率

サンプルサイズ設計

検出力.PNG

(図の出典 : https://a-m-zyozo.hatenablog.com/entry/2020/09/10/132204)

第1種と第2種の過誤の関係

 有意水準 α を小さくすると検出力 β は大きくなる. つまり, 第一種の過誤が増えるが, 第二種の過誤は減る.
 逆に, 有意水準 α を大きくすると検出力 β は小さくなる. つまり, 第一種の過誤が減るが, 第二種の過誤は増える.
 つまり, α と β はトレードオフの関係にある.

サンプルサイズの導出

 帰無仮説 $H_0$ のもとで検定統計量 $Z_0$ の分布は標準正規分布 $N(0,1)$ でああった.
 一方, 真の母平均 $\mu$ が対立仮説 $H_1$ の $\mu_1$ が正しいとすると, 検定統計量 $Z_0$ の期待値と分散は以下のようになる.

$$
E[Z_0] = E \bigg[ \frac {\bar{X} - \mu_0} {\sqrt{\sigma^2/n}}\bigg] = \frac {E[\bar{X}] - \mu_0} {\sqrt{\sigma^2/n}} = \frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}
$$

$$
V[Z_0] = V \bigg[ \frac {\bar{X} - \mu_0} {\sqrt{\sigma^2/n}}\bigg] = \frac {n} {\sigma^2} V[\bar{X} - \mu_0] = \frac {n} {\sigma^2} \frac{\sigma^2} {n} = 1
$$

よって, 検定統計量 $Z_0$ の分布は正規分布 $N(\frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}, 1)$ となる.

 2 つの分布の平均の差は, $\frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}} - 0 = \frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}$ である. 表より, この差は棄却域と検出力の和である.

 帰無仮説のもとで, 検定統計量 $Z_0$ は標準正規分布 $N(0,1)$ に従うので, 片側有意水準 2.5% のときの棄却限界地は 1.96 となる. 一方で対立仮説のもとでは, 検定統計量 $Z_0$ の平均は0とは異なるものの, 分散は1である. したがって, 標準正規分布の表を参照することができ, 第二種の過誤の確率 $\beta=0.2$ に相当する正規分布表の値は0.84となる.

よって,

$$
1.96 + 0.84 = \frac {\mu_1 - \mu_0} {\sqrt{\sigma^2/n}}
$$

$$
n = \frac {(1.96 + 0.84)^2} {(\frac {\mu_1 - \mu_0} {\sigma})^2}
$$

サンプルサイズと第1種と第2種の過誤の関係

 対立仮説の正規分布の期待値に注目すると, $\mu_1$ と $\mu_0$ が離れれば、二つの正規分布は離れていく. また分母より, サンプルサイズが大きくなると期待値が大きくなるので、二つの正規分布は離れていく.
 したがって, $\alpha$ 固定すれば, サンプルサイズを増やすごとに検出力は大きくなる. つまり、ある程度サンプルサイズを増やすことができれば, H_1が正しいもとで、対立仮説を正しいと判断する確率を一定以上にできる.
 例えば, 検出力80%の意味は「治療間で違いがあるときに, 10回の試験のうち8回は有意差が出る」ことを意味するが, サンプルサイズの設計によりこれを達成できる. これがサンプルサイズ設計の目的である.

例題

問10.1
[1]
帰無仮説 $H_0 : p_0 = 0.45$ のもとで, $n$ が大きいとき, 標本支持率 $\hat{p}$ は近似的に正規分布 $N(0.45, (0.45 \times 0.55)/n$ に従うため, 有意水準 5% の両側検定で $n=600$ のとき, 右側の棄却限界域 $c$ は,

$$
c = 0.45 + 1.96 \times \sqrt {\frac {0.45 \times 0.55} {600}} = 0.4898
$$

となる. 対立仮説 $H_1 : p_0 =0.50$ のもとで, $\hat{p}$ は近似的に正規分布 $N(0.50, (0.50 \times 0.50)/n$ に従う. 検出力は, この $\hat{p}$ について $P(\hat{p} \geq c)$ である. 標準化

$$
Z = \frac {\hat{p} - 0.50} {\sqrt {\frac {0.50 \times 0.50} {0.50}}}
$$

を行うことで,

$$
P(\hat{p} \geq c) = P(Z \geq -0.4997) = 1 - P(Z \geq 0.4997)
$$

よって標準正規分布表より, 検出力は0.6915である.

[2]
標準正規分布表より, $z_{0.80} = - z_{0.20} = -0.84$ であるから,

$$
0.45 + 1.96 \times \sqrt {\frac {0.45 \times 0.55} {n}} = 0.50 - 0.84 \times \sqrt {\frac {0.50 \times 0.50} {n}}
$$

これを解くと, $n = 778.51$ となり, 必要な標本サイズは $779$ である.

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?