概要
母比率の仮説検定は、母集団における割合(比率)がある値と異なるかどうかを検定する方法です。
- 帰無仮説(H₀: null hypothesis):現在の前提・仮定(例:母比率 $p = p_0$)
- 対立仮説(H₁: alternative hypothesis):帰無仮説と異なる仮定(例:$p \neq p_0, p > p_0, p < p_0$)
- 検定量(Z)を算出し、標準正規分布表の棄却域に入るか、もしくは p値で判断する。
仮設検定における各分布の使用判断フロー
数式
仮説の立て方
- 両側検定(母比率がある値と異なるか?)
$$
H_0: p = p_0 \quad \text{vs} \quad H_1: p \neq p_0
$$
- 片側検定(上側)(母比率が大きいか?)
$$
H_0: p = p_0 \quad \text{vs} \quad H_1: p > p_0
$$
- 片側検定(下側)(母比率が小さいか?)
$$
H_0: p = p_0 \quad \text{vs} \quad H_1: p < p_0
$$
検定統計量(正規近似)
標本比率 $\hat{p} = X/n$ を用いて計算:
$$
Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0 (1-p_0)}{n}}}
$$
- $X$:成功の数
- $n$:標本サイズ
- $p_0$:帰無仮説での母比率
p値について
- p値とは、帰無仮説が正しいとした場合に、実際に観測された統計量以上の差が生じる確率。
- p値 < 有意水準 $\alpha$ の場合、H₀を棄却。
- 両側検定では、左右両端の確率を合計して p値を求める。
問題例
問題1(両側検定・標準正規近似)
ある工場で製品が不良品である割合は $p_0 = 0.10$ とされている。
100個の製品を調べたところ、不良品が 15 個あった。
有意水準 5% で「不良品率は 10% と異なる」といえるか?
解き方
- 仮説の設定:
$$
H_0: p = 0.10, \quad H_1: p \neq 0.10
$$
- 標本比率:
$$
\hat{p} = \frac{15}{100} = 0.15
$$
- 検定量:
$$
Z = \frac{0.15 - 0.10}{\sqrt{0.10 \cdot 0.90 / 100}} = \frac{0.05}{0.03} \approx 1.67
$$
-
棄却域:
両側 5% → $z_{0.025} = 1.96$ -
判定:
$Z = 1.67 < 1.96$ → H₀を棄却できない。
不良品率は 10% と有意に異なるとは言えない。 -
p値(標準正規表から計算):
$$
p\text{-value} = 2 \cdot P(Z > 1.67) \approx 2 \cdot 0.0475 = 0.095
$$
p値 = 0.095 > 0.05 → H₀を棄却できない。
問題2(片側検定・標準正規近似)
あるアンケートで「満足」と答える人の割合が 60% とされている。
50人に調査したところ 35人が「満足」と答えた。
有意水準 5% で「満足率は 60% より大きい」と言えるか?
解き方
- 仮説の設定:
$$
H_0: p = 0.60, \quad H_1: p > 0.60
$$
- 標本比率:
$$
\hat{p} = \frac{35}{50} = 0.70
$$
- 検定量:
$$
Z = \frac{0.70 - 0.60}{\sqrt{0.60 \cdot 0.40 / 50}} = \frac{0.10}{0.0693} \approx 1.44
$$
-
棄却域:
片側 5% → $z_{0.05} = 1.645$ -
判定:
$Z = 1.44 < 1.645$ → H₀を棄却できない。
満足率は 60% より有意に大きいとは言えない。 -
p値(標準正規表から計算):
$$
p\text{-value} = P(Z > 1.44) \approx 0.075
$$
p値 = 0.075 > 0.05 → H₀を棄却できない。
問題3(母比率の差の検定・二標本・両側検定・標準正規近似)
ある市の2つの学校で、朝食を毎日食べる生徒の割合を比較したい。
- 学校A:生徒 80 人中 56 人が朝食を毎日食べる
- 学校B:生徒 70 人中 42 人が朝食を毎日食べる
有意水準 5% で「学校Aと学校Bで朝食を毎日食べる割合に差がある」と言えるか?
解き方
- 仮説の設定(両側検定):
$$
H_0: p_A = p_B, \quad H_1: p_A \neq p_B
$$
- 標本比率:
$$
\hat{p}_A = \frac{56}{80} = 0.70, \quad \hat{p}_B = \frac{42}{70} = 0.60
$$
- 帰無仮説の下でのプールされた比率:
$$
\hat{p} = \frac{56 + 42}{80 + 70} = \frac{98}{150} \approx 0.653
$$
- 標準誤差:
$$
SE = \sqrt{\hat{p}(1-\hat{p}) \left(\frac{1}{n_A} + \frac{1}{n_B}\right)}
= \sqrt{0.653 \cdot 0.347 \left(\frac{1}{80} + \frac{1}{70}\right)} \approx 0.079
$$
- 検定統計量:
$$
Z = \frac{\hat{p}_A - \hat{p}_B}{SE} = \frac{0.70 - 0.60}{0.079} \approx 1.27
$$
-
棄却域:
両側 5% → $z_{0.025} = 1.96$ -
判定:
$Z = 1.27 < 1.96$ → H₀を棄却できない。
学校Aと学校Bの朝食を毎日食べる割合に有意な差はないと結論できる。 -
p値(標準正規表から計算):
$$
p\text{-value} = 2 \cdot P(Z > 1.27) \approx 2 \cdot 0.102 = 0.204
$$
p値 = 0.204 > 0.05 → H₀を棄却できない。