基礎
P値 = 確率(0〜1)
- P値:分布の積分面積(観測統計量以上が起こる確率)
$$
P値<α⇒棄却
$$ - 右側片側検定 → 右側の面積が 0.05(と比較)
- 両側検定 → 左右合計の面積が 0.05(と比較)
検定統計量(Z, t)
- 分布上の位置(x軸の値)
- 有意水準 α の棄却・否棄却判断に使用
$$
Z, t>t_(0.95)⇒棄却
$$
検定統計量(F, χ²)
- 常に右側のみ(非対称分布)
- 有意水準 α の棄却・否棄却判断に使用
$$
F < \frac{1}{F_{1-\alpha/2}(df_2, df_1)}
\quad \text{または} \quad
F > F_{1-\alpha/2}(df_1, df_2)
⇒ 棄却
$$
$$
χ² > χ²_(0.95) ⇒ 棄却
$$
p値の導出
検定統計量 → 分布表 → p値
片側:そのまま
両側:絶対値を取って $×2$
p値 → 分布表 → 検定統計量
片側:$p$ をそのまま使う
両側:$p$ を $2$ で割る
検定一覧
| 種類 | 検定統計量 | 分布 | 検定方向 |
|---|---|---|---|
| 基本定義 | $\displaystyle Z=\frac{X-\mu}{\sigma}$ | 標準正規分布 $N(0,1)$ | |
| 平均の検定 - 母分散既知(1標本Z検定) |
$\displaystyle Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}$ | 標準正規分布 $N(0,1)$ | 両側/片側 |
| t分布の基本定義 | $\displaystyle t=\frac{Z}{\sqrt{U/\nu}}$ ($Z\sim N(0,1),\ U\sim\chi^2(\nu)$ 独立) |
t分布 $(\nu)$ | |
| 平均の検定 - 母分散未知(1標本t検定) |
$\displaystyle t=\frac{\bar{X}-\mu_0}{s/\sqrt{n}}$ | t分布 $(n-1)$ | 両側/片側 |
| 2標本平均の検定 - 母分散既知 |
$\displaystyle Z=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}}$ | 標準正規分布 $N(0,1)$ | 両側/片側 |
| 2標本平均の検定 - 母分散未知(Welch) |
$\displaystyle t=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}}$ | $t(\nu)$分布 Welchの自由度 |
両側/片側 |
| 2標本平均の検定 - 母分散未知・等分散(Student) |
$\displaystyle t=\frac{\bar{X}_1-\bar{X}_2}{s_p\sqrt{1/n_1+1/n_2}}$ ただし $\displaystyle s_p^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}$ |
$t$分布 $(n_1+n_2-2)$ |
両側/片側 |
| 2標本平均の検定 - 等分散Student(展開形) |
$\displaystyle t=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\left(\frac{1}{n_1}+\frac{1}{n_2}\right)\frac{\sum(X_1i-\bar{X}_1)^2+\sum({X}_2i-\bar{X}_2)^2}{n_1+n_2-2}}}$ | $t$分布 $(n_1+n_2-2)$ |
両側/片側 |
| 比率の検定(1標本Z検定) | $\displaystyle Z=\frac{\hat{p}-p_0}{\sqrt{p_0(1-p_0)/n}}$ | 標準正規分布 $N(0,1)$ | 両側/片側 |
| 2標本比率のZ検定 | $\displaystyle Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\hat{p}_1(1-\hat{p}_1)/n_1+\hat{p}_2(1-\hat{p}_2)/n_2}}$ | 標準正規分布 $N(0,1)$ | 両側/片側 |
| 等分散性の検定 | $\displaystyle F=\frac{s_1^2}{s_2^2}$ | F分布 $F(n_1-1, n_2-1)$ | 両側/片側 |
| 適合度の検定 | $\displaystyle \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$ | $\chi^2(k-1-c)$ | 右片側 |
| 同等性の検定 | $\displaystyle \chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}}$ | $\chi^2((r-1)(c-1))$ | 右片側 |
| 独立性の検定 | $\displaystyle \chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}}$ | $\chi^2((r-1)(c-1))$ | 右片側 |
迷いやすい帰無仮説
| 検定の種類 | 帰無仮説 (H_0) | 対立仮説 (H_1) |
|---|---|---|
| 等分散性の検定 | 母分散はすべて等しい | 少なくとも1つの母分散が異なる |
| 適合度検定 | データは理論分布に従う | データは理論分布に従わない |
| 同等性検定 | 各母集団は同じ分布に従う | 各母集団の分布は異なる |
| 独立性検定 | 2つの変数は独立である | 2つの変数は独立でない(関連がある) |
迷いやすい自由度
適合度検定
| モデル | パラメータ | $c$ | 自由度 $k-c-1$ |
備考 |
|---|---|---|---|---|
| 多項分布 (カテゴリ確率既知) |
$p_1,\dots,p_k$ | 0 | k - 1 | 例:1等20%、2等30%、ハズレ50% |
| 二項分布 | $p$ | 1 | k - 2 | pを標本から推定 |
| ポアソン分布(λ 既知) | $λ$ | 0 | k - 1 | 理論 λ が与えられている場合 |
| ポアソン分布(λ 推定) | $λ$ | 1 | k - 2 | λ をデータから推定する場合 |
| 正規分布 | $μ, σ²$ | 2 | k - 3 | μ と σ² を両方推定 |
- $k:カテゴリの数$
- $c:パラメータの数$