はじめに
統計学で母比率・母平均の検定を行う際、しばしば混乱しやすいポイントとして「帰無仮説の値 ( p_0 )(または ( \mu_0 ))と標本値 ( \hat{p} )(または ( \bar{x} ))の位置」および「検定統計量の符号(プラス・マイナス)」の扱いがある.
本記事では,母比率・母平均・母分散の検定における符号の意味,式の入れ替えの可否,そして分布表を使う際の正しい見方を整理する.
1. 母比率の検定における符号の扱い
基本公式
母比率の検定統計量は,標本比率 (\hat{p}),母比率の仮定値 (p_0),標本サイズ (n) に対して次のように定義される.
$$
z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}}
$$
入れ替えた場合
順序を逆にすると,
$$
z' = \frac{p_0 - \hat{p}}{\sqrt{p_0(1-p_0)/n}} = -z
$$
となり,符号が反転するだけである.
絶対値 (|z|) は同じであり,検定結果(p値や棄却・採択の判断)には影響しない.
検定方向と式の向き
| 検定の種類 | よく使われる式 | z の符号 | 意味 |
|---|---|---|---|
| 右側検定(( p > p_0 )) | ( z = \frac{\hat{p} - p_0}{SE} ) | 正 | 標本比率が大きいほど右側棄却域 |
| 左側検定(( p < p_0 )) | ( z = \frac{p_0 - \hat{p}}{SE} ) | 負 | 標本比率が小さいほど左側棄却域 |
| 両側検定 | どちらでも可 | ±両側 | 絶対値で判断 |
したがって,(p_0) と (\hat{p}) の順序を入れ替えても問題はない.
検定の方向に合わせて z の符号をわかりやすくするために入れ替えることがある.
2. 母平均の検定でも同様
母平均の場合も同様である.
標本平均 (\bar{x}),母平均の仮定値 (\mu_0),標本サイズ (n),母標準偏差 (\sigma) に対して:
$$
z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}
$$
順序を入れ替えると,
$$
z' = \frac{\mu_0 - \bar{x}}{\sigma / \sqrt{n}} = -z
$$
やはり符号が反転するだけである.
| 検定の種類 | よく使う形 | 備考 |
|---|---|---|
| 右側検定(平均が大きい) | ( z = \frac{\bar{x} - \mu_0}{SE} ) | (z > 0) が棄却域 |
| 左側検定(平均が小さい) | ( z = \frac{\mu_0 - \bar{x}}{SE} ) | (z < 0) が棄却域 |
| 両側検定 | 絶対値で判断 | z の符号は無関係 |
母平均の検定でも,符号が逆転しても検定結果は変わらない.
3. 母分散の検定の場合
母分散の検定ではカイ二乗統計量を用いる.
$$
\chi^2 = \frac{(n-1)s^2}{\sigma_0^2}
$$
この式には「差」ではなく「比」が使われているため,符号(+/−)の概念がない.
したがって,「入れ替え」や「符号反転」という発想自体が不要である.
| 検定の種類 | 棄却域 | 備考 |
|---|---|---|
| 右側検定(母分散が大きい) | 右側の χ²値以上 | 大きい方が棄却域 |
| 左側検定(母分散が小さい) | 左側の χ²値以下 | 小さい方が棄却域 |
母分散の検定では符号の問題は生じない.
4. 分布表を使うときの符号の扱い
標準正規分布・t分布の性質
これらの分布は左右対称である.
$$
P(Z > a) = P(Z < -a)
$$
したがって,z が正でも負でも,確率(p値)は同じである.
実際の使い方
| 検定の種類 | 分布表での扱い | 方法 | ||
|---|---|---|---|---|
| 右側検定 | ( P(Z > z) ) | 表の値をそのまま使用する. | ||
| 左側検定 | ( P(Z < z) ) | ( P(Z < -z) = P(Z > | z | ) ) を使う. |
| 両側検定 | ( 2P(Z > | z | ) ) | 絶対値を使って両側を考慮する. |
したがって,表が右側確率しか載っていない場合でも,z の絶対値を使えばよい.
具体例
標準正規分布表が右側確率を示している場合:
| z | P(Z > z) |
|---|---|
| 1.65 | 0.05 |
| 1.96 | 0.025 |
| 2.33 | 0.01 |
左側検定で ( z = -1.65 ) となっても,
$$
P(Z < -1.65) = P(Z > 1.65) = 0.05
$$
となるため,符号を気にせず絶対値で表を引けばよいのである.
5. まとめ
zやtの符号は方向を示すだけである.
分布表を使う際は 絶対値を取って右側確率表から読めばよい.
母比率・母平均では符号が反転しても結果は変わらず,母分散ではそもそも符号の概念が存在しない.
| 検定対象 | 符号を入れ替えると | 検定結果に影響するか | 備考 |
|---|---|---|---|
| 母比率 | z の符号が反転 | 影響なし | 左右どちらの検定かに応じて使い分ける |
| 母平均 | z の符号が反転 | 影響なし | 同様に方向だけが変わる |
| 母分散 | 変化なし(比) | 影響なし | カイ二乗分布は非対称だが符号概念なし |
| 分布表 | z の絶対値を使えばよい | 安全 | 対称性により符号の影響なし |
おわりに
符号の扱いに悩むのは,統計を学ぶ上で誰もが一度は通る道である.
本質的には「符号は方向の指標にすぎない」という点を理解すれば,どの検定でも自信をもって分布表を扱うことができる.
ポイント:
- zやtは絶対値で考えること.
- 棄却域の方向を明確にすること.
- 分布表は右側確率表1枚あれば十分である.