概要
カイ2乗分布(χ²分布)は、統計学において 母分散の推定や検定、適合度検定、独立性の検定 に広く使われる分布です。
また、正規分布・t分布・F分布 と密接な関係を持ちます。
- 正規分布との関係:標準正規分布の2乗和がχ²分布に従う
- t分布との関係:標準正規分布とχ²分布の比から導出
- F分布との関係:2つのχ²分布を自由度で割った比がF分布
仮説検定における各分布の使用判断フロー
数式と定義
カイ2乗分布の定義
標準正規分布 $Z \sim N(0,1)$ の二乗和を考えると:
$$
Q = Z_1^2 + Z_2^2 + \cdots + Z_k^2
$$
このとき、
$$
Q \sim \chi^2(k)
$$
となり、これを自由度 $k$ のカイ2乗分布といいます。
母分散の推定と検定
1. 母分散既知の場合
$$
Q = \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma^2} \sim \chi^2(n)
$$
2. 母分散未知の場合(標本分散)
$$
Q = \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)
$$
- 自由度が $n-1$ になる理由:標本平均 $\bar{X}$ を推定に使ったため。
F分布との関係
カイ2乗分布の比から F分布 が導かれます:
$$
F = \frac{(Q_1/k_1)}{(Q_2/k_2)} \sim F(k_1, k_2)
$$
ここで
- $Q_1 \sim \chi^2(k_1)$
- $Q_2 \sim \chi^2(k_2)$
問題例
問題 1. F分布を用いた確率計算
自由度 $(k_1, k_2) = (7, 5)$ の F分布 $F(7,5)$ において、
- 上側5%点を求めよ。
- 下側5%点を求めよ。
解法
-
設定
F分布の自由度は $df_1 = 7, df_2 = 5$。
求めたいのは$$
P(F > F_{0.05}) \quad \text{および} \quad P(F < F_{0.05})
$$ -
上側5%点をF分布表で確認
自由度 (7,5) 上側 5%点 ($F_{0.05}$) 上側 1%点 ($F_{0.01}$) F(7,5) 5.70 12.53 - よって、上側5%点は 5.70。
-
下側5%点を計算
F分布の性質より、下側5%点は逆数を利用して計算できる:$$
F_{0.95}(7,5) = \frac{1}{F_{0.05}(5,7)}
$$-
F分布表より $F_{0.05}(5,7) \approx 5.70$
-
よって下側5%点は
$$
F_{0.95}(7,5) \approx \frac{1}{5.70} \approx 0.175
$$
-
-
解釈
- 上側5%点: $F > 5.70 \implies P \approx 0.05$
- 下側5%点: $F < 0.175 \implies P \approx 0.05$
-
自由度 $(7,5)$ の F分布における上側・下側5%点はそれぞれ 5.70 と 0.175 である。
問題 2. 等分散性の検定
2つの独立標本 $X_1, X_2$ の母分散が等しいかを検定する。
標本分散が以下のとき:
- $s_1^2 = 25, ; n_1 = 16$
- $s_2^2 = 16, ; n_2 = 21$
有意水準 5% で、分散に差があるか検定せよ。
解法
-
検定統計量を計算:
標本分散 $s_1^2, s_2^2$ から得られるカイ二乗統計量は
$$
Q_1 = \frac{(n_1-1)s_1^2}{\sigma_1^2} \sim \chi^2(n_1-1), \quad
Q_2 = \frac{(n_2-1)s_2^2}{\sigma_2^2} \sim \chi^2(n_2-1)
$$です。
帰無仮説 $H_0: \sigma_1^2 = \sigma_2^2$ の下では、$\sigma_1^2 = \sigma_2^2 = \sigma^2$ と置けます。
すると F統計量は$$
F = \frac{Q_1/(n_1-1)}{Q_2/(n_2-1)}
= \frac{\frac{(n_1-1)s_1^2}{\sigma^2}/(n_1-1)}{\frac{(n_2-1)s_2^2}{\sigma^2}/(n_2-1)}
= \frac{s_1^2}{s_2^2}= \frac{25}{16} = 1.5625
$$ -
自由度を設定:
- 分子側:$n_1 - 1 = 15$
- 分母側:$n_2 - 1 = 20$
よって、
$$
F \sim F(15,20)
$$ -
検定範囲の確認:
-
検定の目的は「母分散が等しいかどうか」を確認する:
$$
H_0: \sigma_1^2 = \sigma_2^2 \quad \text{vs} \quad H_1: \sigma_1^2 \ne \sigma_2^2
$$ -
どちらの分散が大きいかは問題ではなく、単に差があるかどうかを検定したいため、両側検定となる。
-
-
棄却域を確認(両側検定, 有意水準 5%):
- 上側棄却点:$F_{0.975}(15,20) \approx 2.54$
- 下側棄却点:$F_{0.025}(15,20) \approx 0.39$
-
実際の統計量 $F = 1.56$ は 棄却域に含まれない。
-
帰無仮説 $H_0: \sigma_1^2 = \sigma_2^2$ を棄却できない。
参考リンク
- 統計WEB:カイ二乗分布
- 統計WEB:28-1. F分布
- とけたろうブログ:F分布【中学の数学からはじめる統計検定®2級講座第14回】
- 『統計学入門』(東京大学出版会)