以下の統計検定2級対策動画で用いられているスライドの一部です。
はじめに:具体例から学ぼう
統計学の F分布 は、定義から入ると少し複雑に感じるかもしれません。
まずは 具体的な問題 を通して、F分布がどのように使われるのかを見ていきましょう。
【問題1】上側パーセント点を求める
【問題】
分子の自由度 $m=4$、分母の自由度 $n=8$ のF分布を考えます。
このときの 上側5%点 $F_{4,8}(0.05)$ の値を、F分布表から求めてください。
上側5%点とは?
グラフの右側の面積(確率)が5% (0.05) になる点の値のことです。
【解答1】F分布表の読み方
- F分布表(上側確率5%)を用意します。
- 表の 横軸 で 分子の自由度 $m=4$ を探します。
- 表の 縦軸 で 分母の自由度 $n=8$ を探します。
- $m=4$ の列と $n=8$ の行が 交差する値 を読み取ります。
その値は 3.84 となっています。
したがって、答えは $F_{4,8}(0.05) = 3.84$ です。
【問題2】下側パーセント点を求める(応用)
【問題】
分子の自由度 $m=10$、分母の自由度 $n=6$ のF分布における 下側5%点 を求めてください。
下側5%点とは?
グラフの左側の面積(確率)が5% (0.05) になる点の値です。
これは、上側確率が $1 - 0.05 = 0.95$ の点 $F_{10,6}(0.95)$ と同じです。
【解答2】逆数の関係式を利用する
F分布には、自由度を入れ替えると 逆数の関係 になるという重要な性質があります。
$$
F_{n,m}(1-\alpha) = \frac{1}{F_{m,n}(\alpha)}
$$
この式を利用して、下側5%点 $F_{10,6}(0.95)$ を求めます。
【解答2】計算プロセス
- 求める値は $F_{10,6}(0.95)$ です。
- 逆数の関係式に $m=10, n=6, \alpha=0.05$ を適用し、変形します。
$$
F_{10,6}(0.95) = \frac{1}{F_{6,10}(0.05)}
$$
-
分母の $F_{6,10}(0.05)$ をF分布表(上側5%点)から求めます。
- 分子の自由度6、分母の自由度10が交差する値は 3.22 です。
-
これを式に代入します。
$$
F_{10,6}(0.95) = \frac{1}{3.22} \approx 0.31055...
$$
したがって、求める下側5%点は約 0.311 です。
F分布の一般化と定義
ここまでの具体例を踏まえて、F分布がどのように定義されるのかを一般化して見ていきましょう。
F分布の定義
F分布は、互いに 独立な2つのカイ二乗分布 に従う確率変数の比から定義される、連続型の確率分布です。
- 確率変数 $U$ が自由度 $m$ のカイ二乗分布 $\chi^2(m)$ に従う
- 確率変数 $V$ が自由度 $n$ のカイ二乗分布 $\chi^2(n)$ に従う
このとき、以下の式で定義される確率変数 $F$ が従う確率分布を、
分子の自由度 $m$ 、 分母の自由度 $n$ の F分布 と呼び、$F(m, n)$ と表記します。
$$
F = \frac{U/m}{V/n}
$$
F分布の形状
F分布の形状は、2つの自由度 $m$ と $n$ によって決まります。
- 常に 正の値 をとる
- 一般的に 右に裾が長い (右に歪んだ)非対称な形状
確率密度関数は以下の式で与えられますが、まずはグラフの形でイメージを掴むことが重要です。
$$
f(x) = \frac{\sqrt{\frac{(mx)^m n^n}{(mx+n)^{m+n}}}}{x B(\frac{m}{2}, \frac{n}{2})} \quad (x > 0)
$$
F分布の形状(グラフ)
自由度の組み合わせによって、分布の形が変わる様子を確認しましょう。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import f
# Define degrees of freedom for different F-distributions
df_pairs = [(5, 10), (10, 3), (30, 30)]
colors = ['blue', 'green', 'red']
# Generate x values
x = np.linspace(0.01, 5, 1000)
# Create the plot
plt.figure(figsize=(10, 6))
for (m, n), color in zip(df_pairs, colors):
y = f.pdf(x, m, n)
plt.plot(x, y, label=f'F({m}, {n})', color=color)
# Add titles and labels
plt.title('F-Distribution for different degrees of freedom')
plt.xlabel('Value')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.ylim(0, 1.5)
plt.show()
パーセント点の定義
例題で見たパーセント点を一般化して定義します。
上側パーセント点
上側確率が $\alpha$ となるF値を $F_{m,n}(\alpha)$ と表記します。
$$
P(F > F_{m,n}(\alpha)) = \alpha
$$
下側パーセント点(逆数の関係)
下側 $\alpha$ 点(=上側 $1-\alpha$ 点)は、逆数の関係式を用いて計算できます。
$$
F_{m,n}(1-\alpha) = \frac{1}{F_{n,m}(\alpha)}
$$
期待値と分散
F分布の期待値(平均)と分散は、以下の式で計算できます。
ただし、分母の自由度 $n$ の値によって 条件がある 点に注意が必要です。
期待値 $E[F]$ (ただし $n > 2$)
$$
E[F] = \frac{n}{n-2}
$$
分散 $V[F]$ (ただし $n > 4$)
$$
V[F] = \frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}
$$
まとめ
-
定義
- 独立な2つのカイ二乗分布の比から導かれます。
-
形状
- 分子と分母の 2つの自由度 で形が決まる、右に裾の長い非対称な分布です。
-
パーセント点
- F分布表を用いて求めます。逆数の関係を利用すれば下側パーセント点も計算可能です。
-
活用例
- F検定 (2つの母集団の分散が等しいかの検定)
- 分散分析(ANOVA) (3つ以上の母集団の平均値に差があるかの分析)
- これら統計手法の 中心的な役割 を果たします。


