以下の統計検定2級対策動画で用いられているスライドの一部です。
はじめに:なぜF分布表を読むのか?
分散分析(ANOVA)やF検定を行う際、算出した検定統計量が 統計的に意味のある差 なのかを判断する必要があります。
その判断基準となる 境界値 (臨界値)を見つけるために、F分布表の読み方をマスターすることが不可欠です。
このスライドでは、具体例を通じてその読み方を学びます。
ステップ1:具体例から学ぶ
まずは、具体的な問題を通じてF分布表の使い方を見ていきましょう。
【問題】
ある化学メーカーが、2つの製造プロセス(A, B)で製造した樹脂の 品質のばらつき を比較します。
- プロセスA から 11個 のサンプルを抽出
- プロセスB から 9個 のサンプルを抽出
有意水準 5% でF検定を行うとき、境界値となるF値を求めてください。
※なお、両プロセスの品質データは正規分布に従うものと仮定します。
※実際の分析では、より結果の信頼性を高めるために、さらに多くのサンプル数が必要となるのが一般的です。
解答への道筋:3つの情報を探す
F分布表から目的の値を引き出すには、たった 3つの情報 を特定するだけです。
- 上側確率 $\alpha$ (有意水準)
- 第一自由度 $v_1$ (分子の自由度)
- 第二自由度 $v_2$ (分母の自由度)
これらの情報を、先ほどの問題文から一つずつ見つけていきましょう。
1. 上側確率 $\alpha$ (有意水準)
これは、検定の判断基準となる確率です。
「これから求めるF値よりも 大きな値 が出現する確率」を意味します。
問題文には「有意水準 5% でF検定を行う」とあります。
- 上側確率 $\alpha$ = 0.05
これにより、私たちは 「上側確率5%のF分布表」 を使うことが決まります。
2. 第一自由度 $v_1$ (分子の自由度)
これは、F値を計算するときの 分子 になるグループの自由度です。
- 計算式: $v_1 = (分子側のサンプルサイズ) - 1$
問題では、プロセスA(サンプルサイズ $n_1=11$ )を分子とします。
- 第一自由度 $v_1 = 11 - 1 = \bf{10}$
この値は、F分布表の 横軸(列) で探します。
3. 第二自由度 $v_2$ (分母の自由度)
これは、F値を計算するときの 分母 になるグループの自由度です。
- 計算式: $v_2 = (分母側のサンプルサイズ) - 1$
問題では、プロセスB(サンプルサイズ $n_2=9$ )を分母とします。
- 第二自由度 $v_2 = 9 - 1 = \bf{8}$
この値は、F分布表の 縦軸(行) で探します。
準備完了!3つの情報が揃いました
これまでのステップで、必要な3つの情報がすべて特定できました。
- 使用する表: 上側確率 5% ( $\alpha = 0.05$ ) のF分布表
- 横軸(列)で探す値: 第一自由度 $v_1 = \bf{10}$
- 縦軸(行)で探す値: 第二自由度 $v_2 = \bf{8}$
いよいよ、F分布表から値を読み取ります。
実践:F分布表から値を読み取る
- まず、「 上側確率5% 」のF分布表を手元に用意します。
- 表の 横軸(列) から、第一自由度 $v_1 = \bf{10}$ を探します。
- 表の 縦軸(行) から、第二自由度 $v_2 = \bf{8}$ を探します。
- $v_1=10$ の列と $v_2=8$ の行が 交差する点 の数値を読み取ります。
結論:境界値は「3.35」
$v_1=10$ の列と $v_2=8$ の行が交差する点には、「 3.35 」と書かれています。
これが求める答えです。
この検定で用いるF値は 3.35 です。
もし実際に計算したF値が 3.35 よりも大きければ、「2つのプロセスの品質のばらつきには 統計的に有意な差がある 」と結論づけることができます。
ステップ2:一般化と定義
ここまでの具体例を通じて、F分布表の読み方の流れを掴むことができました。
次に、これらの概念を一般化し、学術的な定義として整理し直しましょう。
F分布とは何か?
F分布 とは、2つの正規分布に従う母集団からそれぞれ抽出した標本の、「 不偏分散の比 」が従う確率分布のことです。
F分布の形状は、2つの自由度 ( $v_1$ と $v_2$ ) によって決まります。自由度の組み合わせが変わると、グラフの形も変化します。
F分布のグラフを描画するPythonコード
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import f
# Define degrees of freedom combinations
df1 = [5, 10, 50]
df2 = [10, 20, 50]
colors = ['blue', 'green', 'red']
# Generate x values
x = np.linspace(0.01, 5, 1000)
plt.figure(figsize=(10, 6))
for v1, v2, color in zip(df1, df2, colors):
pdf = f.pdf(x, v1, v2)
label_text = f'v1={v1}, v2={v2}'
plt.plot(x, pdf, label=label_text, color=color)
plt.title('F-Distribution for Different Degrees of Freedom')
plt.xlabel('F-value')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.ylim(0, 1.0)
plt.show()
F分布の厳密な定義
より厳密には、F分布はカイ二乗分布から導出されます。
- 確率変数 $U_1$ が自由度 $v_1$ のカイ二乗分布に従う
- 確率変数 $U_2$ が自由度 $v_2$ のカイ二乗分布に従う
このとき、以下の統計量 $F$ は 自由度 $(v_1, v_2)$ のF分布 に従います。
$$
F = \frac{U_1/v_1}{U_2/v_2}
$$
F分布表の構成要素(まとめ)
F分布表を読むために必要な3つの要素の定義を、改めて整理します。
| 要素 | 定義 | 公式 / 役割 | 表での位置 |
|---|---|---|---|
| 上側確率 $\alpha$ | F値がある値より大きくなる確率 | 有意水準に対応 | 使用する表を選択 |
| 第一自由度 $v_1$ | 分子の不偏分散の自由度 | $v_1 = n_1 - 1$ | 横軸(列) |
| 第二自由度 $v_2$ | 分母の不偏分散の自由度 | $v_2 = n_2 - 1$ | 縦軸(行) |
最終まとめ:F分布表の読み方3ステップ
F分布表の読み方は、以下の3ステップで機械的に行うことができます。
-
3つの要素を特定する
- 上側確率 $\alpha$、第一自由度 $v_1$、第二自由度 $v_2$
-
指定された $\alpha$ のF分布表を選ぶ
- 例:5% (0.05) や 1% (0.01)
-
横軸で $v_1$、縦軸で $v_2$ を探し、交差する点を読む

