0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【統計学】F分布表の読み方_統計検定2級対策

0
Posted at

以下の統計検定2級対策動画で用いられているスライドの一部です。

はじめに:なぜF分布表を読むのか?

分散分析(ANOVA)やF検定を行う際、算出した検定統計量が 統計的に意味のある差 なのかを判断する必要があります。

その判断基準となる 境界値 (臨界値)を見つけるために、F分布表の読み方をマスターすることが不可欠です。

このスライドでは、具体例を通じてその読み方を学びます。


ステップ1:具体例から学ぶ

まずは、具体的な問題を通じてF分布表の使い方を見ていきましょう。

【問題】

ある化学メーカーが、2つの製造プロセス(A, B)で製造した樹脂の 品質のばらつき を比較します。

  • プロセスA から 11個 のサンプルを抽出
  • プロセスB から 9個 のサンプルを抽出

有意水準 5% でF検定を行うとき、境界値となるF値を求めてください。

※なお、両プロセスの品質データは正規分布に従うものと仮定します。
※実際の分析では、より結果の信頼性を高めるために、さらに多くのサンプル数が必要となるのが一般的です。


解答への道筋:3つの情報を探す

F分布表から目的の値を引き出すには、たった 3つの情報 を特定するだけです。

  1. 上側確率 $\alpha$ (有意水準)
  2. 第一自由度 $v_1$ (分子の自由度)
  3. 第二自由度 $v_2$ (分母の自由度)

これらの情報を、先ほどの問題文から一つずつ見つけていきましょう。


1. 上側確率 $\alpha$ (有意水準)

これは、検定の判断基準となる確率です。
「これから求めるF値よりも 大きな値 が出現する確率」を意味します。

問題文には「有意水準 5% でF検定を行う」とあります。

  • 上側確率 $\alpha$ = 0.05

これにより、私たちは 「上側確率5%のF分布表」 を使うことが決まります。


2. 第一自由度 $v_1$ (分子の自由度)

これは、F値を計算するときの 分子 になるグループの自由度です。

  • 計算式: $v_1 = (分子側のサンプルサイズ) - 1$

問題では、プロセスA(サンプルサイズ $n_1=11$ )を分子とします。

  • 第一自由度 $v_1 = 11 - 1 = \bf{10}$

この値は、F分布表の 横軸(列) で探します。


3. 第二自由度 $v_2$ (分母の自由度)

これは、F値を計算するときの 分母 になるグループの自由度です。

  • 計算式: $v_2 = (分母側のサンプルサイズ) - 1$

問題では、プロセスB(サンプルサイズ $n_2=9$ )を分母とします。

  • 第二自由度 $v_2 = 9 - 1 = \bf{8}$

この値は、F分布表の 縦軸(行) で探します。


準備完了!3つの情報が揃いました

これまでのステップで、必要な3つの情報がすべて特定できました。

  • 使用する表: 上側確率 5% ( $\alpha = 0.05$ ) のF分布表
  • 横軸(列)で探す値: 第一自由度 $v_1 = \bf{10}$
  • 縦軸(行)で探す値: 第二自由度 $v_2 = \bf{8}$

いよいよ、F分布表から値を読み取ります。


実践:F分布表から値を読み取る

  1. まず、「 上側確率5% 」のF分布表を手元に用意します。
  2. 表の 横軸(列) から、第一自由度 $v_1 = \bf{10}$ を探します。
  3. 表の 縦軸(行) から、第二自由度 $v_2 = \bf{8}$ を探します。
  4. $v_1=10$ の列と $v_2=8$ の行が 交差する点 の数値を読み取ります。

image.png


結論:境界値は「3.35」

$v_1=10$ の列と $v_2=8$ の行が交差する点には、「 3.35 」と書かれています。

これが求める答えです。

この検定で用いるF値は 3.35 です。

もし実際に計算したF値が 3.35 よりも大きければ、「2つのプロセスの品質のばらつきには 統計的に有意な差がある 」と結論づけることができます。


ステップ2:一般化と定義

ここまでの具体例を通じて、F分布表の読み方の流れを掴むことができました。

次に、これらの概念を一般化し、学術的な定義として整理し直しましょう。


F分布とは何か?

F分布 とは、2つの正規分布に従う母集団からそれぞれ抽出した標本の、「 不偏分散の比 」が従う確率分布のことです。

F分布の形状は、2つの自由度 ( $v_1$ と $v_2$ ) によって決まります。自由度の組み合わせが変わると、グラフの形も変化します。

image.png


F分布のグラフを描画するPythonコード

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import f

# Define degrees of freedom combinations
df1 = [5, 10, 50]
df2 = [10, 20, 50]
colors = ['blue', 'green', 'red']

# Generate x values
x = np.linspace(0.01, 5, 1000)

plt.figure(figsize=(10, 6))

for v1, v2, color in zip(df1, df2, colors):
    pdf = f.pdf(x, v1, v2)
    label_text = f'v1={v1}, v2={v2}'
    plt.plot(x, pdf, label=label_text, color=color)

plt.title('F-Distribution for Different Degrees of Freedom')
plt.xlabel('F-value')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.ylim(0, 1.0)
plt.show()

F分布の厳密な定義

より厳密には、F分布はカイ二乗分布から導出されます。

  • 確率変数 $U_1$ が自由度 $v_1$ のカイ二乗分布に従う
  • 確率変数 $U_2$ が自由度 $v_2$ のカイ二乗分布に従う

このとき、以下の統計量 $F$ は 自由度 $(v_1, v_2)$ のF分布 に従います。

$$
F = \frac{U_1/v_1}{U_2/v_2}
$$


F分布表の構成要素(まとめ)

F分布表を読むために必要な3つの要素の定義を、改めて整理します。

要素 定義 公式 / 役割 表での位置
上側確率 $\alpha$ F値がある値より大きくなる確率 有意水準に対応 使用する表を選択
第一自由度 $v_1$ 分子の不偏分散の自由度 $v_1 = n_1 - 1$ 横軸(列)
第二自由度 $v_2$ 分母の不偏分散の自由度 $v_2 = n_2 - 1$ 縦軸(行)

最終まとめ:F分布表の読み方3ステップ

F分布表の読み方は、以下の3ステップで機械的に行うことができます。

  1. 3つの要素を特定する

    • 上側確率 $\alpha$、第一自由度 $v_1$、第二自由度 $v_2$
  2. 指定された $\alpha$ のF分布表を選ぶ

    • 例:5% (0.05) や 1% (0.01)
  3. 横軸で $v_1$、縦軸で $v_2$ を探し、交差する点を読む

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?