1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

F分布をゼロから理解する_統計検定2級対策

Posted at

以下の統計検定2級対策動画で用いられているスライドの一部です。

はじめに:具体例から学ぼう

統計学の F分布 は、定義から入ると少し複雑に感じるかもしれません。

まずは 具体的な問題 を通して、F分布がどのように使われるのかを見ていきましょう。


【問題1】上側パーセント点を求める

【問題】
分子の自由度 $m=4$、分母の自由度 $n=8$ のF分布を考えます。
このときの 上側5%点 $F_{4,8}(0.05)$ の値を、F分布表から求めてください。

上側5%点とは?
グラフの右側の面積(確率)が5% (0.05) になる点の値のことです。

image.png


【解答1】F分布表の読み方

  1. F分布表(上側確率5%)を用意します。
  2. 表の 横軸分子の自由度 $m=4$ を探します。
  3. 表の 縦軸分母の自由度 $n=8$ を探します。
  4. $m=4$ の列と $n=8$ の行が 交差する値 を読み取ります。

その値は 3.84 となっています。
したがって、答えは $F_{4,8}(0.05) = 3.84$ です。


【問題2】下側パーセント点を求める(応用)

【問題】
分子の自由度 $m=10$、分母の自由度 $n=6$ のF分布における 下側5%点 を求めてください。

下側5%点とは?
グラフの左側の面積(確率)が5% (0.05) になる点の値です。
これは、上側確率が $1 - 0.05 = 0.95$ の点 $F_{10,6}(0.95)$ と同じです。

image.png


【解答2】逆数の関係式を利用する

F分布には、自由度を入れ替えると 逆数の関係 になるという重要な性質があります。

$$
F_{n,m}(1-\alpha) = \frac{1}{F_{m,n}(\alpha)}
$$

この式を利用して、下側5%点 $F_{10,6}(0.95)$ を求めます。


【解答2】計算プロセス

  1. 求める値は $F_{10,6}(0.95)$ です。
  2. 逆数の関係式に $m=10, n=6, \alpha=0.05$ を適用し、変形します。

$$
F_{10,6}(0.95) = \frac{1}{F_{6,10}(0.05)}
$$

  1. 分母の $F_{6,10}(0.05)$ をF分布表(上側5%点)から求めます。

    • 分子の自由度6、分母の自由度10が交差する値は 3.22 です。
  2. これを式に代入します。
    $$
    F_{10,6}(0.95) = \frac{1}{3.22} \approx 0.31055...
    $$

したがって、求める下側5%点は約 0.311 です。


F分布の一般化と定義

ここまでの具体例を踏まえて、F分布がどのように定義されるのかを一般化して見ていきましょう。


F分布の定義

F分布は、互いに 独立な2つのカイ二乗分布 に従う確率変数の比から定義される、連続型の確率分布です。

  • 確率変数 $U$ が自由度 $m$ のカイ二乗分布 $\chi^2(m)$ に従う
  • 確率変数 $V$ が自由度 $n$ のカイ二乗分布 $\chi^2(n)$ に従う

このとき、以下の式で定義される確率変数 $F$ が従う確率分布を、
分子の自由度 $m$ 、 分母の自由度 $n$ の F分布 と呼び、$F(m, n)$ と表記します。

$$
F = \frac{U/m}{V/n}
$$


F分布の形状

F分布の形状は、2つの自由度 $m$ と $n$ によって決まります。

  • 常に 正の値 をとる
  • 一般的に 右に裾が長い (右に歪んだ)非対称な形状

確率密度関数は以下の式で与えられますが、まずはグラフの形でイメージを掴むことが重要です。

$$
f(x) = \frac{\sqrt{\frac{(mx)^m n^n}{(mx+n)^{m+n}}}}{x B(\frac{m}{2}, \frac{n}{2})} \quad (x > 0)
$$


F分布の形状(グラフ)

自由度の組み合わせによって、分布の形が変わる様子を確認しましょう。

image.png

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import f

# Define degrees of freedom for different F-distributions
df_pairs = [(5, 10), (10, 3), (30, 30)]
colors = ['blue', 'green', 'red']

# Generate x values
x = np.linspace(0.01, 5, 1000)

# Create the plot
plt.figure(figsize=(10, 6))

for (m, n), color in zip(df_pairs, colors):
    y = f.pdf(x, m, n)
    plt.plot(x, y, label=f'F({m}, {n})', color=color)

# Add titles and labels
plt.title('F-Distribution for different degrees of freedom')
plt.xlabel('Value')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.ylim(0, 1.5)
plt.show()

パーセント点の定義

例題で見たパーセント点を一般化して定義します。

上側パーセント点

上側確率が $\alpha$ となるF値を $F_{m,n}(\alpha)$ と表記します。
$$
P(F > F_{m,n}(\alpha)) = \alpha
$$

下側パーセント点(逆数の関係)

下側 $\alpha$ 点(=上側 $1-\alpha$ 点)は、逆数の関係式を用いて計算できます。
$$
F_{m,n}(1-\alpha) = \frac{1}{F_{n,m}(\alpha)}
$$


期待値と分散

F分布の期待値(平均)と分散は、以下の式で計算できます。
ただし、分母の自由度 $n$ の値によって 条件がある 点に注意が必要です。

期待値 $E[F]$ (ただし $n > 2$)

$$
E[F] = \frac{n}{n-2}
$$

分散 $V[F]$ (ただし $n > 4$)

$$
V[F] = \frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}
$$


まとめ

  • 定義

    • 独立な2つのカイ二乗分布の比から導かれます。
  • 形状

    • 分子と分母の 2つの自由度 で形が決まる、右に裾の長い非対称な分布です。
  • パーセント点

    • F分布表を用いて求めます。逆数の関係を利用すれば下側パーセント点も計算可能です。
  • 活用例

    • F検定 (2つの母集団の分散が等しいかの検定)
    • 分散分析(ANOVA) (3つ以上の母集団の平均値に差があるかの分析)
    • これら統計手法の 中心的な役割 を果たします。
1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?