統計学の中には「ばらつき」を比べる方法としてF検定というものがあります。この記事では、F検定の考え方や計算方法を中学生でも分かるように説明します。さらに具体的な数値を使った例も紹介します!
※この記事は、ChatGPTの出力を基に作成しています。
F検定とは?
F検定は、「2つのグループのデータのばらつきが同じかどうかを比べる方法」です。
ばらつきとは?
データのばらつきとは、データがどれくらい散らばっているかを指します。
- ばらつきが小さい:データが平均値に近い値ばかり。
- ばらつきが大きい:データが平均値から離れた値が多い。
例えば、クラスAとクラスBのテスト点数を比べたとき、F検定を使うと「2つのクラスの点数の広がり方が似ているかどうか」が分かります。
F検定のステップ
F検定を行うためには、以下の手順を踏みます。
1. 分散を計算する
ばらつきを数値で表す「分散」を計算します。分散の公式は次の通りです:
$
\text{分散} = \frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}
$
ここで、
- $\ x_i $:データの各値
- $\ \bar{x} $:データの平均
- $\ n $:データの個数
2. F値を計算する
分散が大きい方を分子、小さい方を分母にして割り算します。
$
F = \frac{\text{大きい方の分散}}{\text{小さい方の分散}}
$
3. 基準値と比べる
計算したF値を基準値(F分布表を使って得られる値)と比較します。この基準値よりF値が大きいと「ばらつきが違う」、小さいと「ばらつきが同じ」と判断します。
具体例でF検定をやってみよう!
問題
クラスAとクラスBのテスト点数が以下のようだったとします。
- クラスA: ( 70, 75, 80, 85, 90 )
- クラスB: ( 60, 70, 80, 90, 100 )
この2つのクラスの点数のばらつきが同じかどうかを調べます。
ステップ1: 分散を計算する
クラスAの分散
-
平均 $( \bar{x}_A )$ を計算:
$
\bar{x}_A = \frac{70 + 75 + 80 + 85 + 90}{5} = 80
$ -
各値との差の二乗を計算:
$
(70 - 80)^2 = 100, \quad (75 - 80)^2 = 25, \quad (80 - 80)^2 = 0, \quad (85 - 80)^2 = 25, \quad (90 - 80)^2 = 100
$ -
分散を計算:
$
\text{分散}_A = \frac{100 + 25 + 0 + 25 + 100}{5 - 1} = \frac{250}{4} = 62.5
$
クラスBの分散
-
平均 $( \bar{x}_B )$ を計算:
$
\bar{x}_B = \frac{60 + 70 + 80 + 90 + 100}{5} = 80
$ -
各値との差の二乗を計算:
$
(60 - 80)^2 = 400, \quad (70 - 80)^2 = 100, \quad (80 - 80)^2 = 0, \quad (90 - 80)^2 = 100, \quad (100 - 80)^2 = 400
$ -
分散を計算:
$
\text{分散}_B = \frac{400 + 100 + 0 + 100 + 400}{5 - 1} = \frac{1000}{4} = 250
$
ステップ2: F値を計算する
分散が大きい方(クラスB)を分子、小さい方(クラスA)を分母にします:
$
F = \frac{\text{分散}_B}{\text{分散}_A} = \frac{250}{62.5} = 4
$
ステップ3: 基準値と比較する
F分布表を使い、自由度$\ (4, 4) $ の場合の基準値(有意水準5%)は約6.39です。
- $ F = 4 $ は基準値$\ 6.39 $ より小さいので、ばらつきは「同じ」とみなせます。
結論
クラスAとクラスBのテスト点数のばらつきに統計的な差はありません。つまり、どちらも「同じくらいのばらつき」と考えられます。
F検定を使うときのポイント
- 分散を計算するのが基本!
- F値は「大きい分散 ÷ 小さい分散」で計算。
- 基準値(F分布表)と比較して判断。
まとめ
F検定はデータのばらつきを比較するための便利な方法です。今回の例のように、クラスやチームの成績などを比べるときに役立ちます。統計の知識が増えると、データの見方がぐっと広がりますよ!
ぜひ試してみてください!