データポイントのばらつきとサンプル平均のばらつき
例
あるクラスの学生のテストの点数を考える。以下のデータがあるとする:
$$
{85, 90, 88, 92, 87}
$$
1. データポイントのばらつき(標準偏差)
まず、データポイントのばらつきを計算する。これがサンプルの標準偏差 ( s )。
-
平均((\bar{X}))を計算:
$$
\bar{X} = \frac{85 + 90 + 88 + 92 + 87}{5} = 88.4
$$ -
各データポイントと平均の差を二乗し、その平均を取る(分散):
$$
\text{分散} = \frac{(85 - 88.4)^2 + (90 - 88.4)^2 + (88 - 88.4)^2 + (92 - 88.4)^2 + (87 - 88.4)^2}{5} = 6.64
$$ -
分散の平方根を取る(標準偏差):
$$
s = \sqrt{6.64} \approx 2.58
$$
この標準偏差 ( s ) は、個々のデータポイントのばらつきを示している。
2. サンプル平均のばらつき(標準誤差)
次に、サンプル平均のばらつきを計算する。これが標準誤差。
- 標準誤差の公式を使う:
$$
\text{標準誤差} = \frac{s}{\sqrt{n}}
$$
ここで、( s ) はサンプルの標準偏差、( n ) はサンプルサイズ。この例では、( s = 2.58 ) で、( n = 5 )。
- 標準誤差を計算:
$$
\text{標準誤差} = \frac{2.58}{\sqrt{5}} \approx 1.15
$$
この標準誤差は、サンプル平均のばらつきを示している。サンプルサイズが大きくなると、標準誤差は小さくなり、サンプル平均が母平均に近づくことを示す。
まとめ
- データポイントのばらつき: 個々のデータポイントが平均からどれだけ離れているかを示す(標準偏差 ( s ))。
- サンプル平均のばらつき: サンプル平均が母平均からどれだけ離れているかを示す(標準誤差)。
標準偏差をサンプルサイズの平方根で割ることで、サンプル平均のばらつきを正確に示すことができる。