【統計の基礎】不偏分散の求め方（n-1で割る理由）【証明、式変形をめっちゃ丁寧にやる】

Last updated at 2025-06-10Posted at 2025-06-09

不偏分散をめっちゃ丁寧に求める

標本分散を計算するとき、単純に偏差平方和をデータの個数 $n$ で割ると、その期待値（平均的な値）は母集団の真の分散 $\sigma^2$ よりも少しだけ小さくなることが知られています。この「ズレ（バイアス）」を補正し、期待値が母分散 $\sigma^2$ と一致するようにしたものが不偏分散です。

結論から言うと、不偏分散 $u^2$ (または $\hat{\sigma}^2$) は、偏差平方和をデータの個数から1を引いた $n-1$ で割ることで求められます。

$$u^2 = \frac{1}{n-1}\sum_{i=1}^{n} (X_i - \bar{X})^2$$

なぜ $n$ ではなく $n-1$ で割るのか、その理由をこれから証明していきます。

この記事では、できる限り丁寧に、省略せずに、式変形を追っていきます！！

準備と定義

証明を始める前に、使用する記号を定義します。

母集団: 平均 $\mu$、分散 $\sigma^2$
無作為標本: $X_1, X_2, \dots, X_n$
- $E[X_i] = \mu$
- $V[X_i] = E[(X_i - \mu)^2] = \sigma^2$
標本平均: $\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i$
- $E[\bar{X}] = \mu$
- $V[\bar{X}] = E[(\bar{X}-\mu)^2] = \frac{\sigma^2}{n}$
標本分散 (分母がn): $s^2 = \frac{1}{n}\sum_{i=1}^{n} (X_i - \bar{X})^2$

注意

$\sigma^2$と$s^2$の違い、定義についてしっかり確認しておきましょう！！

目標

標本分散 $s^2$ の期待値 $E[s^2]$ を計算し、それが $\sigma^2$ にならないことを示し、どうすれば $\sigma^2$ になるかを導くことです。

標本分散の期待値 E[s^2] の計算

$s^2$ の定義式を展開し、その期待値を求めます。

式変形

\begin{align*}
E[s^2] &= E\left[\frac{1}{n}\sum_{i=1}^{n} (X_i - \bar{X})^2\right] & & \text{（標本分散の定義）} \\
\\
&= \frac{1}{n} E\left[\sum_{i=1}^{n} (X_i - \bar{X})^2\right] & & \text{（理由①：期待値の線形性）}
\end{align*}

ここで、計算を簡単にするため、総和の中の $(X_i - \bar{X})^2$ を変形します。これは、真の母平均 $\mu$ を足して引く、というテクニックを使います。

\begin{align*}
(X_i - \bar{X})^2 &= \left( (X_i - \mu) - (\bar{X} - \mu) \right)^2 \\
&= (X_i - \mu)^2 - 2(X_i - \mu)(\bar{X} - \mu) + (\bar{X} - \mu)^2
\end{align*}

この式を総和 $\sum_{i=1}^{n}$ に代入します。

$$\sum_{i=1}^{n} (X_i - \bar{X})^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - 2\sum_{i=1}^{n} (X_i - \mu)(\bar{X} - \mu) + \sum_{i=1}^{n} (\bar{X} - \mu)^2$$

右辺の第2項と第3項を整理します。

第3項: $(\bar{X}-\mu)^2$ は $i$ に無関係なので、$n$ 回足すことになり $n(\bar{X}-\mu)^2$ となります。
第2項: $(\bar{X}-\mu)$ は $i$ に無関係なので、$\sum$ の外に出せます。
$$-2(\bar{X} - \mu)\sum_{i=1}^{n} (X_i - \mu)$$
ここで $\sum (X_i - \mu) = (\sum X_i) - n\mu = n\bar{X} - n\mu = n(\bar{X} - \mu)$ となるので、第2項は全体で $-2(\bar{X} - \mu) \cdot n(\bar{X} - \mu) = -2n(\bar{X} - \mu)^2$ となります。

これらを合わせると、総和の部分は次のように整理できます。

$$\sum_{i=1}^{n} (X_i - \bar{X})^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2$$

この結果を、元の期待値の式に戻します。

\begin{align*}
E[s^2] &= \frac{1}{n} E\left[ \sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \right] & & \text{（変形結果を代入）} \\
\\
&= \frac{1}{n} \left( E\left[\sum_{i=1}^{n} (X_i - \mu)^2\right] - nE\left[(\bar{X} - \mu)^2\right] \right) & & \text{（理由②：期待値の加法性）} \\
\\
&= \frac{1}{n} \left( \sum_{i=1}^{n} E[(X_i - \mu)^2] - nE[(\bar{X} - \mu)^2] \right) & & \text{（理由③：期待値の線形性）} \\
\\
&= \frac{1}{n} \left( \sum_{i=1}^{n} \sigma^2 - n \cdot \frac{\sigma^2}{n} \right) & & \text{（理由④：分散の定義を適用）} \\
\\
&= \frac{1}{n} (n\sigma^2 - \sigma^2) & & \text{（整理）} \\
\\
&= \frac{1}{n} (n-1)\sigma^2 = \frac{n-1}{n}\sigma^2 & & \text{（最終結果）}
\end{align*}

変形の理由

理由①, ②, ③: 期待値の持つ線形性 $E[aX+bY]=aE[X]+bE[Y]$ を繰り返し利用しています。
理由④: $E[(X_i - \mu)^2]$ は母分散 $\sigma^2$ の定義そのものです。また、$E[(\bar{X} - \mu)^2]$ は標本平均の分散 $V[\bar{X}]$ の定義であり、その値は $\frac{\sigma^2}{n}$ であることが知られています。

結果

この結果から、標本分散 $s^2$（$n$で割ったもの）の期待値は、真の分散 $\sigma^2$ ではなく、それに $\frac{n-1}{n}$ を掛けた値となり、少し小さく見積もってしまう（過小評価する） ことがわかります。

バイアスの補正と不偏分散の導出

上記の通り、$E[s^2] = \frac{n-1}{n}\sigma^2$ というズレ（バイアス）が確認できました。この等式を $\sigma^2$ について解くことで、バイアスを補正する方法がわかります。

$$\sigma^2 = \frac{n}{n-1} E[s^2]$$

期待値の線形性から、定数 $\frac{n}{n-1}$ は期待値の中に入れることができます。

$$\sigma^2 = E\left[ \frac{n}{n-1} s^2 \right]$$

つまり、期待値が $\sigma^2$ となる新しい推定量（これを不偏分散 $u^2$ とします）は、$s^2$ を $\frac{n}{n-1}$ 倍すれば良いことがわかります。

$$
\begin{align*}
u^2 &= \frac{n}{n-1} s^2 \
&= \frac{n}{n-1} \left( \frac{1}{n}\sum_{i=1}^{n} (X_i - \bar{X})^2 \right) \
&= \frac{1}{n-1}\sum_{i=1}^{n} (X_i - \bar{X})^2
\end{align*}
$$

これにより、分母が $n-1$ である不偏分散の公式が導かれました。

解釈

分母の $n-1$ は自由度 (degrees of freedom) と呼ばれます。これは、標本平均 $\bar{X}$ を計算した時点で、データのうち $n-1$ 個の値が決まれば、残りの1個の値は自動的に決まってしまうため、「自由に動けるデータの数は実質的に $n-1$ 個である」と解釈されます。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up