0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【統計の基礎】不偏分散の求め方(n-1で割る理由)【証明、式変形をめっちゃ丁寧にやる】

0
Last updated at Posted at 2025-06-09

不偏分散をめっちゃ丁寧に求める

標本分散を計算するとき、単純に偏差平方和をデータの個数 $n$ で割ると、その期待値(平均的な値)は母集団の真の分散 $\sigma^2$ よりも少しだけ小さくなることが知られています。この「ズレ(バイアス)」を補正し、期待値が母分散 $\sigma^2$ と一致するようにしたものが不偏分散です。

結論から言うと、不偏分散 $u^2$ (または $\hat{\sigma}^2$) は、偏差平方和をデータの個数から1を引いた $n-1$ で割ることで求められます。

$$u^2 = \frac{1}{n-1}\sum_{i=1}^{n} (X_i - \bar{X})^2$$

なぜ $n$ ではなく $n-1$ で割るのか、その理由をこれから証明していきます。

この記事では、できる限り丁寧に、省略せずに、式変形を追っていきます!!


準備と定義

証明を始める前に、使用する記号を定義します。

  • 母集団: 平均 $\mu$、分散 $\sigma^2$
  • 無作為標本: $X_1, X_2, \dots, X_n$
    • $E[X_i] = \mu$
    • $V[X_i] = E[(X_i - \mu)^2] = \sigma^2$
  • 標本平均: $\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i$
    • $E[\bar{X}] = \mu$
    • $V[\bar{X}] = E[(\bar{X}-\mu)^2] = \frac{\sigma^2}{n}$
  • 標本分散 (分母がn): $s^2 = \frac{1}{n}\sum_{i=1}^{n} (X_i - \bar{X})^2$

注意

$\sigma^2$と$s^2$の違い、定義についてしっかり確認しておきましょう!!

目標

標本分散 $s^2$ の期待値 $E[s^2]$ を計算し、それが $\sigma^2$ にならないことを示し、どうすれば $\sigma^2$ になるかを導くことです。


標本分散の期待値 E[s^2] の計算

$s^2$ の定義式を展開し、その期待値を求めます。

式変形

\begin{align*}
E[s^2] &= E\left[\frac{1}{n}\sum_{i=1}^{n} (X_i - \bar{X})^2\right] & & \text{(標本分散の定義)} \\
\\
&= \frac{1}{n} E\left[\sum_{i=1}^{n} (X_i - \bar{X})^2\right] & & \text{(理由①:期待値の線形性)}
\end{align*}

ここで、計算を簡単にするため、総和の中の $(X_i - \bar{X})^2$ を変形します。これは、真の母平均 $\mu$ を足して引く、というテクニックを使います。

\begin{align*}
(X_i - \bar{X})^2 &= \left( (X_i - \mu) - (\bar{X} - \mu) \right)^2 \\
&= (X_i - \mu)^2 - 2(X_i - \mu)(\bar{X} - \mu) + (\bar{X} - \mu)^2
\end{align*}

この式を総和 $\sum_{i=1}^{n}$ に代入します。

$$\sum_{i=1}^{n} (X_i - \bar{X})^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - 2\sum_{i=1}^{n} (X_i - \mu)(\bar{X} - \mu) + \sum_{i=1}^{n} (\bar{X} - \mu)^2$$

右辺の第2項と第3項を整理します。

  • 第3項: $(\bar{X}-\mu)^2$ は $i$ に無関係なので、$n$ 回足すことになり $n(\bar{X}-\mu)^2$ となります。
  • 第2項: $(\bar{X}-\mu)$ は $i$ に無関係なので、$\sum$ の外に出せます。
    $$-2(\bar{X} - \mu)\sum_{i=1}^{n} (X_i - \mu)$$
    ここで $\sum (X_i - \mu) = (\sum X_i) - n\mu = n\bar{X} - n\mu = n(\bar{X} - \mu)$ となるので、第2項は全体で $-2(\bar{X} - \mu) \cdot n(\bar{X} - \mu) = -2n(\bar{X} - \mu)^2$ となります。

これらを合わせると、総和の部分は次のように整理できます。

$$\sum_{i=1}^{n} (X_i - \bar{X})^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2$$

この結果を、元の期待値の式に戻します。

\begin{align*}
E[s^2] &= \frac{1}{n} E\left[ \sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \right] & & \text{(変形結果を代入)} \\
\\
&= \frac{1}{n} \left( E\left[\sum_{i=1}^{n} (X_i - \mu)^2\right] - nE\left[(\bar{X} - \mu)^2\right] \right) & & \text{(理由②:期待値の加法性)} \\
\\
&= \frac{1}{n} \left( \sum_{i=1}^{n} E[(X_i - \mu)^2] - nE[(\bar{X} - \mu)^2] \right) & & \text{(理由③:期待値の線形性)} \\
\\
&= \frac{1}{n} \left( \sum_{i=1}^{n} \sigma^2 - n \cdot \frac{\sigma^2}{n} \right) & & \text{(理由④:分散の定義を適用)} \\
\\
&= \frac{1}{n} (n\sigma^2 - \sigma^2) & & \text{(整理)} \\
\\
&= \frac{1}{n} (n-1)\sigma^2 = \frac{n-1}{n}\sigma^2 & & \text{(最終結果)}
\end{align*}

変形の理由

  • 理由①, ②, ③: 期待値の持つ線形性 $E[aX+bY]=aE[X]+bE[Y]$ を繰り返し利用しています。
  • 理由④: $E[(X_i - \mu)^2]$ は母分散 $\sigma^2$ の定義そのものです。また、$E[(\bar{X} - \mu)^2]$ は標本平均の分散 $V[\bar{X}]$ の定義であり、その値は $\frac{\sigma^2}{n}$ であることが知られています。

結果

この結果から、標本分散 $s^2$($n$で割ったもの)の期待値は、真の分散 $\sigma^2$ ではなく、それに $\frac{n-1}{n}$ を掛けた値となり、少し小さく見積もってしまう(過小評価する) ことがわかります。


バイアスの補正と不偏分散の導出

上記の通り、$E[s^2] = \frac{n-1}{n}\sigma^2$ というズレ(バイアス)が確認できました。この等式を $\sigma^2$ について解くことで、バイアスを補正する方法がわかります。

$$\sigma^2 = \frac{n}{n-1} E[s^2]$$

期待値の線形性から、定数 $\frac{n}{n-1}$ は期待値の中に入れることができます。

$$\sigma^2 = E\left[ \frac{n}{n-1} s^2 \right]$$

つまり、期待値が $\sigma^2$ となる新しい推定量(これを不偏分散 $u^2$ とします)は、$s^2$ を $\frac{n}{n-1}$ 倍すれば良いことがわかります。

$$
\begin{align*}
u^2 &= \frac{n}{n-1} s^2 \
&= \frac{n}{n-1} \left( \frac{1}{n}\sum_{i=1}^{n} (X_i - \bar{X})^2 \right) \
&= \frac{1}{n-1}\sum_{i=1}^{n} (X_i - \bar{X})^2
\end{align*}
$$

これにより、分母が $n-1$ である不偏分散の公式が導かれました。

解釈

分母の $n-1$ は自由度 (degrees of freedom) と呼ばれます。これは、標本平均 $\bar{X}$ を計算した時点で、データのうち $n-1$ 個の値が決まれば、残りの1個の値は自動的に決まってしまうため、「自由に動けるデータの数は実質的に $n-1$ 個である」と解釈されます。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?