概要
正規分布(Normal distribution)は、期待値(平均)μ、分散σ²をパラメータとする連続確率分布で、多くの自然現象や社会現象の測定値でよく現れるものです。釣鐘型(ベル型)のグラフで、左右対称という特徴があります。
統計的推測(点推定・区間推定・検定)で非常に重要な位置を占め、母集団の分布が正規であることや標本数が十分大きいこと、が条件となる場面で使われます。
各分布の使用条件
数式
正規分布 $X \sim N(\mu, \sigma^2)$ の確率密度関数は:
$$
f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right)
$$
標準正規分布($\mu = 0, \sigma^2 = 1$)のとき:
$$
Z = \frac{X - 0}{1} = X, \quad f_Z(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2}
$$
標本平均 $\bar{X}$ の分布(母集団が正規、母分散が既知):
$$
\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)
$$
このとき、標本平均を標準化すると Z統計量 が得られる:
$$
Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1)
$$
母分散が未知の場合には、標本平均の標準誤差を不偏分散 $s^2$ を使って推定し、次のような t 分布を使う:
$$
T = \frac{\bar{X} - \mu}{s / \sqrt{n}} \sim t(n-1)
$$
数式の説明
-
確率密度関数の形
- 指数関数の部分 $\exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right)$ が、平均から離れるほど値が小さくなることを示す。
- 分散 σ² が大きいほど裾(端っこまでの広がり)が厚くなる。
-
標準化
-
$X$ を標準正規分布 $Z$ に変換することで、表を使って確率を取り扱いやすくする。
-
標本平均を使う場合は、分散が $\sigma^2/n$ に縮小するため、標準化は
$$
Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}
$$で行う。
-
-
t分布との使い分け
- 母分散が未知なときは、$s$ を使い、自由度 $n - 1$ の t 分布を使用。
- 標本数が十分大きければ t 分布も標準正規分布に近づく。
問題例
問題1:標準正規分布の確率
標準正規分布 $Z \sim N(0,1)$ に従う確率変数について、次を求めよ。
$$
P(-0.81 < Z < -0.45)
$$
解き方
-
標準正規分布表を用いて次を調べる。
$\Phi(z) = P(Z \leq z)$ とすると、
$\Phi(-0.45) \approx 0.3264$、$\Phi(-0.81) \approx 0.2090$ -
よって、
$$
P(-0.81 < Z < -0.45) = \Phi(-0.45) - \Phi(-0.81) = 0.3264 - 0.2090 = 0.1174
$$
問題2:一般の正規分布からの変換
確率変数 $X \sim N(100, 15^2)$ のとき、
$$
P(90 < X < 120)
$$
を求めよ。
解き方
-
標準化する:
$$
Z = \frac{X - \mu}{\sigma} = \frac{X - 100}{15}
$$ -
境界を変換:
$$
P(90 < X < 120) = P\left(\frac{90-100}{15} < Z < \frac{120-100}{15}\right) = P(-0.67 < Z < 1.33)
$$ -
標準正規分布表から:
$\Phi(1.33) \approx 0.9082$、$\Phi(-0.67) \approx 0.2514$ -
よって:
$$
P(-0.67 < Z < 1.33) = 0.9082 - 0.2514 = 0.6568
$$
問題3:標本平均を用いた場合
母平均 $\mu = 50$、母分散 $\sigma^2 = 16$ の正規分布に従う集団から、標本サイズ $n = 25$ を抽出した。標本平均 $\bar{X}$ が 48 以上となる確率を求めよ。
解き方
-
標本平均の分布は:
$$
\bar{X} \sim N\left(50, \frac{16}{25}\right) = N(50, 0.64)
$$ -
標準化:
$$
Z = \frac{\bar{X} - 50}{\sigma / \sqrt{n}} = \frac{\bar{X} - 50}{4/\sqrt{25}} = \frac{\bar{X} - 50}{0.8}
$$ -
境界を変換:
$$
P(\bar{X} \geq 48) = P\left(Z \geq \frac{48 - 50}{0.8}\right) = P(Z \geq -2.5)
$$ -
標準正規分布表から:$\Phi(-2.5) \approx 0.0062$
-
よって:
$$
P(\bar{X} \geq 48) = 1 - 0.0062 = 0.9938
$$
関連する数式
-
標本平均の分布(母分散既知)
$$
\bar{X} \sim N\left(\mu,; \frac{\sigma^2}{n}\right)
$$ -
Z統計量(標本平均の標準化)
$$
Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1)
$$ -
t統計量(母分散未知)
$$
T = \frac{\bar{X} - \mu}{s / \sqrt{n}} \sim t(n-1)
$$ -
信頼区間(母分散既知)
$$
\mu \in \left[ \bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \right]
$$ -
信頼区間(母分散未知)
$$
\mu \in \left[ \bar{X} \pm t_{n-1, \alpha/2} \cdot \frac{s}{\sqrt{n}} \right]
$$