1. 正規分布と標準偏差の関係
正規分布とは
正規分布(ガウス分布)は、確率論や統計学で非常に重要な分布で、次のような確率密度関数で表されます。
$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right)
$$
ここで、μ は平均値、σ は標準偏差です。標準偏差 σ は、データが平均値 の周りにどれだけ集中しているか、つまり分布の広がりを示します。
標準偏差が正規分布に適している理由
1. 正規分布の対称性
正規分布は左右対称な形をしており、平均値を中心に分布が広がっています。標準偏差はこの広がりを測る指標であり、対称な分布においては偏差(データ点が平均からどれだけ離れているか)を正確に測定することができます。
2. 偏差の二乗
標準偏差は、偏差の二乗の平均(分散)の平方根として定義されます。偏差を二乗することで、正負の偏差が打ち消し合わず、ばらつきの大きさを適切に反映できます。正規分布では、正負の偏差が等しく扱われるため、標準偏差がその特性を正確に表現します。
3. 最尤推定
正規分布に従うデータセットに対して、最尤推定を行うと、標準偏差 σ が最も尤もらしいばらつきの尺度として選ばれます。これは、データの分布全体の形状を最もよく表していることを意味し、統計解析において標準偏差が非常に重要である理由です。
2. 正規分布の式の導出
正規分布の式は、以下のようにして導出されます。
1. 背景:中心極限定理
中心極限定理によれば、どのような分布であっても、独立した同一分布のデータの和や平均が集まると、全体として正規分布に近づきます。これが正規分布の普遍性を支える理論的背景です。
2. 微分方程式からの導出
正規分布の確率密度関数 f(x) は、次の微分方程式を満たします:
$$
f'(x) = -\frac{x - \mu}{\sigma^2} f(x)
$$
この微分方程式を解くことで、正規分布の確率密度関数が得られます。この式が示すのは、正規分布の曲線が平均値 μ の周りでどのように傾き、広がるかということです。
3. 確率密度関数の決定
正規分布の確率密度関数を次のように仮定します:
$$
f(x) = A e^{B(x - \mu)^2}
$$
この形状から、適切な A と B の値を決定することで、最終的な確率密度関数が得られます。
4. 完成した確率密度関数
導出の結果、正規分布の確率密度関数は次のようになります:
$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right)
$$
3. 微分方程式の幾何学的意味
微分方程式
$$
\ f'(x) = -\frac{x - \mu}{\sigma^2} f(x) \
$$
は、正規分布の曲線がどのように傾き、広がるかを表しています。この式は、正規分布の特性を数学的に表現し、曲線の形状がどのように決定されるかを示しています。
- 傾きの符号: この式によれば、x が平均 μ より小さいとき、傾きは正の値を取り、平均値に向かって上昇します。逆に、x が平均より大きいとき、傾きは負になり、平均値に向かって下降します。
- 対称性: この微分方程式の構造により、正規分布の対称性が保たれます。左右対称な曲線は、平均値 μ を境に同じ形を持ちます。
4. なぜ物事は正規分布するのか
多くの自然現象や社会現象が正規分布に従う理由には、以下のような統計的・数学的な背景があります。
1. 中心極限定理
中心極限定理により、多くの独立した要因が足し合わされると、その結果が正規分布に従うことが示されます。これが、自然界で正規分布が頻繁に現れる理由の一つです。
2. 最大エントロピー原理
最大エントロピー原理によれば、特定の制約(平均と分散など)を満たす中で最も「無作為な」分布が正規分布です。これにより、正規分布は自然界における「最も自然な分布」として現れやすくなります。
5. なぜ正規分布には標準偏差が用いられるのか
まとめ
正規分布は、多くの自然現象や社会現象において非常に重要な分布です。その理由は、中心極限定理や最大エントロピー原理といった統計学の基本原理に基づいています。また、標準偏差は正規分布の特性を正確に反映するため、ばらつきを測るための最適な指標となります。
その他参考