正規分布
自然なバラつきを表現する確率分布。
実験誤差など、一般的な自然に生まれるバラつきはこれに従う。
式
f(x) = \frac{1}{\sqrt {2\pi} \cdot \sigma}\exp{\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)}
- 期待値:$\mu$
- 分散:$\sigma^2$
標記(記号)
N(\mu, \sigma^2)
標準正規分布
正規分布のうち、$\mu = 0$、 $\sigma = 1$ としたもの。
- 標記(記号):$N(0,1)$
- 式:
f(x) = \frac{1}{\sqrt {2\pi}}\exp{\left(-\frac{x^2}{2}\right)}
標準正規分布表から数値を読み解く場合や、スケーリングの異なる条件での変数間を共通の尺度化する際によく用いられる。
なお、確率変数xを標準化したものをzとすると、
z = \frac{x-\mu}{\sigma}
標準正規分布は正規部布確率変数xをzに置き換えて、
f(x) = \frac{1}{\sqrt {2\pi}}\exp{\left(-\frac{z^2}{2}\right)}
と表示したものになる。
式について考察
自然な表現の式に類似しており、意外と理解しやすい。
<導入>
良く知られている、以下の状況について。
- 体温計の温度平衡(体温への漸近)
- コンデンサに一定電圧印加時の電荷の充電の時間変化の式
これら、一定環境下に置かれた対象がその環境に漸近(収束)していく時間推移は、
f(t) = A\cdot\left(1-\exp\left(-\frac{t}{B}\right)\right)+C
これはよく見かける。
<正規分布類似式>
逆に、高温物が低温環境温度に漸近する挙動、コンデンサの電荷の放電は、
f(t) = A' \cdot\left(\exp\left(-\frac{t}{B'}\right)\right)+C'
として表現可能。
C'は収束値であり、電荷の放電のように0に落ち着く場合にはC'=0。
0に落ち着くとすると、
f(t) = A' \cdot\left(\exp\left(-\frac{t}{B'}\right)\right) \tag{1}
正規分布は、式(1)と同じ形。
f(x) = \frac{1}{\sqrt {2\pi} \cdot \sigma}\exp{\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)}
f(z) = \frac{1}{\sqrt {2\pi}}\exp{\left(-\frac{z^2}{2}\right)}
係数の $\frac{1}{\sqrt{2\pi}\cdot\sigma}$ は、積分して1になるように調整した係数。
(確率分布なので、積分すると1にならないといけない)
式(1)は変数が時刻なので基本的に正の値を取る、一方向の思想。
正規分布は正負を考え、左右対称で且つ微分可能な自然さを表現するため2乗している、というイメージ。
たしかに、非常に自然な分布を表現していることが理解できる。