Python
scipy
数学

正規分布の確率密度関数の形があやふやになった時の対処法

More than 1 year has passed since last update.

本日の話題

平均 $\mu$ 標準偏差 $\sigma$ を持つ正規分布は次の形の確率密度関数を持ちます:

f(x;\mu,\sigma):=\frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)_{.}

ざっくりとした式の形の記憶の仕方

よくあるあるなのが, 標準の正規分布に従う確率密度関数

f_{\mathrm{std}}(x):=f(x;0,1)=\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2}{2}\right)

だけ覚えていて
たまに $\sigma$ の冪に二乗がつくんだっけ?どうだっけ???とこんがらがっちゃう時はありますが,
その時は落ち着いて

\int_{-\infty}^{\infty} e^{-x^2} dx = \sqrt{\pi}

が成り立つことを示せばよいわけです. 導出はご丁寧にも

さて,天下りになってしまいますが,変数変換を行うことで,

\begin{align}
\int_{-\infty}^{\infty} \exp\left(-\frac{x^2}{2\sigma^2}\right) dx 
&=\int_{-\infty}^{\infty} \sqrt{2}\sigma\exp\left(-y^2\right) dy \quad \left(\mathrm{where}\ \ y=\frac{x}{\sqrt{2}\sigma}\right)\\
&=\sqrt{2\pi}\sigma
 \end{align}

すなわち,

\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{x^2}{2\sigma^2}\right) dx = 1 

成り立ちます.確率密度関数の全領域での積分が1になることを考慮すると, 移動のパラメータ(つまり $\mu$ の有る無し)を除いて積分の内部の式と $f(x;\mu,\sigma)$ の形が一致しないといけないはずです.

ここまでの導出を記憶にしておくと $\sigma$ の冪はなんだっけ??? のボケを回避できると思います.

scipy.stats.norm のドキュメントから

Notes

The probability density function for norm is:

f(x)=\frac{\exp⁡(−x^2/2)}{\sqrt{2\pi}}

The survival function, norm.sf, is also referred to as the Q-function in some contexts (see, e.g., Wikipedia’s definition).

The probability density above is defined in the “standardized” form. To shift and/or scale the distribution use the loc and scale parameters. Specifically, norm.pdf(x, loc, scale) is identically equivalent to norm.pdf(y) / scale with y = (x - loc) / scale.

loc や scale はここでは各々 $\mu$, $\sigma$ に対応します.ここで

$f(x)=\frac{\exp⁡(−x^2/2)}{\sqrt{2\pi}}$, $y=(x-\mu)/\sigma$ と置くと

\begin{align}
\mathrm{norm.pdf(y)/scale}
&=f(y)/\sigma \\
&= \frac{\exp⁡(−(x-\mu)^2/2\sigma^2)}{\sqrt{2\pi}\sigma} \\
&=f(x;\mu,\sigma)
\end{align}

だから norm.pdf(x,loc,scale) に対応する数式がわかりましたね.

ということで

f(x;\mu,\sigma)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)

分母のシグマの冪は1(というか単純にシグマで割る)ということと exp 内の シグマの二乗は分子側の x の2乗に関連しているということを理解しておけば混乱はしないはず.

正直バカみたいに暗記する覚えることは嫌いでして,勉強するにあたっては理由付きで記憶しておくのがよいと思います.