注意事項
※この記事は、下の記事の続編です。
絶対値を取った確率密度関数の平均と分散
内容を理解するためには高校数学で習う置換積分の知識が必要です。
数学大嫌いな方には大変辛い内容になってます。
背景
この前の記事では、長くなるからという理由で式変形を省略しました。
しかしこれでは
「式変形の結果に対する信頼性がない」
という大きな問題があるので、この記事を書くことにしました。
式変形をする意義
そもそも、なぜ式変形をするのか?
プログラミングにより、
定義の式を実装するだけの様に感じるかもしれません。
しかし、そんなことありません!!
理由は、今回求める平均$\mu_{|x|}$の定義の式は
\mu_{|x|}=\int_{-\infty}^{\infty}|X|\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm exp}\left(-\frac{\left(X-\mu_x\right)^2}{2\sigma_x^2}\right)dX
であり、これを計算しようとすると、
積分計算を行う、
"あの(区分求積とか台形公式とかモンテカルロとか...の)"
プログラムを実装することになります。
しかも、積分範囲が$-\infty$~$+\infty$なので、
・計算途中で数字がオーバーフローする
・アルゴリズムによってはシミュレーションと誤差が大きくなる
・計算時間がかかる
というリスクを排除できません。
ゆえに、式変形により、
\mu_{|x|}=\sqrt{\frac{2\sigma_x^2}{\pi}}{\rm
exp}\left(-\frac{\mu_x^2}{2\sigma_x^2}\right)+\mu_x\left(1-{\rm
erfc}\left(\sqrt{\frac{\mu_x^2}{2\sigma_x^2}}\right)\right)
として、多くのプログラミング言語にある、
mathライブラリ(exp関数、erfc関数)が使える形にしています。
これにより、上記のリスクをなくしています。
分散も同様です。前座はここまで。
この先、数学アレルギーの方は即ページ離脱を勧めます。
本題:式変形
Xの絶対値を取った平均
\begin{split}
\mu_{|x|}=&\int_{-\infty}^{\infty}|X|\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm exp}\left(-\frac{\left(X-\mu_x\right)^2}{2\sigma_x^2}\right)dX\\
&y=X-\mu_xと置くと以下のようになる。\\
&=\int_{-\infty}^{\infty}|y+\mu_x|\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm
exp}\left(-\frac{y^2}{2\sigma_x^2}\right)dy\\
&=\int_{-\infty}^{-\mu_x}-(y+\mu_x)\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm
exp}\left(-\frac{y^2}{2\sigma_x^2}\right)dy+\int_{-\mu_x}^{\infty}(y+\mu_x)\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm
exp}\left(-\frac{y^2}{2\sigma_x^2}\right)dy\\
&=-\int_{-\infty}^{-\mu_x}y\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm
exp}\left(-\frac{y^2}{2\sigma_x^2}\right)dy
-\mu_x\int_{-\infty}^{-\mu_x}\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm
exp}\left(-\frac{y^2}{2\sigma_x^2}\right)dy\\
&\quad+\int_{-\mu_x}^{\infty}y\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm
exp}\left(-\frac{y^2}{2\sigma_x^2}\right)dy
+\mu_x\int_{-\mu_x}^{\infty}\frac{1}{\sqrt{2\pi\sigma_x^2}}{\rm
exp}\left(-\frac{y^2}{2\sigma_x^2}\right)dy\\
&z=\frac{y}{\sqrt{2\sigma_x^2}}と置くと、dy=\sqrt{2\sigma_x^2}dzより\\
与式&=-\int_{-\infty}^{-\frac{\mu_x}{\sqrt{2\sigma_x^2}}}\sqrt{2\sigma_x^2}z\frac{1}{\sqrt{\pi}}{\rm
exp}(-z^2)dz-\mu_x\int_{-\infty}^{-\frac{\mu_x}{\sqrt{2\sigma_x^2}}}\frac{1}{\sqrt{\pi}}{\rm
exp}(-z^2)dz\\
&\quad+\int_{-\frac{\mu_x}{\sqrt{2\sigma_x^2}}}^{\infty}\sqrt{2\sigma_x^2}z\frac{1}{\sqrt{\pi}}{\rm
exp}(-z^2)dz+\mu_x\int_{-\frac{\mu_x}{\sqrt{2\sigma_x^2}}}^{\infty}\frac{1}{\sqrt{\pi}}{\rm
exp}(-z^2)dz\\
&ここで、\\
&{\rm
erf}(x)=\frac{2}{\sqrt{\pi}}\int_{0}^{x}e^{-t^2}dt\Longleftrightarrow{\rm
erfc}(x)=1-{\rm erf}(x)\Longleftrightarrow{\rm erf}(x)=1-{\rm erfc}(x)より、\\
与式&=-\sqrt{\frac{2\sigma_x^2}{\pi}}\left[-\frac{1}{2}{\rm
exp}(-z^2)\right]_{-\infty}^{-\frac{\mu_x}{\sqrt{2\sigma_x^2}}}-\frac{\mu_x}{2}{\rm
erfc}\left(\sqrt{\frac{\mu_x^2}{2\sigma_x^2}}\right)\\
&\quad+\sqrt{\frac{2\sigma_x^2}{\pi}}\left[-\frac{1}{2}{\rm
exp}(-z^2)\right]_{-\frac{\mu_x}{\sqrt{2\sigma_x^2}}}^{\infty}+\mu_x\left(1-\int_{-\infty}^{-\frac{\mu_x}{\sqrt{2\sigma_x^2}}}\frac{1}{\sqrt{\pi}}{\rm
exp}(-z^2)dz\right)\\
&=\frac{\sqrt{2\sigma_x^2}}{2\sqrt{\pi}}\left[{\rm
exp}\left(-\frac{\mu_x^2}{2\sigma_x^2}\right)-\frac{1}{{\rm exp}(\infty)}\right]-\frac{\mu_x}{2}{\rm
erfc}\left(\sqrt{\frac{\mu_x^2}{2\sigma_x^2}}\right)\\
&\quad+\frac{\sqrt{2\sigma_x^2}}{2\sqrt{\pi}}\left[-\frac{1}{{\rm exp}(\infty)}+{\rm
exp}\left(-\frac{\mu_x^2}{2\sigma_x^2}\right)\right]+\mu_x\left(1-\frac{1}{2}{\rm
erfc}\left(\sqrt{\frac{\mu_x^2}{2\sigma_x^2}}\right)\right)\\
&=\sqrt{\frac{2\sigma_x^2}{\pi}}{\rm
exp}\left(-\frac{\mu_x^2}{2\sigma_x^2}\right)+\mu_x\left(1-{\rm
erfc}\left(\sqrt{\frac{\mu_x^2}{2\sigma_x^2}}\right)\right)
\end{split}
ただし、$\mu_x=0$の時、
\mu_{|x|}=\sqrt{\frac{2\sigma_x^2}{\pi}}
となる。
Xの絶対値を取った分散
$F(X)$を絶対値を取る前の確率密度関数とする。
\begin{split}
&\sigma_{|X|}^2\\
&=\int_{-\infty}^{\infty}(|X|-\mu_{|x|})^2F(X)dX\\
&=\int_{-\infty}^{\infty}|X|^2F(X)dX-2\mu_{|x|}\int_{-\infty}^{\infty}|X|F(X)dX+\mu_{|x|}^2\int_{-\infty}^{\infty}F(X)dX\\
&=\int_{-\infty}^{\infty}X^2F(X)dX-2\mu_{|x|}^2+\mu_{|x|}^2\\
&=\int_{-\infty}^{\infty}X^2F(X)dX-\mu_{|x|}^2\\
&ここで、\sigma_{|x|}^2同様、
\sigma_x^2=\int_{-\infty}^{\infty}X^2F(X)dX-\mu_x^2より、\\
&\int_{-\infty}^{\infty}X^2F(X)dX=\sigma_x^2+\mu_x^2である。\\
&よって、\\
&\sigma_{|x|}^2=\sigma_x^2+\mu_x^2-\mu_{|x|}^2
\end{split}
ここまで、式変形を追って理解できた皆さん、お疲れ様でした。
質問があればコメント欄にどうぞ!