確率密度関数の変数変換の公式
今回は、変数変換が1対1の関数の場合のみを扱います。
連続型確率変数$X$の確率密度関数を$f(x)$とする。
このとき、新たな確率変数$Y=g(X)$の確率密度関数は、
\frac{f(g^{-1}(y))}{|g'(g^{-1}(y))|}
つまり、
\frac{f(x)}{|g'(x)|}
の$x$を$y$に変換したものになります。
より一般には、複数変数の場合、
確率変数$\textbf{X}$の確率密度関数$f(\textbf{x})$を、$\textbf{Y}=\textbf{T}(\textbf{X})$のよって変換するとき、$\textbf{Y}$の確率密度関数は、
\left| \frac{\partial \textbf{x}}{\partial \textbf{y}} \right| f(\textbf{T}^{-1}(\textbf{y}))
つまり、
\frac{f(\textbf{x})}{\left| \frac{\partial \textbf{y}}{\partial \textbf{x}} \right| }
の$\textbf{x}$を$\textbf{y}$に変換したものになります。
ここで、$\left| \frac{\partial \textbf{x}}{\partial \textbf{y}} \right| $はヤコビアンです。
$X$の確率密度関数$f(x)$を変換式の微分(ヤコビアン)で割ると、$Y$の確率密度関数になるのです。
簡単な例で考えてみましょう。
例1
確率変数$X$の確率密度関数が、$f(x)=\frac{1}{10} (0\leq x \leq 10)$で与えられているとします。このとき、確率変数$Y=2X+5$の確率密度関数$h(y)$は、
h(y) = \frac{f(x)}{|g'(x)|}=\frac{1/10}{2} =\frac{1}{20} \qquad (5\leq y \leq 25)
となります。
この公式は、$Y=2X+5$が1対1の関数だから使えるのです。$Y=2X^2+5$の場合は、$Y=7$に対応する$X$は、$X=\pm 1$と2つ存在してしまいます。
少し難しいですが、よく登場する対数正規分布についても計算してみましょう。
例2
確率変数$X$の確率密度関数が、$f(x)=\frac{1}{\sqrt{2\pi}\sigma} \exp (-\frac{(x-\mu)^2}{2})$で与えられているとします。このとき、確率変数$Y=e^{X}$の確率密度関数$h(y)$は、
h(y) = \frac{f(x)}{|g'(x)|} = \frac{\frac{1}{\sqrt{2\pi}\sigma} \exp (-\frac{(x-\mu)^2}{2})}{e^{x}} = \frac{1}{\sqrt{2\pi}\sigma y} \exp \left(-\frac{(\log y - \mu)^2}{2} \right)
となります。$x=\log y$, $g'(x)=e^x$を用いました。
正規分布に従う確率変数$X$を、$Y=e^X$によって変換した$Y$は、対数正規分布と呼ばれます。
証明は省略しますが、対数正規分布の期待値・分散は、
E[Y] = \exp \left(\mu+\frac{1}{2}\sigma^2 \right)
V[Y] = \exp (2\mu+\sigma^2) \lbrace \exp(\sigma^2)-1 \rbrace
となります。
おまけ
対数正規分布は、金融分野で良く用いられています。それは、幾何ブラウン運動と呼ばれる株価の変動予測モデルに登場します。
ある時点$t$における株価が微小区間にどれほど変化するかが、
dX(t) = \mu dt + \sigma dz(t)
で与えられるブラウン運動という数理モデル(確率過程)があります。
$\mu dt$の項は、(平均変化率$\mu$)×(時間$dt$)で期待変化量を示していて、$\sigma dz(t)$の項は、(分散$\sigma$)×(誤差項$z(t)$)で、期待変化量からの誤差を示しています。
$z(t)$の意味などについては、以下の記事をご覧ください。
$\mu$はドリフトと呼ばれ、平均的な株価の上昇率・下降率を表していて、$\sigma$はボラティリティと呼ばれ、ドリフトからのずれ・変動を表しています。
先ほどのブラウン運動の微分方程式を解くと、
X(t) = X(0) + \mu t +\sigma z(t)
このブラウン運動には、株価ではありえないマイナスの値を取ってしまう欠点があります。ここで、ブラウン運動の左辺を変化量ではなく変化率に変更した幾何ブラウン運動という確率過程がしばしば用いられます。
幾何ブラウン運動は、
\frac{dX(t)}{X(t)} = \mu dt + \sigma dz(t)
で記述されます。
今回登場した対数正規分布を用いると、この微分方程式を解くことができます。(ちなみに、導出には伊藤の公式という非常に難しい確率過程の公式を使います。)
X(t) = X(0) \exp \left( (\mu-\frac{1}{2}\sigma^2)t+\sigma z(t) \right)
この解の形から、幾何ブラウン運動は正の値しかとらないことがわかります。実際の株価も生の値しかとらないことから、応用しやすいモデルになっています。
まとめると以下のようになります。
ブラウン運動
dX(t) = \mu dt + \sigma dz(t)
X(t) = X(0) + \mu t +\sigma z(t)
時刻$t=T$を固定した分布は、正規分布$N(X(0)+\mu T, \sigma^2 T)$に従う。
幾何ブラウン運動
\frac{dX(t)}{X(t)} = \mu dt + \sigma dz(t)
X(t) = X(0) \exp \left( (\mu-\frac{1}{2}\sigma^2)t+\sigma z(t) \right)
時刻$t=T$を固定した分布は、対数正規分布$N(\log X(0)+(\mu -\frac{1}{2}\sigma^2 ) T, \sigma^2 T)$に従う。