1変数の変数変換による確率密度関数の導出
公式ワークブックとは違うが, 自分なりに理解した方法で説明する.
確率変数 $X$ の確率密度関数を $f_X(x)$, 累積分布関数を $F_X(x)$とする.
このとき、$Y = g(X)$ と変数変換した確率変数 $Y$ の確率密度関数 $f_Y(y)$ を考える.
まず, 確率変数 $Y$ の累積分布関数を $F_Y(y)$ を求める.
\begin{align*}
F_Y(y) &= P(Y \leq y) \\
&= P(g(X) \leq y) \\
&= P(X \leq g^{-1}(y)) \tag{1}
\end{align*}
次に, $Y$ の確率密度関数 $f_Y(y)$ は、$F_Y(y)$ を $y$ で微分することで求められるので, (1) を $y$ で微分する.
\begin{align*}
f_Y(y) &= \frac{d}{dy} F_Y(y) \\
&= \frac{d}{dy} P(X \leq g^{-1}(y)) \\
&= \frac{d}{dy} \int_{-\infty}^{g^{-1}(y)} f_X(x)dx \\
&= \frac{d}{dy} \left\{ F_X(g^{-1}(y)) - F_X(-\infty) \right\} \\
&= f_X(g^{-1}(y)) \cdot \frac{d}{dy} g^{-1}(y)
\end{align*}
ただし, $F_X(-\infty) = 0$
よって確率密度関数 $f_Y(y)$ は, $g(x)$が単調減少である場合も考慮し, 絶対値をつけて以下の式で求まる.
f_Y(y) = f_X(g^{-1}(y)) \cdot \left| \frac{d}{dy} g^{-1}(y) \right|
例題 4.1(3)で確認
$Y = e^X$ のとき、$Y$ の分布関数 $F_Y(y)$ は以下のように求まる.
\begin{align*}
F_Y(y) &= P(Y \leq y) \\
&= P(e^X \leq y) \\
&= P(X \leq \log y) \\
&= \int_{-\infty}^{\log y} f_X(x) \, dx \\
&= F_X(\log y) - F_X(-\infty)
\end{align*}
よって $Y$ の確率密度関数 $f_Y(y)$ は,
\begin{align*}
f_Y(y) &= \frac{d}{dy} \left\{ F_X(\log y) \right\} \\
&= f_X(\log y) \cdot \frac {d} {dy} \log y \\
&= f_X(\log y) \cdot \frac{1}{y} \tag{2}
\end{align*}
ここで, $X$ は以下のように $\mathcal{N}(\mu, \sigma^2)$ の正規分布に従うので,
$$
f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right)
$$
この $x$ に $\log y$ を代入すると (2) は,
\begin{align*}
f_Y(y) &= f_X(\log y) \cdot \frac{1}{y}\\
&= \frac{1}{y \sqrt{2\pi\sigma^2}} \exp\left( -\frac{(\log y - \mu)^2}{2\sigma^2} \right)
\end{align*}
データの変換
対数変換
データが正規分布に従うようにする. 対数変換を行うと, 非負値のデータを $-\infty$ から $\infty$ の値を取るデータに変換できる.
$$
\log x
$$
べき乗変換
データが正規分布に従うようにする.
$$
x^a
$$
Box-Cox変換
対数変換とべき乗変換をひとまとめにした変換. パラメータ $\lambda$ に対し以下のように変換する.
\left \{
\begin{array}{l}
\frac {x^{\lambda}-1} {\lambda} & (\lambda \ne 0) \\
\log x & (\lambda = 0)
\end{array}
\right.
Box-Cox変換は非負のデータしか変換できない.
ロジット変換
確率 $p$ のような 0 から 1 の値しかとらないものを $-\infty$ から $\infty$ を取る値に変換する.
$$
\log { \frac {p} {1-p} }
$$
プロビット変換
ロジット変換同様に, 0 から 1 の値しかとらないものを $-\infty$ から $\infty$ を取る値に変換する.
標準正規分布の累積分布関数 $\Phi(x)$ の逆関数 $\Phi^{-1}$ によって変換.
$$
\Phi(x) = \int_{-\infty}^{x} \frac {1} {\sqrt {2\pi}} e^{-t^2/2} dt
$$