統計検定準1級で頻出の1変数の変数変換の3パターンについてまとめました。この記事の内容が理解できれば、変数変換の問題は全て解けるようになると思います。特に3つ目の内容は準1級の範囲をやや超えているため、時間に余裕のある方におすすめします。
1. 典型的な変数変換の問題
正規分布 ${N(\mu, \sigma^2)}$ に従う確率変数 ${X}$ に対して、${Y = e^X, -\infty \leq x \leq \infty}$ と変換したときの、${Y}$ の確率密度関数を求める問題を考えます。確率変数 ${X}$ の確率密度関数を ${f_X(x)}$, 累積分布関数を ${F_X(x)}$、確率変数 ${Y}$ の確率密度関数を ${f_Y(y)}$, 累積分布関数を ${F_Y(y)}$ とします.
1 まず ${Y}$ の累積分布関数を求めます。${Y}$ に変数変換する式を代入して、関数が分かっている ${X}$の累積分布関数にするのがポイントです
\begin{align*}
F_Y(y) &= P(Y \leq y) \\
&= P(e^X \leq y) \\
&= P(X \leq \log y) \\
&= \int_{-\infty}^{\log y} f_X(x) dx \tag{1}
\end{align*}
確率密度関数は、累積分布関数を微分することで求まります。
$$ {\frac{d}{dx}F_X(x) = f_X(x)} $$
よって、逆に累積分布関数は確率密度関数の原始関数なので、
\begin{align*}
(1) &= \bigg[ F_X(x) \bigg]^{\log y}_{-\infty} \\
&= F_X(\log y) - F_X(-\infty) \\
&= F_X(\log y)
\end{align*}
ただし, ${F_X(-\infty) = 0}$ です。
2 ${F_Y(y)}$ を ${y}$ で微分して ${f_Y(Y)}$ 求めます。
$$ \frac {d} {dy} F_Y(y) = f_Y(y) $$
合成関数の微分より、
\begin{align*}f_Y(y) &= \frac{d}{dy} F_Y(y) \\
&= \frac{d}{dy} F_X(\log y) \\
&= f_X(\log y) \cdot \frac{d}{dy} \log y \\
&= f_X(\log y) \frac{1}{y}
\end{align*}
3 ${X}$ は ${\mathcal{N}(\mu, \sigma^2)}$ の正規分布に従うので、
$$ f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) $$
この ${x}$ に ${\log y}$ を代入すると、
\begin{align*}
f_Y(y) &= f_X(\log y) \cdot \frac{1}{y} \\
&= \frac{1}{y \sqrt{2\pi\sigma^2}} \exp\left( -\frac{(\log y - \mu)^2}{2\sigma^2} \right)
\end{align*}
2 変換後の範囲が無限大ではない問題
標準正規分布 ${N(0, 1)}$ に従う確率変数 ${X}$ に対して、${Y = X^2, -\infty \leq x \leq \infty}$ と変換したときの、${Y}$ の確率密度関数を求めます。
累積分布関数 ${F_Y(y)}$ を求めます。
\begin{align*}
F_Y(y) &= P(Y \leq y) \\
&= P(X^2 \leq y) \\
&= P(- \sqrt{y} \leq X \leq \sqrt{y}) \\
&= \int_{-\sqrt{y}}^{\sqrt{y}} f_X(x) \, dx \\
&= F_X(\sqrt{y}) - F_X(-\sqrt{y})
\end{align*}
2 ${F_Y(y)}$ を ${y}$ で微分して ${f_Y(Y)}$ 求めます。
\begin{align*}
f_Y(y) &= \frac{d}{dy} \left\{ F_X(\sqrt{y}) - F_X(-\sqrt{y}) \right\} \\
&= f_X(\sqrt{y}) \cdot \frac {d} {dy} \sqrt{y} - f_X(-\sqrt{y}) \cdot \frac {d} {dy} (-\sqrt{y}) \\
&= \frac {1} {2\sqrt{y}} f_X(\sqrt{y}) + \frac {1} {2\sqrt{y}} f_X(-\sqrt{y})
\end{align*}
3 ${X}$ は ${\mathcal{N}(0, 1)}$ の正規分布に従うので,
\begin{align*}
f_X(x) &= \frac{1}{ \sqrt{2 \pi}} \exp\left( -\frac {x^2} {2} \right) \end{align*}
この ${x}$ に ${\sqrt y}$ を代入すると、
\begin{align*}
f_Y(y) &= \sqrt{\frac{2}{\pi}} \exp\left( -\frac{y}{2} \right)
\end{align*}
3 範囲をしっかりと考える必要がある問題
${X}$ の確率密度関数が、${f_X(x)=\frac{2}{9}(x+1), -1 \leq x \leq 2}$ で与えられるとき、${Y=X^2}$ と変換したときの ${Y}$ の確率密度関数を求めます。
この問題では、${y}$ が ${1 \leq y \leq 4}$ のとき、${-1 \leq x \leq 2}$ よりマイナス側は ${X}$ の範囲外であることに注意する必要があります。
(i) ${y}$ が ${0 \leq y \leq 1}$ のとき
1 累積分布関数 ${F_Y(y)}$ を求めます。
\begin{align*}
F_Y(y) &= P(Y \leq y) \\
&= P(X^2 \leq y) \\
&= P(- \sqrt{y} \leq X \leq \sqrt{y}) \\
&= \int_{-\sqrt{y}}^{\sqrt{y}} f_X(x) dx \\
&= \int_{-\sqrt{y}}^{\sqrt{y}} \frac{2}{9}(x+1) dx \\
&= \frac{4}{9} \sqrt{y}
\end{align*}
2 ${F_Y(y)}$ を ${y}$ で微分して ${f_Y(Y)}$ 求めます。
\begin{align*}
f_Y(y) &= \frac{d}{dy} \frac{4}{9} \sqrt{y} \\
&= \frac{2}{9\sqrt{y}}
\end{align*}
(ii) ${y}$ が ${1 \leq y \leq 4}$ のとき
1 累積分布関数 ${F_Y(y)}$ を求めます。
\begin{align*}
F_Y(y) &= P(Y \leq y) \\
&= P(X^2 \leq y) \\
&= P(X^2 \leq 1) + P(1 \leq X^2 \leq y) \\
&= P(-1 \leq X \leq 1) + P(1 \leq X \leq \sqrt{y}) \\
&= \int_{-1}^{1} f_X(x) + \int_{1}^{\sqrt{y}} f_X(x) dx \\
&= \frac{4}{9} + \frac{1}{9}(y + 2\sqrt{y} - 3) \\
&= \frac{1}{9} + \frac{1}{9}(y + 2\sqrt{y} )
\end{align*}
2 ${F_Y(y)}$ を ${y}$ で微分して ${f_Y(Y)}$ 求めます。
\begin{align*}
f_Y(y) &= \frac{d}{dy} \bigg( \frac{1}{9} + \frac{1}{9}(y + 2\sqrt{y} ) \bigg) \\
&= \frac{1}{9}(1 + \frac{1}{\sqrt{y}})
\end{align*}