確率積分変換(Probability Integral Transform)
確率積分変換とは、確率変数 $X$ の累積分布関数(CDF)を用いて、新たな確率変数を作る方法です。この変換は、任意の確率変数を一様分布に変換することができます。
定義
確率変数 $X$ のCDFを $F_X$ とし、次のように新しい確率変数 $Y$ を定義します。
Y = F_X(X)
このとき、$Y$ は区間$[0, 1]$上の一様分布に従います。つまり、
Y \sim U(0, 1)
$$F_Y(y) = y,\ (0 \le y \le 1)$$
$$f_Y(y) = 1,\ (0 \le y \le 1)$$
となります。
証明
$Y = F_X(X)$ が $[0, 1]$ 上の一様分布に従うことを確認します。
任意の $Y \in [0, 1]$ に対して、$Y$ が $y$ 以下になる確率は次のようになります。
P(Y \le y)\ =\ P(F_X(X) \le y)
逆関数 $F_X^{-1}$ が存在する場合、$P()$の中身の両辺に逆関数を適用すると
=\ P(X \le F_X^{-1}(y))
となり、これは関数$F_X$の定義そのものです。
$$
=\ F_X(F_X^{-1}(y))
$$
逆関数の性質から、$F_X(F_X^{-1}(y)) = y$ となります。したがって、
P(Y \le y) = y
これは区間$[0,1]$の一様分布のCDFであるため、$Y$ は $[0, 1]$ 上の一様分布に従うことが分かります。どんな分布も一様分布に従うようになるので、Universality of the Uniformとも言われます。
標準正規分布の場合のシミュレーション(確率積分変換)
標準正規分布からランダムサンプルを抽出し、対応する点をPDF、CDFに表示し、CDFの値でヒストグラムを作っています。サンプルサイズは1000ですが大体一様に分布しているのが分かります。正規分布なので平均周りの値が出やすくなっていますが、CDFで平均周りの傾きが急になっているのでその分ヒストグラムではばらつきます。一時停止して確認してみてください。逆関数法
任意の分布のCDFとその逆関数が分かると一様分布が作れるなら、その逆もできそうです。逆関数法は、一様分布から任意の分布のサンプルを抽出する手法です。$Y$を区間$[0,1]$上の一様分布とし、抽出したい分布を$X$とすると
$$
F_X^{-1}(Y)
$$
は$X$に従います。
証明
$$
F_X^{-1}(X)\ =\ Y
$$
の両辺に$F_X$を作用させると
$$
X\ =\ F_X(Y)
$$
となるので、$F_X(Y)$は$X$に従います。