統計検定準1級の勉強のための解説記事となります。下記にご了承いただける方のみ、お読みください。
以下の動画でも解説していますので、見やすいほうでご覧ください。
学習のポイント
・極限分布:確率変数列 ${X_n}$ がある確率分布 $G(x)$ に分布収束するときの$G(x)$のこと
・$\beta$を尺度パラメータ、$\mu$を位置パラメータとしたときの位置・尺度変換は、
$$
y = \frac{x - \mu}{\beta} ・・・①
$$
・自然対数の底の$x$乗
e^x =\exp(x) = \lim_{n \to \infty} \left(1 + \frac{x}{n}\right)^n ・・・②
・位置パラメータ $\mu$、尺度パラメータ $\beta$ のガンベル分布の累積分布関数は、以下の式で表されます。
$$
F(x; \mu, \beta) = \exp\left(-\exp\left(-\frac{x - \mu}{\beta}\right)\right) ・・・③
$$
解答
確率変数 $X_1, X_2, \dots, X_n$ は、独立に平均$1$の指数分布に従います。
平均が$1$の指数分布の累積分布関数は、以下の式で表されます。ここで、$X_i$は指数分布に従うため、$x \ge 0$ です。
F(x; 1) = 1 - \exp(-x) (x ≥ 0)
確率変数 | $X_1$ | $X_2$ | ... | $X_n$ |
---|---|---|---|---|
従う分布 | $\text{Exp}(\lambda=1)$ | $\text{Exp}(\lambda=1)$ | ... | $\text{Exp}(\lambda=1)$ |
累積分布関数 | $P(X_1 \leq x)=(1 - \exp(-x)) $ | $P(X_2 \leq x)=(1 - \exp(-x)) $ | ... | $P(X_n \leq x)=(1 - \exp(-x)) $ |
1. 最大値 $M_n$ の分布
まず、$M_n$ がある値 $x$ 以下となる確率 $P(M_n \le x)$ を考えます。$M_n$ は $X_1, X_2, \dots, X_n$ の最大値なので、$X_1, X_2, \dots, X_n$ のすべてが $x$ 以下となります。よって、
P(M_n \le x) = P(X_1 \le x, X_2 \le x, \dots, X_n \le x)
です。ここで、$P(X_1 \le x, X_2 \le x, \dots, X_n \le x)$ は、$X_1 \le x$ かつ $X_2 \le x$ かつ ... かつ $X_n \le x$ となる確率を表しています。
次に、確率変数 $X_1, X_2, \dots, X_n$ は互いに独立であるため、上記の式は、各々の確率の積で表すことができ、
P(X_1 \le x, X_2 \le x, \dots, X_n \le x) = P(X_1 \le x) P(X_2 \le x) \cdots P(X_n \le x)
です。
また、各 $X_i$ は平均1の指数分布に従うと仮定されており、平均1の指数分布の累積分布関数は $1 - \exp(-x)$ (ただし $x \ge 0$)で表されるため、
P(X_1 \le x) P(X_2 \le x) \cdots P(X_n \le x) = (1 - \exp(-x))^n
です。
以上をまとめると、$M_n$ の累積分布関数は
\begin{align*}
P(M_n \le x) &= P(X_1 \le x, X_2 \le x, \dots, X_n \le x) \\
&= P(X_1 \le x) P(X_2 \le x) \cdots P(X_n \le x) \\
&= (1 - \exp(-x))^n
\end{align*}
となります。
確率変数$M_n$ | $M_1$ | $M_2$ | ... | $M_n$ |
---|---|---|---|---|
$M_n$の累積分布関数 | $(1 - \exp(-x))$ | $(1 - \exp(-x))^2$ | ... | $(1 - \exp(-x))^n$ |
2. 位置・尺度変換した確率変数の極限分布
$M_n$ について、式①をもとに位置・尺度変換します。今回は、位置を $-\log n$ だけ変更した確率変数 $Y_n = M_n - \log n$ を考えます。
$Y_n$ の累積分布関数を計算すると、
\begin{align*}
P(Y_n \le y) &= P(M_n - \log n \le y) \\
&= P(M_n \le y + \log n) \\
&= \left(1 - \exp(-(y + \log n))\right)^n \\
\end{align*}
です。ここで、
$$
\exp(-(y + \log n)) = \exp(-y) \cdot \exp(-\log n) = \frac{\exp(-y) }{n}
$$
なので、
\begin{align*}
P(Y_n \le y) &= \left(1 - \frac{\exp(-y)}{n}\right)^n \quad \\
&= \left(1 + \frac{-\exp(-y)}{n}\right)^n
\end{align*}
となります。
確率変数$M_n$ | $M_1$ | $M_2$ | ... | $M_n$ |
---|---|---|---|---|
確率変数$Y_n$ | $M_1 - \log 1$ | $M_2 - \log 2$ | ... | $M_n - \log n$ |
$Y_n$の累積分布関数 | $1+(-\exp(-y))$ | $(1+\frac{-\exp(-y)}{2})^2$ | ... | $(1+\frac{-\exp(-y)}{n})^n$ |
ここで、$y$ を固定したまま $n \to \infty$ とすると、式②より、
\begin{align*}
\lim_{n \to \infty} P(Y_n \le y) &= \lim_{n \to \infty} \left(1 + \frac{-\exp(-y)}{n}\right)^n \\
&= \exp(-\exp(-y)) \quad
\end{align*}
です。
よって、確率変数$M_n$を位置・尺度変換した確率変数 $Y_n(=M_n - \log n)$ の分布は、$n \to \infty$ のとき、式③より、$\mu=0$, $\beta=1$ のガンベル分布に収束し、極限分布が$\mu=0$, $\beta=1$ のガンベル分布と求まりました。
指数分布の確率密度関数と累積分布関数
・指数分布の確率密度関数
f(x; \lambda) =
\begin{cases}
\lambda e^{-\lambda x} & x \geq 0 \\
0 & x < 0
\end{cases}
・指数分布の累積分布関数
F(x) = P(X \leq x) =
\begin{cases}
0 & x < 0 \\
1 - e^{-\lambda x} & x \geq 0
\end{cases}