統計検定準1級の勉強のための解説記事となります。下記にご了承いただける方のみ、お読みください。
以下の動画でも解説していますので、見やすいほうでご覧ください。
# 学習のポイント・確率変数$X_n$の累積分布関数
$$F_n(x) = P(X_n \le x) ・・・①$$
・標準正規分布の累積分布関数
$$
\Phi(z) = P(Z \leq z) ・・・②
$$
・確率変数列{$X_n$}がある確率分布$G(x)$に分布収束あるいは法則収束するとは、 $G(x)$のすべての連続点$x$において
$$\lim_{n \to \infty} F_n(x) = G(x) ・・・③$$
が成り立つことである。
解法ノート
解答
確率変数 $X_n$ は平均 $\mu = 0$、分散 $\sigma^2 = \frac{1}{n}$ の正規分布に従っています。
確率変数 | $X_1$ | $X_2$ | ... | $X_n$ |
---|---|---|---|---|
従う分布 | $N(0, \frac{1}{1})$ | $N(0, \frac{1}{2})$ | ... | $N(0, \frac{1}{n})$ |
累積分布関数 | $$F_{1}(x)$$ | $$F_{2}(x)$$ | ... | $$F_{n}(x)$$ |
$F_{n}(x)$ の極限を求めることを容易にするために、まず確率変数を標準化します。標準化は、確率変数に対して線形変換を行うものであり、この変換は分布の「形」の本質的な性質を変えません。
標準化された確率変数 $Z_n$ を求めるには、次の式を使用します。
$$Z_n = \frac{X_n - \mu}{\sigma}$$
今回は、$\mu = 0$ であり、$\sigma^2 = \frac{1}{n}$ なので、$\sigma = \sqrt{\frac{1}{n}} = \frac{1}{\sqrt{n}}$ です。これらを上記の式に代入すると、次のようになります。
$$Z_n = \frac{X_n - 0}{\frac{1}{\sqrt{n}}} = \sqrt{n} X_n$$
したがって、標準化された確率変数は、 $Z_n=\sqrt{n} X_n$ です。
ここで、確率変数 $X_n$ について、式①を利用すると、累積分布関数は
$$
F_{n}(x) = P(X_n \leq x) = P(\sqrt{n}X_n \leq \sqrt{n}x)
$$
です。$Z_n=\sqrt{n} X_n$ であり、式②から、
$$
F_{n}(x) = P(Z_n \leq \sqrt{n}x) = \Phi(\sqrt{n}x)
$$
となります。
確率変数 | $X_1$ | $X_2$ | ... | $X_n$ |
---|---|---|---|---|
従う分布 | $N(0, \frac{1}{1})$ | $N(0, \frac{1}{2})$ | ... | $N(0, \frac{1}{n})$ |
累積分布関数 | $$F_{1}(x)= \Phi(\sqrt{1}x)$$ | $$F_{2}(x)= \Phi(\sqrt{2}x)$$ | ... | $$F_{n}(x)= \Phi(\sqrt{n}x)$$ |
次に、$F_n(x)$ の収束先を調べるため、$x$ の値で場合分けを行います。
-
$x > 0$ のとき、$x$を固定したまま $n \to \infty$ とすると $\sqrt{n}x \to \infty$ となるため、
$$\lim_{n \to \infty} F_n(x) = \lim_{n \to \infty} \Phi(\sqrt{n}x) = 1$$
です。したがって、$x > 0$ のときは、$G(x) = 1$ です。 -
$x < 0$ のとき、 $x$を固定したまま $n \to \infty$ とすると $\sqrt{n}x \to -\infty$ となるため、
$$\lim_{n \to \infty} F_n(x) = \lim_{n \to \infty} \Phi(\sqrt{n}x) = 0$$
となります。したがって、$x < 0$ のとき、$G(x) = 0$ です。 -
$x = 0$ のとき、
$$
F_n(0) = \Phi(0) = \frac{1}{2}
$$
となります。よって、確率分布 $G(x)$ は、$x=0$ で不連続となります。
ここで、一般に、累積分布関数は右連続であるという性質を用いると、$G(0) = 1$ となります。
$F_n(0) \neq G(0)$ てすが、分布収束の定義(式③)では、$G(x)$の連続点のみ、累積分布関数 $F_n(x)$ の収束を考えます。$x=0$ は $G(x)$ の不連続点であるため、分布収束の議論において、$F_n(0)$ は $G(0)$ とは異なる値を取っていても、問題ありません。
以上から、確率変数列{$X_n$} は、
確率分布:G(x) =
\begin{cases}
1 & (x \geq 0) \\
0 & (x < 0)
\end{cases}
に分布収束します。
コラム
・標準化せずに累積分布関数の動きを確認すると以下のようになります。
・分布収束では、確率変数列 {$X_n$} の各要素 $X_n$ に対応する「累積分布関数 $F_{n}(x)$ 」が、 $n \to \infty$ のときに、ある確率変数 $X_\infty$ の「累積分布関数 $F_{\infty}(x)$」 に「各点ごとに」収束することを考えます。( $X_\infty$ や $F_{\infty}(x)$という表現は通常用いませんが、参考として記載しています。)
・分布収束は、確率変数 $X_n$ が $X$ に収束することを意味しません。あくまでも、分布関数が収束することを意味します。