はじめに
この記事ではタイトルの事実の証明を述べます。つまり、$(\Omega, \mathscr{F}, P)$ を確率空間とし、$X = (X_1, \cdots, X_d) : \Omega \rightarrow \mathbb{R}^d$ を確率ベクトル(Borel 可測写像)とするとき、以下のように定義される分布関数 $F$ の連続点が $\mathbb{R}^d$ で稠密であることの証明を与えます。
$$
F : \mathbb{R}^d \ni x = (x_1, \cdots, x_d) \mapsto P(X \leq x) = P(X_1 \leq x_1, \dots, X_d \leq x_d) \in \mathbb{R}
$$
多次元の分布収束(法則収束)の定義の同値性について質問を受けた折に、この事実に類する事実を使いたかったのですが、頑張って検索しても証明が見つからず苦労したのでここにまとめておこうと思った次第です。より簡潔な証明をご存じの方はぜひコメントで教えてください。なお、以下の記事で紹介している通り、多次元分布については、その分布関数の不連続点は高々とは限らないことにご注意ください。
分布関数の連続点の稠密性の証明
補題1
互いに素な $\{ A_{\lambda} \}_{\lambda \in \Lambda} \subset \mathscr{F}$ について、$\{ \lambda \in \Lambda \mid P(A_{\lambda}) > 0 \}$ は高々可算。
証明
次の関係があります。
$$
\{ \lambda \in \Lambda \mid P(A_{\lambda}) > 0 \} = \bigcup_{n = 1}^{\infty} \left \{ \lambda \in \Lambda \mid P(A_{\lambda}) > \frac{1}{n} \right \} \quad (*)
$$
いま$n \in \mathbb{N}$ を固定するとき、相異なる $\lambda_1, \cdots, \lambda_k$ について
$$
P(A_{\lambda_1}) > 1/n,~ \dots,~ P(A_{\lambda_k}) > 1/n
$$
とすると、
$$
1 \geq P \left(\sum_{j=1}^k A_{\lambda_j} \right) = \sum_{j = 1}^k P(A_{\lambda_j}) > \frac{k}{n}
$$
となるので $\# \{ \lambda \in \Lambda \mid P(A_{\lambda}) > 1/n \} \leq n$ となります。よって、$(*)$ より補題の成立がわかります。
系
各軸についてそれに垂直な $n-1$ 次超平面で確率正なものは高々可算。すなわち、各 $ j \in \{1, \dots, d \}$ と $a \in \mathbb{R}$に対して $E_{a,j} := \mathbb{R} \times \cdots \times \mathbb{R} \times \{a\} \times \mathbb{R} \times \cdots \times \mathbb{R} $ (第 $j$ 成分が $a$ であるようなベクトル全体の集合)とおくと、
$$
\left\{ a \in\mathbb{R} \mid P(X \in E_{a,j}) > 0 \right\}
$$
は高々可算。
証明
$\{ (X \in E_{a,j}) \}_{a \in \mathbb{R}} $ は互いに素なので補題1より従います。
補題2
$F_j : \mathbb{R} \ni x \mapsto P(X_j \leq x) = P(X \in \mathbb{R} \times \cdots \times \mathbb{R} \times (-\infty, x] \times \mathbb{R} \times \cdots \times \mathbb{R} ) \in \mathbb{R}$ とおく。$a \in \mathbb{R}$ について $P(X \in E_{a,j}) = 0$ が成り立つならば $F_j$ は $a$ で連続である。逆に $F_j$ が $a$ で連続ならば $P(X \in E_{a,j}) = 0$ である。
証明
$\{ x_j \} \subset \mathbb{R}$ を $ x_k \searrow a$ なる点列とします。すると、$(-\infty, x_k] \supset (-\infty, x_{k+1}] ~ (\forall k)$ であり、
$$
\bigcap_{k=1}^{\infty} (-\infty, x_k] = (-\infty, a]
$$
となります。したがって、測度の連続性1より $\lim_{k \rightarrow \infty} F_j(x_k) = F_j(a)$ となります。よって、
$$
\lim_{x \searrow a} F_j(x) = F_j(a)
$$
となります。他方 $\{ y_k \} \subset \mathbb{R}$ を $y_k \nearrow a$ かつ $y_k \neq a ~ (\forall k)$ なる点列とする。すると、
$$
\bigcup_{k=1}^{\infty} \mathbb{R} \times \cdots \times (-\infty, y_k] \times
\cdots \times \mathbb{R} = (\mathbb{R} \times \cdots \times (-\infty, a] \times \cdots \times \mathbb{R} )
\setminus E_{a,j}
$$
となります。そして、$(-\infty, y_k] \subset (-\infty, y_{k+1}] ~(\forall k)$なので測度の連続性より
$$
\lim_{k \rightarrow \infty} F_j(y_k) = F_j(a) - P(X \in E_{a,j}) = F_j(a) \quad (*)
$$
となります。よって、
$$
\lim_{x \nearrow a} F_j(x) = F_j(a)
$$
となります。以上から $\lim_{x \rightarrow a} F_j(x) = F_j(a)$ が従います。
逆については、$(*)$ より成立がわかります。
補題3
$a_j \in \mathbb{R}, ~ \varepsilon > 0$ に対して、$\delta > 0$ が
$$
\forall x \in \mathbb{R}, ~ |x-a_j| < \delta \Rightarrow \left | F_j(x) - F_j(a_j) \right | < \varepsilon
$$
をみたすとする。このとき、任意の $b_1, \cdots, b_{j-1}, b_{j+1}, \cdots, b_{d} \in \mathbb{R}$ と $| x - a_j | < \delta$ なる $x \in \mathbb{R}$ について、$v_x = (b_1, \cdots, b_{j-1}, x, b_{j+1}, \cdots, b_d),$ $v_{a_j} = (b_1, \cdots, b_{j-1}, a_j, b_{j+1}, \cdots, b_d)$ とおくと、
$$
\left| P(X \leq v_x) - P(X \leq v_{a_j}) \right| < \varepsilon.
$$
証明
$x \geq a_j$ とすると、
$$
\begin{align}
| P(X \leq v_x) - P(X \leq v_{a_j}) |
&= P( X \in (-\infty, b_1] \times \cdots \times (a_j, x] \times \cdots \times (-\infty, b_d] ) \\
&\leq P(X \in \mathbb{R} \times \cdots \times (a_j, x] \times \cdots \times \mathbb{R}) \\
&= F_j(x) - F_j(a_j) \\
&< \varepsilon
\end{align}
$$
となります。$x < a_j$ のときも同様に示せます。
命題
$a = (a_1, \dots, a_d) \in \mathbb{R}^d$ とする。任意の $j = 1, \dots, d$ について、
$$
P(X_j = a_j) = P(X \in \mathbb{R} \times \cdots \times \{a_j\} \times \cdots \times \mathbb{R}) = P( X \in E_{a_j, j}) = 0
$$
となるならば $a$ は $F$ の連続点である。
証明
補題2より各 $j$ について $F_j$ は $a_j$ で連続ですので、任意の $\varepsilon > 0$ に対して、$\delta_j > 0$ が存在して、
$$
\forall x_j \in \mathbb{R}, ~~ |x_j - a_j| < \delta_j \Rightarrow |F_j(x_j) - F_j(a_j)| < \varepsilon
$$
となります。ここで、$\delta := \min \{ \delta_1, \dots, \delta_d \}$ とおきましょう。すると、任意の $x \in \mathbb{R}^d$ について、 $\| x - a \| < \delta$ ならば、各 $j$ について $|x_j - a_j | < \delta_j$となるので、補題3と合わせて
$$
\begin{align}
&\quad |F(x) - F(a)| \\
&= | P(X_1 \leq x_1, \dots, X_d \leq x_d) - P(X_1 \leq a_1, \dots, X_d \leq a_d) | \\
&\leq | P(X_1 \leq x_1, \dots, X_d \leq x_d) - P(X_1 \leq a_1, X_2 \leq x_2, \dots, X_d \leq x_d) | \\
&\quad + | P(X_1 \leq a_1, X_2 \leq x_2, \dots, X_d \leq x_d) - P(X_1 \leq a_1, \dots, X_d \leq a_d) | \\
&\leq \varepsilon + | P(X_1 \leq a_1, X_2 \leq x_2, \dots, X_d \leq x_d) - P(X_1 \leq a_1, \dots, X_d \leq a_d) | \\
&\leq \varepsilon + | P(X_1 \leq a_1, X_2 \leq x_2, \dots, X_d \leq x_d) - P(X_1 \leq a_1, X_2 \leq a_2, X_3 \leq x_3, \dots, X_d \leq x_d) | \\
&\quad + | P(X_1 \leq a_1, X_2 \leq a_2, X_3 \leq x_3, \dots, X_d \leq x_d) - P(X_1 \leq a_1, \dots, X_d \leq a_d) | \\
&\leq 2 \varepsilon + | P(X_1 \leq a_1, X_2 \leq a_2, X_3 \leq x_3, \dots, X_d \leq x_d) - P(X_1 \leq a_1, \dots, X_d \leq a_d) | \\
&\leq \cdots \leq (d-1)\varepsilon + | P(X_1 \leq a_1, \dots, X_{d-1} \leq a_{d-1}, X_d \leq x_d) - P(X_1 \leq a_1, \dots, X_d \leq a_d) | \\
&\leq d\varepsilon
\end{align}
$$
となります。よって、$F$ は $a$ で連続となります。
系
$F$ の連続点は $\mathbb{R}^d$ で稠密である。
証明
任意の解矩形 $I = (a_1, b_1)\times\cdots\times(a_d,b_d)$ について、$j$ を固定するとき、$I_j = (a_j, b_j)$ は非可算であるので、補題1の系と補題2より $F_j$ の連続点 $c_j$を $I_j$ から取ることができます($F_j$ の不連続点が高々可算なので $I_j$ の元がすべて不連続点ではありえない)。そして、上の命題より $c = (c_1, \dots, c_d) $ は $F$ の連続点であり、$c \in I$ となります。これは、$F$ の連続点が $\mathbb{R}^d$ で稠密であることを意味します。
-
測度の連続性については 大数の法則の初等的な証明 に証明を記載しています。 ↩