この記事は総研大 統計科学コース Advent Calendar 2025に投稿するために書いたものです.
もっとタメになりそうな記事もたくさんあるのでぜひ!
はじめに
測度論に関する輪読が統計科学コースで開かれていて,そのなかで生じた疑問の答えに現れた集合が面白いということで,統計からは離れているかもしれませんが,考えたことを紹介しようと思います.
専門からはかなり外れるのでひょっとすると何か知られている結果があるかもしれませんが,そのときはこっそり教えてもらえるとすっきりして助かります.
背景
本題に入る前に問題のブツが私たちの前に現れた流れを少し説明します.(私自身は輪読に参加していないためこの辺りの流れの説明には間違いがある可能性があるので,ざっくり流してもらえればと思います)
話はLebesgue測度の正則定理から始まります.これは雑に言えば$ \mathbb{R} $上の可測集合の測度が内側からは閉集合,外側からは開集合で近似していくことができることを言っています.
逆に一般には内側から開集合,外側から閉集合で近似することは出来ません.ここで例として有理数全体の集合$ \mathbb{Q} $について考えてみました.$ \mathbb{Q} $を含む最小の閉集合は$ \mathbb{R} $であることが知られています.ですから$ \mathbb{Q} $を含む閉集合のLebesgue測度は$ \infty $ということになって,$ \mathbb{Q} $の測度は0なのでこれでは全く(Lebesgue測度の意味で)近似できていません.
ここまできて一つ疑問が生じました.$ \mathbb{Q} $が含まれる開集合として自然に思いつくものもまた$ \mathbb{R} $です.ただ定理の主張からすると$ \mathbb{Q} $を外側から開集合で近似していくことができるはずなので,$ \mathbb{R} $より小さく$ \mathbb{Q} $が含まれる開集合でしかも$ \mathbb{Q} $を上手く近似できるものが存在することになります.
私たち(with GPTくん)がみつけた例は次のようなものでした.
$ \mathbb{Q} $は可算集合なので,$ q_1, q_2,\ldots$のように番号を振ることができます.
さらに適当に$ \epsilon>0 $をとってきて,集合$ A_q$を
$$ A_q=\bigcup_{n=1}^\infty(q_n-2^{-n-1}\epsilon,q_n+2^{-n-1}\epsilon) $$
と定めます.するとこれは開集合であり,その測度は
$$ \sum_{n=1}^\infty2^{-n}\epsilon=\epsilon$$
で上から抑えられます.
この$A_q$は確かに$ \mathbb{Q} $を含み,測度が$\epsilon$以下であることからも$\mathbb{R}$より真に小さい集合となっています.さらに$\epsilon$を小さくしていけば$ \mathbb{Q} $の測度にいくらでも近づけられます.しかし(少なくとも私の)直観的には不思議で仕方のないものとなっています.というのも$ \mathbb{Q} $という「密な」集合をとってきて,しかもその各点の周りの区間を考え,その和集合をとったにもかかわらず穴だらけだというわけです.
そこで今回の記事ではこの不思議な集合$A_q$について考えていくことにします.
Rとの差って?
前節の最後にも述べたように,上で定義した$A_q$は$\mathbb{R}$より真に小さい集合であるはずです.つまり$A_q$に入らない実数が(なんなら非常に多く)存在するはずです.それを見つけたいというのが考えていることとなります.
見つけるといっても,$A_q$に含まれない実数を構成することは出来ません.それは$ q_1, q_2,\ldots$の並べ方を与えていないところからも明らかでしょう.だから$B\subseteq\mathbb{R}$をとってきて,これの全ての要素は含まれないよね,ということを言うのが現実的でしょう.それに向けていくつかのことを考えたので,紹介していきます.
- 特定の集合(例えば1点)を含まないように$ q_1, q_2,\ldots$を構成出来るか
- 特定の集合を全て含むように$ q_1, q_2,\ldots$を構成出来るか
以下簡単のため$\epsilon=1$とします.
問題1:特定の集合を含まないように出来るか
どのような集合$B\subseteq\mathbb{R}$であれば,$B\cap A_q=\emptyset$となるように$ q_1, q_2,\ldots$を構成出来るでしょうか.
まずは1点$b$が含まれないようにすることを考えましょう.
まず$b$が有理数だといずれ$ q_1, q_2,\ldots$の中に現れてしまうので,$b$は無理数である必要があります.
次に$|b-q_n|<2^{-n-1}$がいずれかの$n$で成り立てば,$b\in A_q$となります.よって,
$$q_n\in \tilde C_n=(\mathbb{R}\backslash (b-2^{-n-1},b+2^{-n-1}))\cap\mathbb{Q}$$
となる必要があります.
すると,容易に$\bigcup_{n=1}^\infty \tilde C_n=\mathbb{Q}$となることがわかります.また $ C_n=\tilde C_n\backslash\tilde C_{n+1}$とおくと,各$C_n$は可算なのでそれぞれ$c_{n1},c_{n2},\ldots$と順番付が出来ます.
あとは$q_1,q_2,\ldots$を$c_{11},c_{21},c_{12},c_{31},c_{22},c_{13},\ldots$のように$\mathbb{N}$から$\mathbb{N}^2$への全単射を作る際の要領で定めていけば,目的が達成されます.
$B\subseteq\mathbb{R}$が有限集合である場合も,全ての要素が無理数であれば同様の方法で$ q_1, q_2,\ldots$を構成出来ます.
では$B\subseteq\mathbb{R}$が無限集合である場合はどうかと言うと,まず上と同様に$q_n$が含まれるべき集合$\tilde C_n$を構成できます.これは$B$の任意の点から距離が$2^{-n-1}$以上離れた有理数全体の集合で,$B=\mathbb{R}$の場合など空集合になる場合もあります.このようなときは当然$ q_1, q_2,\ldots$を構成できないので,それ以外の場合(単調性も合わせると$\tilde C_1$が空でない場合)を考えましょう.
各$\tilde C_n$が(高々)可算であることは明らかなので,問題は$\bigcup_{n=1}^\infty\tilde C_n=\mathbb{Q}$となるかということにあります.
これは$B$上の点列で有理数に収束するものが存在しないことと同値です.実際ある有理数$q$に収束する$B$上の点列が存在するとき,$q$にいくらでも近い$B$の点が存在するので,$q$は全ての$\tilde C_n$に含まれません.逆にそのような点列が存在しないならば,$q$は$B$の閉包に含まれないので十分大きな$n$が存在して,
$$(q-2^{-n-1},q+2^{-n-1})\subseteq\bar B^c\subseteq B^c.$$
したがって$q\in\tilde C_n$となります.
実は,「$B$上の点列で有理数に収束するものが存在しない」ことと「$B\cap A_q=\emptyset$となる$ q_1, q_2,\ldots$が存在する」ことが同値であると示せます.
$B$が高々可算であることがこれらの必要条件となるのではないかと予想してますが,それは未解決です.
問題2:特定の集合を含むように出来るか
まず有限集合や$(0,1/2)$のような幅が1未満の区間など最初の有限個の$q_1,q_2,\ldots,q_n$を上手く定めることで,
$$ B\subseteq\bigcup_{k=1}^n(q_k-2^{-k-1},q_k+2^{-k-1})$$
となる場合は残りの$q$を適当に決めれば良いだけなので簡単です.
次に$B$が(非有界で)可算であるときを考えましょう.$B$の要素を$b_1,b_2,\ldots$とします.
$\tilde C_n=(b_n-2^{-n(n+1)/2-1},b_n+2^{-n(n+1)/2-1})\cap\mathbb{Q}$として,
$$C_0=\mathbb{Q}\backslash\bigcup_{n=1}^\infty\tilde C_n,$$
$$C_n=\tilde C_n\backslash\bigcup_{k=1}^{n-1}\tilde C_k,\quad n=1,2,\ldots$$
これらは全て高々可算なので上と同様の方法で$q_1, q_2,\ldots$を定めていけば,$\tilde C_n$の要素が必ず最初の$n(n+1)/2$までに現れ,それを中心とした区間は$b_n$を含みます.
(実際には$C_n$の中に有限集合が現れる場合をケアしないといけませんが,$q_1, q_2,\ldots$に重複を許せば問題なく定めることができます)
$B$が非可算である場合どうなるかはよく分かっていませんが,Lebesgue測度が1より大きな集合は$A_q$に含まれないはずです.これはLebesgue測度の大きさを比べれば明らかです.ただそのような集合のどこに穴があるのかは未解決です.
(ちなみに,これを使えば任意の$\delta>0$に対してLebesgue測度が$\delta$で$A_q$に含まれない集合を作ることができます)
最後に
という訳で,穴はたくさんあるはずなのに,直観的にそうは思えないし,どこに空いているかもよく分からない.そんな不思議な集合$A_q$について,数日風呂や布団の中で悶々と考えていたことをまとめてみました.
統計科学コースの院生室では統計や機械学習の話題だけじゃなく,こんなパズルみたいな話でも盛り上がれるぞ!そこの君も今すぐ入学しよう!
冗談はさておき,長々ととりとめのない話にお付き合い頂きありがとうございました