概要
条件付き確率に関する問題は、確率のエキスパートも惑わせる、興味深い問題が多い。例えば、モンティ・ホール問題。
そうした条件付き確率に関する問題の一つ、二人の男の子問題を扱うが、この問題の変種を考えていくと面白い洞察を得られるので、それを紹介する。
以下、すべての問題の前提として、生まれた子供の性別が男である確率が 1/2 であること、また、二人の子供が生まる順序とその性別は独立であるとする。要するに、男ばっかり生まれたからって次に生まれる子供が男である確率が高い、とは言わないよ、ということ。この場合、次に生まれる子供が男である確率は 1/2 である。
第1問: 条件なし
「Dさん家には二人の子供がいる。両方が男である確率は?」
1/4.
次。
第2問: 上の子が男の子
「Dさん家には二人の子供がいる。 上の子が男の子である。 両方が男である確率は?」
1/2 である。
答えは簡単であるが、のちの議論のために、ここで記号を導入しておく。
「上の子が男である」という事象を $a_1$, 「下の子が男である」という事象を $a_2$ で表現する。
確率を $P$ で表すと、求めたい確率は
$$
P((a_1, a_2) | a_1)
$$
となる。ここで $P(a_1, a_2)$ を同時確率を意味する。
ここで、条件付き確率の性質と、 $a_1$ と $a_2$ が独立であることから、
$$
P((a_1, a_2) | a_1) = P(a_2 | a_1) = P(a_2) = \frac{1}{2}
$$.
ここで、問題の条件を 下の子が男の子である と言い換えても、同じ論法で同じ結論が出ることを付け加えておく。
第3問: 少なくとも一人が男の子
「Dさん家には二人の子供がいる。 そのうち一人は男の子である。 両方が男である確率は?」
このあたりから面白くなる。
答えは 1/3.
どういうことか。
ベイズの定理で考えていく。
「$a_1$ かつ $a_2$」、つまり「両方とも男」であるという事象を $b$ とおく。また、今回の第3問の条件「少なくとも一人が男」という事象を $c_3$ とおく。
このときベイズの定理を用いると、
$$
P(b|c_3) = \frac{P(c_3|b)P(b)}{P(c_3|b)P(b) + P(c_3|\bar{b})P(\bar{b})}
$$,
ここで、 $\bar{b}$ は $b$ の排反事象。
計算していく。
まず分子にも分母にもある $P(c_3|b)P(b)$ は左から「両方が男だったとして、少なくとも一人が男である」確率と、「両方が男である」確率の掛け算なので、
$$
P(c_3|b)P(b) = 1 \cdot \frac{1}{4} = \frac{1}{4}.
$$
$P(c_3|\bar{b})P(\bar{b})$ は、まず $P(\bar{b}) = \frac{3}{4}$ であるのはすぐわかる。 $P(c_3|\bar{b})$ はどうか。これは「両方が男ではない(少なくとも一人女がいる)、という前提のもとで、少なくとも一人が男である」確率のことだから、場合の数を考えると、
- 上の子が男、下の子が女
- 上の子が女、下の子が男
- 上の子が女、下の子が女
の 3 通りのうち、該当するのは 2 通りだから、 $P(c_3|\bar{b}) = \frac{2}{3}$. つまり、
$$
P(c_3|\bar{b})P(\bar{b}) = \frac{2}{3} \cdot \frac{3}{4} = \frac{1}{2}
$$.
これらを全部考慮すれば、
$$
P(b|c_3) = \frac{\frac{1}{4}}{\frac{1}{4} + \frac{1}{2}} = \frac{1}{3}.
$$
ここですでに面白い。問題文の機微、つまり「上の子が男の子である」と「そのうち一人が男の子である」で、確率が変わってくる。
第4問: 火曜日生まれ
「Dさん家には二人の子供がいる。 そのうち一人は火曜日生まれの男の子である。 両方が男である確率は?」
ここからさらに面白い。さすがに火曜日は関係ないでしょ、と思う。
本当にそうか。計算する。
記号は第3問を踏襲し、かつ、この第4問の条件「少なくとも一人が火曜日生まれの男」という事象を $c_4$ とおく。
$$
P(b|c_4) = \frac{ P(c_4|b)P(b) }{ P(c_4|b)P(b) + P(c_4|\bar{b})P(\bar{b})}
$$.
$P(c_4|b)$ は、「二人とも男である、という条件のもとで、少なくとも一人が火曜日生まれの男である」確率を意味している。これを場合の数で考えるならば、まず全部で何通りあるかといえば、
- 上の子が月曜日生まれの男、かつ、下の子が月曜日生まれの男
- 上の子が月曜日生まれの男、かつ、下の子が火曜日生まれの男
- 上の子が月曜日生まれの男、かつ、下の子が水曜日生まれの男
- ...
- 上の子が日曜日生まれの男、かつ、下の子が日曜日生まれの男
というかんじで、 $7^2$ 通り。そのうち「少なくとも一人が火曜日生まれの男」のパターンは $2 \cdot 7 - 1$ 通り。この -1 は、 $2 \cdot 7$ だと 男・火曜日 を2回カウントすることになるので、それで一つ引いてる。すなわち、
$$
P(c_4|b) = \frac{2 \cdot 7 - 1}{7^2}.
$$
また、$P(c_4|\bar{b})$は、「少なくとも一人は女、という条件のもとで、少なくとも一人が火曜日生まれの男である」確率を意味しているので、これも場合の数で考えると、まず全部で何通りのパターンがあるかを数えれば、
- 上の子が月曜日生まれの女、かつ、下の子が月曜日生まれの男
- 上の子が月曜日生まれの女、かつ、下の子が火曜日生まれの男
- 上の子が月曜日生まれの女、かつ、下の子が水曜日生まれの男
- ...
- 上の子が月曜日生まれの男、かつ、下の子が月曜日生まれの女
- 上の子が月曜日生まれの男、かつ、下の子が火曜日生まれの女
- 上の子が月曜日生まれの男、かつ、下の子が水曜日生まれの女
- ...
- 上の子が月曜日生まれの女、かつ、下の子が月曜日生まれの女
- 上の子が月曜日生まれの女、かつ、下の子が火曜日生まれの女
- 上の子が月曜日生まれの女、かつ、下の子が水曜日生まれの女
- ...
- 上の子が日曜日生まれの女、かつ、下の子が日曜日生まれの女
ということで、 $3 \cdot 7^2$ 通り。そのうち該当するのは、 $2 \cdot 7$ 通り。すなわち、
$$
P(c_4|\bar{b}) = \frac{2 \cdot 7}{3 \cdot 7^2}.
$$
すなわち、求めたい確率は
$$
P(b|c_4) = \frac{ \frac{2 \cdot 7 - 1}{7^2} \cdot \frac{1}{4}}{ \frac{2 \cdot 7 - 1}{7^2} \cdot \frac{1}{4} + \frac{2 \cdot 7}{3 \cdot 7^2} \cdot \frac{3}{4}} = \frac{13}{27}.
$$
ここで、 1/3 < 13/27 < 1/2 ということを言及しておく。
第5問: 午前5時生まれ
「Dさん家には二人の子供がいる。 そのうち一人は火曜日の午前5時に生まれた男の子である。 両方が男である確率は?」
まず想像の通り、この確率は 1/2 でも 1/3 でも、また 13/27 でもない。
計算する。この第5問の条件「そのうち一人は火曜日の午前5時に生まれた男の子である」という事象を $c_5$ とおく。
$$
P(b|c_5) = \frac{ P(c_5|b)P(b) }{ P(c_5|b)P(b) + P(c_5|\bar{b})P(\bar{b})}
$$
を求める。
まず、 $P(c_5|b)$ は、「ふたりとも男である、という条件のもとで、少なくとも一人が火曜日の午前5時生まれの男である」確率を表している。これを場合の数で考えるならば、
- 上の子が月曜日午前0時生まれの男、かつ、下の子が月曜日午前0時生まれの男
- 上の子が月曜日午前0時生まれの男、かつ、下の子が火曜日午前1時生まれの男
- 上の子が月曜日午前0時生まれの男、かつ、下の子が水曜日午前2時生まれの男
- ...
- 上の子が日曜日23時生まれの男、かつ、下の子が日曜日23時生まれの男
ということで、全部で $(7 \cdot 24)^2$ 通り。そのうち該当のパターンは、第4問と同じ考え方をして $2 \cdot (7 \cdot 24) - 1$ 通り。すなわち、
$$
P(c_5|b) = \frac{ 2 \cdot (7 \cdot 24) - 1 }{ (7 \cdot 24)^2 }.
$$
また、 $P(c_5|\bar{b})$ は、「少なくとも一人が女、という条件のもとで、少なくとも一人が火曜日の午前5時生まれの男である」確率を表している。これを場合の数で考えると、
- 上の子が月曜日0時生まれの女、かつ、下の子が月曜日0時生まれの男
- 上の子が月曜日0時生まれの女、かつ、下の子が月曜日1時生まれの男
- 上の子が月曜日0時生まれの女、かつ、下の子が月曜日2時生まれの男
- ...
- 上の子が月曜日0時生まれの男、かつ、下の子が月曜日0時生まれの女
- 上の子が月曜日0時生まれの男、かつ、下の子が月曜日1時生まれの女
- 上の子が月曜日0時生まれの男、かつ、下の子が月曜日2時生まれの女
- ...
- 上の子が月曜日0時生まれの女、かつ、下の子が月曜日0時生まれの女
- 上の子が月曜日0時生まれの女、かつ、下の子が月曜日1時生まれの女
- 上の子が月曜日0時生まれの女、かつ、下の子が月曜日2時生まれの女
- ...
- 上の子が日曜日23時生まれの女、かつ、下の子が日曜日23時生まれの女
という感じで、全部で $3 \cdot (7 \cdot 24)^2$ 通り。そして該当のパターンは $2 \cdot (7 \cdot 24)$ 通り。すなわち、
$$
P(c_5|\bar{b}) = \frac{ 2 \cdot (7 \cdot 24) }{ 3 \cdot (7 \cdot 24)^2 }
$$.
以上から、
$$
P(b|c_5) = \frac{ \frac{ 2 \cdot (7 \cdot 24) - 1 }{ (7 \cdot 24)^2 } \cdot \frac{1}{4} }{ \frac{ 2 \cdot (7 \cdot 24) - 1 }{ (7 \cdot 24)^2 } \cdot \frac{1}{4} + \frac{ 2 \cdot (7 \cdot 24) }{ 3 \cdot (7 \cdot 24)^2 } \cdot \frac{3}{4}} = \frac{ 335 }{ 335 + 336 } = \frac{335}{671}.
$$
ここで、 1/3 < 13/27 < 335/671 < 1/2 に注目しておく。
第∞問: 究極的に詳細に
第3問から第5問の間で、確率が 1/3 < 13/27 < 335/671 と、だんだんと 1/2 に近づいていった。
第3問から第5問の間では、少なくとも存在する男の子に関する条件が、きめ細かくなってきた。「火曜日生まれ」「午前5時生まれ」という風に。
では、男の子について、もっともっときめ細かい条件がわかったとすると、どうだろうか。「4月1日生まれである」「緯度経度が〇〇のところに住んでいる」「名前のイニシャルがKである」...
この条件を $c_n$ と表そう。このとき、もとめる確率は、
$$
P(b|c_n) = \frac{ P(c_n|b)P(b) }{ P(c_n|b)P(b) + P(c_n|\bar{b})P(\bar{b})}
$$.
$P(c_n|b)$ はなにか。上の考え方を用いると、自然数 $n$ を 「生まれた時刻の場合の数」×「生まれた日付の場合の数」×「緯度経度の場合の数」×「ありうるイニシャルの場合の数」×... という数としよう。さすれば、
$$
P(c_n|b) = \frac{ 2 \cdot n - 1 }{ n^2 }.
$$
同様に、
$$
P(c_n|\bar{b}) = \frac{ 2 \cdot n }{ 3 \cdot n^2 }.
$$
したがって、
$$
P(b|c_n) = \frac{ \frac{ 2 \cdot n - 1 }{ n^2 } \cdot \frac{1}{4} }{\frac{ 2 \cdot n - 1 }{ n^2 } \cdot \frac{1}{4} + \frac{ 2 \cdot n }{ 3 \cdot n^2 } \cdot \frac{3}{4}}= \frac{2n - 1}{4n-1}
$$
ここで、 $n \rightarrow \infty$ とすると、
$$
\lim_{n \rightarrow \infty} \frac{2n - 1}{4n-1} = \frac{1}{2}.
$$
解釈
これをどのように解釈するといいか。
男の子の情報が、どんどんと細かく、そして詳しくなっていくことに注目する。「4月1日生まれである」「緯度経度が〇〇のところに住んでいる」「名前のイニシャルがKである」「△学校に通っている」「10歳である」「髪の毛の本数がぴったり20万本である」 ...
ここまで来ると、その男の子を、この地球上から一人、特定することができるだろう。すなわち、ここまで来ると「Dさんの上の子(あるいは下の子)」と同等の情報を得られる。つまり、ここまでくると「Dさんの 上の子は 男の子」と、同等の条件を示されている感覚になる。
というわけで、この第∞問の答えが、第2問で示した答えと一致することが、このように直感的に理解できる。
終わり。
おまけ
上とはちょっと毛色が違うけれども、議論するには面白いので、いくつか文を書いておく。
以下の確率は、それぞれなんだろうか。
- 「Dさん家には二人の子供がいる。 そのうち一人は男の子である。 両方が男である確率は?」 -> 1/3
- 「私には二人の子供がいる。 そのうち一人は男の子である。 両方が男である確率は?」
- 「隣にDさんが引っ越してきた。Dさん家には二人の子供がいる。ふとDさん家を見ると、窓から男の子が首を出してこちらに挨拶をしてくれた。 両方が男である確率は?」
- 「隣にDさんが引っ越してきた。Dさん家には二人の子供がいる。ある日、Dさんの家におよばれした。Dさん家の玄関を見ると、靴に「けんじ」と名前が書いてあった。 両方が男である確率は?」
- 「男子トイレを見張っていた。男子トイレから出てきた子供に無作為に声をかけた。声を書けたその子に家のことを聞くと、Dさんに家の子であることがわかった。Dさんには二人の子供がいる。両方が男である確率は?」