昨今の流行のSLAMやらカルマンフィルタやらといったアルゴリズムは,どれもベイズをベースとしているものが多くて,これが理解できてないと最初のステップすら踏めず辛みが深い.PRMLや確率ロボティクスなど読めたものではない.自分は意外と頻度主義だったのか(あるいは単に飲み込みが悪かったのか),ベイズをなかなか体得できなかった.そのときにお世話になったのがWebや本で,ベイズに関する問題を探しては片っ端から解いていって,ようやく形が掴めてきた,
これはそのときに蒐集したベイズ問題の数々.どれも出典があるはずなのだが,メモるのを忘れてしまった.一般化した形にまとめ直したのでご容赦されたい.
Q1. 喫煙者
あるグループの男性・女性の人数とその中の喫煙者の人数は以下の表のとおり.あるとき部屋に入ると喫煙者が一人いた.この喫煙者が女性である確率を求めよ.
男性 | 女性 | |
---|---|---|
喫煙者 | 5 | 3 |
非喫煙者 | 5 | 4 |
A1.
求めたい確率は,喫煙者がいたとき,それが女性である確率で, $p(女性|喫煙者)$.
次の2つは同時確率なので等価.$p(女性,喫煙者)=p(喫煙者,女性)$
両方とも条件付き確率にすると,
\begin{align}
p(女性,喫煙者) &= p(女性|喫煙者)p(喫煙者) \\
p(喫煙者,女性) &= p(喫煙者|女性)p(女性)
\end{align}
上式より(ベイズの定理より),求めたい $p(女性|喫煙者)$ は,
p(女性|喫煙者) = \frac{p(喫煙者|女性)p(女性)}{p(喫煙者)}
それぞれの確率は,
$p(喫煙者|女性)$ : 女性が喫煙者の確率 $\frac{3}{7}$
$p(女性)$ : 部屋にいたのが女性の確率 $\frac{7}{17}$
$p(喫煙者)$ : 部屋にいたのが喫煙者の確率 $\frac{8}{17}$
よって,
\begin{align}
p(女性|喫煙者) &= \frac{p(喫煙者|女性)p(女性)}{p(喫煙者)} \\
&= \frac{\frac{3}{7} \frac{7}{17}}{\frac{8}{17}} \\
&= \frac{3}{8}
\end{align}
実はこの問題は,表の喫煙者の行を横に見るだけで,すぐに$\frac{3}{8}$という答えが出せるのだが,あえてベイズな解き方をした.どちらの方法でも同じ答えを導けるということに注目されたい.
Q2. ゲスト
あるパーティでゲストを呼んだとき,男性のゲストが高身長な確率は7割,女性のゲストが高身長な確率は2割だった.ゲストが男性である確率は6割のとき,ゲストが高身長だったとき,そのゲストが男性である確率を求めよ.
A2.
求めたい確率は,$p(男性|高身長)$.
ベイズの定理より,
p(男性|高身長) = \frac{p(高身長|男性) p(男性)}{p(高身長)}
$p(高身長|男性)$は,問題文より$\frac{7}{10}$.$p(男性)$なのも問題文より$\frac{6}{10}$.$p(高身長)$はゲストが男性の場合と女性の場合を合算する必要がある(周辺確率).
\begin{align}
p(男性|高身長) &= \frac{p(高身長|男性) p(男性)}{p(高身長)} \\
&= \frac{p(高身長|男性) p(男性)}{p(高身長|男性) p(男性) + p(高身長|女性) p(女性)} \\
&= \frac{\frac{7}{10} \frac{6}{10}}{\frac{7}{10} \frac{6}{10} + \frac{2}{10} \frac{4}{10}} \\
&= \frac{21}{25}
\end{align}
Q3. デート
パートナーをデートに誘うとき,雨が降っていないときは8割の確率でOKされ,逆に雨が降っているときは,6割の確率でしかOKされない.ちなみにこの地方の雨が降る確率は$\frac{1}{8}$である.ある日OKされたときの,雨が降っていなかった確率を求めよ.
A3.
求めたい確率は,OKされたときの雨が降っていなかった確率なので, $p(否雨|OK)$
ベイズの定理より,
p(否雨|OK) = \frac{p(OK|否雨) p(否雨)}{p(OK)}
このうち,$p(OK|否雨)$と$p(否雨)$は問題文から拾ってくれば良い.$p(OK)$だけは,自分で雨が降っていないときと降っているときにOKされる確率を合計して計算しなければならない(周辺確率の計算).
\begin{align}
p(OK) &= p(OK|否雨) p(否雨) + p(OK|雨) P(雨) \\
&= \frac{8}{10} \frac{7}{8} + \frac{6}{10} \frac{1}{8} \\
&= \frac{31}{40}
\end{align}
よって,
\begin{align}
p(否雨|OK) &= \frac{p(OK|否雨) p(否雨)}{p(OK)} \\
&= \frac{\frac{8}{10} \frac{7}{8}}{\frac{31}{40}} \\
&= \frac{28}{31}
\end{align}
Q4. つぼ
つぼAとつぼBがある.つぼAの中には赤い玉が3つ,白い玉が2つ入っている.一方,つぼBの中には赤い玉が8つ,白い玉が4つ入っている.つぼA,つぼBからランダムにどちらかを選ぶ.
Q4.1
取り出した玉が白だったとき,取り出したつぼがAであった確率を求めよ.
Q4.2
同様に,取り出した玉が白だったとき,取り出したつぼがBであった確率を求めよ.
A4.
A4.1
求めたい確率は,$p(A|白)$.ベイズの定理より,
\begin{align}
p(A|白) &= \frac{p(白|A)p(A)}{p(白)} \\
&= \frac{\frac{2}{5} \frac{1}{2}}{\frac{2}{5} \frac{1}{2} + \frac{4}{12} \frac{1}{2}} \\
&= \frac{6}{11}
\end{align}
A4.2
求めたい確率は,$p(B|白)$.ベイズの定理より,
\begin{align}
p(B|白) &= \frac{p(白|B)p(B)}{p(白)} \\
&= \frac{\frac{4}{12} \frac{1}{2}}{\frac{2}{5} \frac{1}{2} + \frac{4}{12} \frac{1}{2}} \\
&= \frac{5}{11}
\end{align}
Q5. モンティホール問題
扉I,扉II,扉IIIがある.1つだけある正解の扉の奥には,パジェロなど豪華景品が用意されている.挑戦者は3つの扉の中から,自分が正解だと思う扉を1つ選ぶことができる.その後,司会者が選ばれなかった2つの扉の奥を見て,正解でない扉(どちらも正解でなかった場合はどちらか片方)を1つ開け放つ.その上で,司会者が挑戦者に選択した扉を変更するかどうか聞く.このとき,挑戦者は選択を変えない場合と変える場合でどちらが正解の確率が高いだろうか.
A5.
挑戦者が扉Iを選択したと仮定しよう.その上で,司会者によって扉IIが開かれたとする.この場合,正解は扉Iか扉IIIになるわけだが,$p(A|B)$を扉IIが開かれた(扉IIはハズレだった)ときに扉Iが正解である確率,$p(C|B)$を扉IIが開かれたときに扉IIIが正解である確率とする.
まず,$p(A|B)$の確率を計算するためにはベイズの定理より,
- $p(B|A)$ : 扉Iが正解のとき扉IIが開かれる確率
- $p(A)$ : 扉Iが正解の確率
- $p(B)$ : 扉IIが開かれる確率
を求める必要がある.
これらは以下のように求められる.
$p(B|A) = \frac{1}{2}$ => 扉IIも扉IIIもハズレのため
$p(A) = \frac{1}{3}$ => どの扉も開かれていない状態では,3つの扉の正解の確率は公平
$p(B)$は,どの扉が正解なのかに応じて場合わけして,それぞれの扉が正解の確率(どの扉も開かれていない状態では$\frac{1}{3}$ ずつ)と掛け合わせて合算する.
i) 扉Iが正解の場合 => 扉IIが開かれる確率は半々
ii) 扉IIが正解の場合 => 扉IIが開かれる確率はゼロ
iii) 扉IIIが正解の場合 => 扉IIが開かれる確率は1
よって
\begin{align}
p(B) &= \frac{1}{3} \frac{1}{2} + \frac{1}{3} 0 + \frac{1}{3} 1 \\
&= \frac{1}{2}
\end{align}
以上より,$p(A|B)$は,
\begin{align}
p(A|B) &= \frac{p(B|A) p(A)}{p(B)} \\
&= \frac{\frac{1}{2} \frac{1}{3}}{\frac{1}{2}} \\
&= \frac{1}{3}
\end{align}
さて,$p(C|B)$の確率を計算するためにはベイズの定理より,
- $p(B|C)$ : 扉IIIが正解のとき扉IIが開かれる確率
- $p(C)$ : 扉IIIが正解の確率
- $p(B)$ : 扉IIが開かれる確率
を求める必要がある.
$p(B|C) = 1$ => 扉Iは挑戦者が選択しており,扉IIIは正解なので,司会者は扉IIを選ぶより他ない
$p(C) = \frac{1}{3}$ => どの扉も開かれていない状態では,3つの扉の正解の確率は公平
$p(B)$については,前に計算したとおり$\frac{1}{2}$.
以上より$p(C|B)$は,
\begin{align}
p(C|B) &= \frac{p(B|C) p(C)}{p(B)} \\
&= \frac{1 \frac{1}{3}}{\frac{1}{2}} \\
&= \frac{2}{3}
\end{align}
よって,$p(C|B) > p(A|B)$より,挑戦者は,選択を変更したほうが正解を当てる確率が2倍高い,
Q6. くじ
3本のくじの中に1本だけ当たりが含まれている.Aがまず引き,次にBが引いたところ,Bはハズレだった.このとき,Aが当たっている確率を求めよ.
A6.
求めたい確率は,$p(A当|Bハズレ)$.ベイズの定理より,
\begin{align}
p(A当|Bハズレ) &= \frac{p(Bハズレ|A当) p(A当)}{p(Bハズレ)} \\
&= \frac{1 \frac{1}{3}}{\frac{1}{3} 1 + \frac{2}{3} \frac{1}{2}} \\
&= \frac{1}{2}
\end{align}
$p(Bハズレ)$は,Aが当たりだった場合とハズレだった場合の確率を合算する必要があることに注意.
このとおり,ハズレが一人明らかになっていくにつれ,当たりの確率は微増するにとどまる.当たりを先に取られる可能性があること,ハズレが明らかになった後も自分の選択を変更する権利がないことがモンティホール問題との差異.
Q7. 陽性
Q7.1
100人中3人が罹患する病気がある.この病気について調べる検査は,病人だと98%の確率で陽性が出るが,同時に健常な人でも5%の確率で陽性が出てしまう.あるとき,検査で陽性が出た,この患者が病人である可能性はどれくらいか.
Q7.2
検査で陽性が出た患者について,再度,同じ検査を行ったところ陽性が出た.この患者が病人である可能性はどれくらいか.
A7.
A7.1
求めたい確率は,検査で陽性が出たとき,病人である確率なので, $p(病人|陽性)$.
ベイズの定理より,
\begin{align}
p(病人|陽性) &= \frac{p(陽性|病人) p(病人)}{p(陽性)} \\
&= \frac{p(陽性|病人) p(病人)}{p(病人,陽性) + p(健常,陽性)} \\
&= \frac{\frac{98}{100} \frac{3}{100}}{\frac{3}{100} \frac{98}{100} + \frac{97}{100} \frac{5}{100}} \\
&= \frac{294}{779} \\
&= 0.3774..
\end{align}
このように,検査で陽性が出たからと言って,実際に病人である確率は38%程度と低い.
A7.2
では,前の検査で陽性が出た患者について再検査を行うといったときは,式としては前出のものと変化がないものの,病人である確率$p(病人)$が,$\frac{3}{100}$から前問で計算された$\frac{294}{779}$の値を使うことになる.これを ベイズ更新 と言う.すると,
\begin{align}
p(病人|陽性) &= \frac{p(陽性|病人) p(病人)}{p(陽性)} \\
&= \frac{p(陽性|病人) p(病人)}{p(病人,陽性) + p(健常,陽性)} \\
&= \frac{\frac{98}{100} \frac{294}{779}}{\frac{294}{779} \frac{98}{100} + \frac{485}{779} \frac{5}{100}} \\
&= \frac{28812}{31237} \\
&= 0.9224..
\end{align}
再検査でも陽性となった場合,このように実際に病気に罹患している確率が92%と跳ね上がる.
Q8. センサ故障率
ある距離センサは故障すると,1[m]未満という結果を出力し続ける.このセンサの故障率は$\frac{1}{100}$である.このセンサに,3[m]以内で一様ランダムな距離を計測させる.
Q8.1 ある計測で出力値が1[m]未満となった.センサが故障している確率を求めよ.
Q8.2 続いた計測でも出力値が1[m]未満となった.これが10回続いた場合のセンサが故障している確率を,それぞれ回数ごとに求めよ.
A8.
A8.1
求めたい確率は$p(故障|出力1[m]未満)$.ベイズの定理より,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{1}{100}}{\frac{1}{100} \frac{1}{1} + \frac{99}{100} \frac{1}{3}} \\
&= \frac{1}{34} \\
&\fallingdotseq 0.0294..
\end{align}
よって,故障している確率は3[%]ほどでしかない.
A8.2
出力値が1[m]未満となるのが続くと,$p(故障)$の確率が更新されていく.
1度目の場合は,前問のとおり,
2度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{1}{34}}{\frac{1}{34} \frac{1}{1} + \frac{33}{34} \frac{1}{3}} \\
&= \frac{1}{12} \\
&\fallingdotseq 0.0833..
\end{align}
3度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{1}{12}}{\frac{1}{12} \frac{1}{1} + \frac{11}{12} \frac{1}{3}} \\
&= \frac{3}{14} \\
&\fallingdotseq 0.214..
\end{align}
4度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{3}{14}}{\frac{3}{14} \frac{1}{1} + \frac{11}{14} \frac{1}{3}} \\
&= \frac{9}{20} \\
&\fallingdotseq 0.450
\end{align}
5度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{9}{20}}{\frac{9}{20} \frac{1}{1} + \frac{11}{20} \frac{1}{3}} \\
&= \frac{27}{38} \\
&\fallingdotseq 0.711..
\end{align}
6度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{27}{38}}{\frac{27}{38} \frac{1}{1} + \frac{11}{38} \frac{1}{3}} \\
&= \frac{81}{92} \\
&\fallingdotseq 0.880..
\end{align}
7度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{81}{92}}{\frac{81}{92} \frac{1}{1} + \frac{11}{92} \frac{1}{3}} \\
&= \frac{243}{254} \\
&\fallingdotseq 0.957..
\end{align}
8度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{243}{254}}{\frac{243}{254} \frac{1}{1} + \frac{11}{254} \frac{1}{3}} \\
&= \frac{729}{740} \\
&\fallingdotseq 0.985..
\end{align}
9度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{729}{740}}{\frac{729}{740} \frac{1}{1} + \frac{11}{740} \frac{1}{3}} \\
&= \frac{2187}{2198} \\
&\fallingdotseq 0.995..
\end{align}
10度目の場合は,
\begin{align}
p(故障|出力1[m]未満) &= \frac{p(出力1[m]未満|故障)p(故障)}{p(出力1[m]未満)} \\
&= \frac{\frac{1}{1} \frac{2187}{2198}}{\frac{2187}{2198} \frac{1}{1} + \frac{11}{2198} \frac{1}{3}} \\
&= \frac{6561}{6572} \\
&\fallingdotseq 0.998..
\end{align}
Q9. 同定
Aの箱の中には,8割の確率で本物が入っている,Bの箱の中には,4割の確率で本物が入っている.AかBかは見た目では分からない.この箱のどちらかをランダムに選ぶ.
Q9.1 1つ取り出したところ,本物であった.選んだ箱がAの箱である確率を求めよ.
Q9.2 前問と同じ箱から続けて1つ取り出したところ,本物であった.選んだ箱がAの箱である確率を求めよ.
Q9.3 前問と同じ箱からさらに続けて1つ取り出したところ,偽物であった.選んだ箱がAの箱である確率を求めよ.
A9.
A9.1
\begin{align}
p(A|本物) &= \frac{p(本物|A)p(A)}{p(本物)} \\
&= \frac{\frac{4}{5} \frac{1}{2}}{\frac{4}{5} \frac{1}{2} + \frac{2}{5} \frac{1}{2}} \\
&= \frac{2}{3}
\end{align}
A9.2
前問の結果より,Aの箱を選んだ確率がベイズ更新される.
\begin{align}
p(A|本物) &= \frac{p(本物|A)p(A)}{p(本物)} \\
&= \frac{\frac{4}{5} \frac{2}{3}}{\frac{4}{5} \frac{2}{3} + \frac{2}{5} \frac{1}{3}} \\
&= \frac{4}{5}
\end{align}
A9.3
前問の結果より,Aの箱を選んだ確率がベイズ更新される.
\begin{align}
p(A|偽物) &= \frac{p(偽物|A)p(A)}{p(偽物)} \\
&= \frac{\frac{1}{5} \frac{4}{5}}{\frac{1}{5} \frac{4}{5} + \frac{3}{5} \frac{1}{5}} \\
&= \frac{4}{7}
\end{align}
Q10. 帽子の忘れ物
私はとても忘れっぽいので,友人宅を訪れた際に$\frac{1}{5}$の確率で帽子を忘れる.今日はI宅,II宅,III宅を訪問して帰宅したところ,帽子をわすれていたことに気がついた.
このとき,II宅に帽子を忘れた確率を求めよ.
A10.
求めたい確率は,$p(II宅に忘れた|忘れた)$となる.
ベイズの定義により,この確率を計算するためには,以下の確率を準備する必要がある.
$p(忘れた|II宅に忘れた) = 1$ => どのお宅でも,忘れたら全体として帽子を忘れたことになる.
$p(忘れた)$を計算するためには,それぞれのお宅で忘れる確率を合算する必要がある.
i) I宅で忘れた確率 $\frac{1}{5}$
ii) I宅で忘れずII宅で忘れた確率 $\frac{4}{5} \frac{1}{5} = \frac{4}{25}$
iii) I宅,II宅で忘れずIII宅で忘れた確率 $\frac{4}{5} \frac{4}{5} \frac{1}{5} = \frac{16}{125}$
以上を合算すると,$p(忘れた) = \frac{61}{125}$
ii)の結果より,$p(II宅に忘れた) = \frac{4}{25}$
以上より,
\begin{align}
p(II宅に忘れた|忘れた) &= \frac{p(忘れた|II宅に忘れた)p(II宅に忘れた)}{p(忘れた)} \\
&= \frac{1 \frac{4}{25}}{\frac{61}{125}} \\
&= \frac{20}{61}
\end{align}
Special Thanks
ところたん : 初出の問題文Q4とQ9について,二つのつぼ/箱のどちらかが選ばれる確率が両方等しいことが文面から伝わりにくいことを指摘してくれました.現在では修正されています.