条件付き確率
事象Aが起こった条件の元、事象Bが起こる確率を条件付き確率と呼び
$P(B \ |\ A)$ や $P_A(B)$ と表す
$$P(B | A)=P_A(B) = \frac{n(A \cap B)}{n(A)}$$
今、全事象を $S$ とし、その根元事象の数を $n(S)$ とすると
$ P(A) = \frac{n(A)}{n(S)} \quad $ $ P(B) = \frac{n(B)}{n(S)} \quad $ $ P({A \cap B}) = \frac{n(A \cap B)}{n(S)} \quad$ なので
$$
P_A(B) = \frac{n(A \cap B)}{n(A)} = \frac {\frac{n(A \cap B)}{n(S)} } {\frac{n(A)}{n(S)}}
= \frac {P(A \cap B)}{P(A)}
$$
故に
$$
P(A \cap B)={P(A)} \cdot P_A(B)
$$
例 もう1人は男の子?
ある家庭に子供が2人いる。
その内、1人が「男の子」である場合、もう1人も「男の子」である確率は?
1/2ではない事に注意(1人目が男の子である事が考慮されていない)
事象 | 確率 |
---|---|
A:少なくとも1人は男の子 | $\large{\frac{3}{4}}$ |
A $\cap$ B:2人とも男の子 | $\large{\frac{1}{4}}$ |
B|A:もう1人も男の子 | $\large{\frac{1}{3}}$ |
数学的に言えば、求める確率は $P_A(B)$ なので
$$ P_A(B) = \frac{P(A \cap B)}{P(A)} = \frac{1/4}{3/4} = \frac{1}{3} $$
が答え
1人目 | 2人目 | 片方が男の子 | 2人とも男の子 |
---|---|---|---|
男 | 男 | 〇 | 〇 |
男 | 女 | 〇 | × |
女 | 男 | 〇 | × |
女 | 女 | × | × |
1人が「男の子」であると確定している状態で、もう1人も「男の子」である 確率は上の表から見ても1/3
ベイズの定理
条件付き確率の $A$ と $B$ を入れ替える
$$
P_A(B) = \frac {P(A \cap B)}{P(A)} \quad \Longrightarrow \quad P(A \cap B) = {P(A)} \cdot P_A(B) \quad \cdots \quad(1)
$$
から
$$
P_B(A) = \frac {P(A \cap B)}{P(B)} \Longrightarrow \quad P(A \cap B) = {P(B)} \cdot P_B(A) \quad \cdots \quad(2)
$$
(1)と(2)を 左辺 $P(A \cap B)$ で紐づけると
$$
{P(A)} \cdot P_A(B) = {P(B)} \cdot P_B(A) \quad \cdots \quad(3)
$$
(3)を変形すると
\begin{align}
P_B(A) &=& \frac{P(A) \cdot P_A(B)}{P(B)} \quad \cdots \quad(4)
\end{align}
$P_A(B)$ は事象Aが起こった条件の元、事象Bが起こる確率なので
事象Aという原因の元、事象Bという結果を得る確率とも考えられる
すると、(4)に対して不思議な解釈ができる
$P(A|B)=P_B(A) \Longrightarrow$ 事象Bという結果が起こった時に、事象Aという原因が発生する確率を求めている事になる
原因 $\Longrightarrow$ 結果 ではなく 結果 $\Longrightarrow$ 原因 が発した確率を求めている
例 本当に病気?
Cさんが、罹患率は 0.01% の病気であると診断された
診断の正しさが以下の確率である場合、Cさんが本当に罹患していた確率は?
陽性 | 陰性 | |
---|---|---|
罹患 | 98% | 2% |
非罹患 | 20% | 80% |
98% ではない事に注意(非罹患の人も陽性だと判断してしまう場合が考慮されていない)
罹患・非罹患(原因)$\Longrightarrow $ 陽性(結果)?
に対し、問いは
陽性(結果)$\Longrightarrow $ 罹患・非罹患(原因)?
という流れになっている事に注目
\begin{eqnarray}
P(罹|陽) &=& \frac{P(陽 \cap 罹)}{P(陽)} \\\\[1pt]
&=& \frac{P(罹) \cdot P(陽|罹)}{P(陽)} \\\\[1pt]
&=& \frac{P(罹) \cdot P(陽|罹)}{P(陽|罹)+ P(陽|罹^c)} \\\\[1pt]
&=& \frac{0.0001 \times 0.98 }{0.0001 \times 0.98 + (1- 0.0001) \times 0.20 } \\\\[1pt]
&=& \frac{0.0001 \times 0.98 }{0.0001 \times 0.98 + 0.9999
\times 0.20 } \\\\[1pt]
&=& 0.0004898089745 \\\\[1pt]
&≒& 0.0005
\end{eqnarray}
0.05% が答え
罹患率0.01%(事前確率)が診断結果を加える事で、0.05%(事後確率)に上がっている事に注目