0. この記事の目的
「統計学実践ワークブック」(統計検定準1級対応)で、解説が足りないなと思った例題などを、丁寧に解説する目的で書きました。
尚、著者様の権利を侵害したくないので、問題文は引用しません。
こちらから書籍を購入してください。
4ページ例題 問1.3[2]
ベイズの定理を「2重に用いる」という応用問題です。
(クリックして「ベイズの定理」の詳細を読む...)
ベイズの定理とは、
$$P(原因_i | 結果) = \frac{P(結果 | 原因_i)P(原因_i) }{ \sum_j{P(結果 | 原因_j)P(原因_j) }}$$
のことです。
(クリックして「$P(A|B)$」の詳細を読む...)
$P(A|B)$は、事象$B$が起きたことがすでに分かっているときの 事象$A$が起きる確率です。
「$|B$」は、$A$を修飾する後置修飾語みたいなものですね。
「$|$」を「when」と読み替えるといいかもしれません。
$P(A|B) = P(A {\rm{when}} B) = \frac{P(A\cap{}B)}{P(B)}$
問題文を読んだら、まず$P(病気)=0.01$と置きましょう。
($P(病気|高齢者)=0.01$とする必要はありません...)
高齢者の100人に一人が病気にかかっているとのことですが、
$P(病気|高齢者)=0.01$とする必要はなく、単に
$P(病気)=0.01$と考えるべきです。
何故なら、問題全体を通じて、高齢者以外の人間を対象とした議論が一切行われていないからです。
次に、$P(検査1で陽性|病気) = 0.99$, $P(検査1で陽性|健康)=0.02$と置きます。
そしたら、$P(検査2で陽性|(検査1で陽性∩病気))=0.90$, $P(検査2で陽性|(検査1で陽性∩健康))=0.10$と置きます。
誤って$P(検査2で陽性|病気)=0.90$のようにしないようにしましょう。
(書籍の解説が分からない理由...)
書籍では、$P(検査2で陽性|(検査1で陽性∩病気))$とすべきところを、
$P(検査2で陽性|検査1で陽性,病気)$のような書き方をしています。
事前に何の説明もなく、突然「,」という新しい記号を使うから、わからなくなってしまうのです。
百歩譲って、突然の「,」を許すとしても、その後の式展開も、事前に説明がないのにかなり端折って書かれています。
今求めるべきなのは、
$P(病気|(検査1で陽性∩検査2で陽性))$です。
「$(検査1で陽性∩検査2で陽性)$」が仰々しいので、「$両方の検査で陽性$」で置き換えれば、
$P(病気|両方の検査で陽性)$です。
$$\begin{array}{llll}
&P(病気|両方の検査で陽性) \\
=&P(両方の検査で陽性|病気) &\bullet&\frac{P(病気)}{P(両方の検査で陽性) }\\
=& 〃&&\frac{〃}{P(検査1で陽性∩検査2で陽性) }\\
=& 〃&&\frac{〃}{P(検査2で陽性|検査1で陽性)P(検査1で陽性) }\\
=&P((検査2で陽性|検査1で陽性)|病気)P(検査1で陽性|病気) && 〃\\
=&(実際病気な時、検査1で陽性だった時、検査2で陽性の確率)P(検査1で陽性|病気) && 〃\\
=&(実際病気で、かつ検査1で陽性だった時、検査2で陽性の確率)P(検査1で陽性|病気) && 〃\\
=&P(検査2で陽性|(検査1で陽性∩病気))P(検査1で陽性|病気) && 〃\\
=&0.90\times0.99&\bullet&\frac{0.01}{((0.90\times P(病気|検査1で陽性) + 0.10\times P(健康|検査1で陽性)))P(検査1で陽性) }\\
=&0.8181...
\end{array}$$
となる。
$P(病気|検査1で陽性)$は、書籍の問1.3[1]における解説の$P(X|Y_1)$に同じであり、
$P(健康|検査1で陽性)$は$1-P(X|Y_1)$に同じであり、
$P(検査1で陽性)$は$P(Y_1)$に同じであるから、ここでは導出を省略する。
11ページ例題 問2.2
$$
p\sum^\infty_{x=0}{{((1-p)s)}^x}=\frac{p}{1-(1-p)s}$$がいきなりすぎると思うので、解説しようと思います。
この変形は、初項 $a$ 公比 $r$ の等比数列の第n項までの総和の公式を使ったものです。
公式は次の通りです。
$$\sum^n_{k=1}{ar^{k-1}}=\frac{a(r^n-1)}{r-1}$$
(導出はこちら...)
$$
\begin{array}{rlll}
\sum^n_{k=1}{ar^{k-1}}&=a+&ar+ar^2+\cdots+ar^{n-1}\\
r\sum^n_{k=1}{ar^{k-1}}&=&ar+ar^2+\cdots+ar^{n-1}&+ar^n\\
ここで引き算を行う\\
(1-r)\sum^n_{k=1}{ar^{k-1}}&=a&&-ar^n
\end{array}$$
後は整理すればよいです。