条件付き確率とベイズの定理を統計学の視点から徹底比較 〜具体例で学ぶ基本と応用〜
統計学において「条件付き確率」と「ベイズの定理」は、基礎でありながら実務にも直結する重要な概念です。この記事では、統計検定の学習を兼ねて、この2つの違いや関係性を、具体的なデータを用いてわかりやすく解説します。
条件付き確率とは何か?
まず、**条件付き確率(Conditional Probability)**とは、ある事象 $B$ が起きたときに、別の事象 $A$ が起こる確率のことです。記号で表すと以下のようになります。
$$
P(A|B) = \frac{P(A \cap B)}{P(B)} \quad \text{(ただし } P(B) > 0\text{)}
$$
ここで、$P(A \cap B)$ は $A$ かつ $B$ が同時に起こる確率、$P(B)$ は事象 $B$ が起こる確率です。
ベイズの定理とは何か?
**ベイズの定理(Bayes' Theorem)**は、条件付き確率を逆に求める公式です。
$$
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
$$
これは、既知の情報($B$ の観測)に基づいて、原因($A$ の確率)を推定するもので、機械学習、医療診断、信頼性工学など幅広い分野で応用されています。
具体例:医療診断における条件付き確率とベイズの定理
例題:ある病気の検査
- ある病気の有病率(実際に病気を持っている人の割合):1%($P(\text{病気}) = 0.01$)
- 検査の感度(病気の人が陽性と出る確率):99%($P(\text{陽性}|\text{病気}) = 0.99$)
- 検査の特異度(健康な人が陰性と出る確率):95%($P(\text{陰性}|\text{非病気}) = 0.95$)
Q1. 「検査が陽性だった場合、その人が実際に病気である確率」は?
ここで求めたいのは $P(\text{病気}|\text{陽性})$ です。これはベイズの定理で計算します。
ステップ1:確率の整理
- $P(\text{病気}) = 0.01$
- $P(\text{非病気}) = 0.99$
- $P(\text{陽性}|\text{病気}) = 0.99$
- $P(\text{陽性}|\text{非病気}) = 1 - 0.95 = 0.05$
ステップ2:ベイズの定理を適用
$$
P(\text{病気}|\text{陽性}) = \frac{P(\text{陽性}|\text{病気}) \cdot P(\text{病気})}{P(\text{陽性})}
$$
分母の $P(\text{陽性})$ は全体で陽性となる確率で、以下のように計算されます:
$$
P(\text{陽性}) = P(\text{陽性}|\text{病気}) \cdot P(\text{病気}) + P(\text{陽性}|\text{非病気}) \cdot P(\text{非病気})
$$
$$
= 0.99 \cdot 0.01 + 0.05 \cdot 0.99 = 0.0099 + 0.0495 = 0.0594
$$
したがって:
$$
P(\text{病気}|\text{陽性}) = \frac{0.99 \cdot 0.01}{0.0594} = \frac{0.0099}{0.0594} \approx 0.1667
$$
結果の解釈
陽性と診断されても、実際に病気である確率は約16.7%しかありません。
この結果は直感に反するかもしれませんが、「母集団に対する病気の発生率(有病率)」が低いため、偽陽性の影響が大きいのです。
条件付き確率とベイズの定理の比較
観点 | 条件付き確率 | ベイズの定理 |
---|---|---|
定義 | ある条件下での確率を求める | 条件付き確率の逆を求める |
主な用途 | 統計的推論、基本的な確率計算 | 逆推論(診断や推定) |
実用例 | 「雨の日に傘を持っている確率」 | 「傘を持っている人が雨に遭っている確率」 |
統計学における位置づけと重要性
- 条件付き確率はあらゆる確率モデリングの基盤。
- ベイズの定理は事後確率の導出に不可欠で、特にベイズ統計学ではコア概念となります。
結論
条件付き確率とベイズの定理は、密接に関連しながらも役割が異なる概念です。統計解析や意思決定において、「観測からどのように原因を推測するか」を考える際、ベイズの視点は非常に重要になります。