執筆のきっかけ
大流行に乗っかり、クリスマスにインフルエンザを発症しました。幸い予防接種を受けていたため、約1日で熱は下がりました。
インフルエンザ抗原検査を受けたのですが、その結果用紙に感度・特異度について書かれていました。
年末の大半は家でおとなしくしていることになるため、その暇を活用して感度・特異度について整理します。
準備1 - 条件付き確率(高校の数学Aで学習)
感度・特異度を考える上で必要になるのが条件付き確率です。
ある事象 $A$ が起こったときに、事象 $B$ が起こる条件付き確率は次のように定義されます。
P(B | A) = \frac{P(A \cap B)}{P(A)}
準備2 - 命題の対偶(高校の数学1で学習)
命題「$A \implies B$」について、その対偶は
\bar{B} \implies \bar{A}
で、命題の真偽と対偶の真偽は一致します。
(例) O(オー)さんという人について、以下の2つの条件$A$、$B$ を考えます。
$A$:Oさんはドジャースの選手である
$B$:Oさんは野球選手である
このとき、命題「$A \implies B$」は真であり、「$B \implies A$」は偽です。
(ドジャースの選手は全員必ず野球選手です。一方、野球選手であってもドジャースの選手とは限りません。)
一方、条件の否定$\bar{A}$、$\bar{B}$ は次のようになります。
$\bar{A}$:Oさんはドジャースの選手ではない
$\bar{B}$:Oさんは野球選手ではない
このとき、命題「$\bar{B} \implies \bar{A}$」は真であり、「$\bar{A} \implies \bar{A}$」は偽です。
(野球選手でないなら、ドジャースの選手でもありません。一方、ドジャースの選手でないとしても他チームの選手である可能性はあるので野球選手ではないとはいえません。)
感度・特異度とは
感度(Sensitivity)と特異度(Specificity)は、機械学習や医療検査の性能を評価する際に使用される指標です。インフルエンザの話なので、以下では医療検査の性能をベースに書いています。
症状と検査結果
検査される人の症状を次のように表すことにします。
- インフルエンザに感染している : $\theta = 1$
- インフルエンザに感染していない : $\theta = 0$
実際に知りたいのはこの感染の有無ですが、厳密にはわかりません。そこで、検査薬を使ってこれを推定します。
検査の結果を次のように表します。
- インフルエンザ検査が陽性 : $X = 1$
- インフルエンザ検査が陰性 : $X = 0$
ご存じの方も多い、偽陽性や偽陰性などの関係をまとめると次のようになります。
左上と右下が「真」なので正しい検査結果です。一方、右上と左下が誤った検査結果です。
感度(Sensitivity)
感度とは、実際に病気の人に対して、検査で陽性と判定できる確率です。
特異度(Specificity)
特異度とは、実際に病気でない人に対して、検査で陰性と判定できる確率です。
条件付き確率としての表現
感度・特異度を、条件付き確率を用いて表すと次のようになります。
\begin{align}
感度 P(X=1 | \theta=1) \\
特異度 P(X=0 | \theta=0)
\end{align}
どちらも検査結果$X$と感染の有無$\theta$が一致しているので、検査が症状を正しく判定できる確率を表していることが確認できます。
感度と特異度のトレードオフ
感度と特異度の両方が高いと、感染している人は陽性に、感染していない人は陰性になるので検査薬として理想的です。
ただ残念ながらそんな万能なものを作るのは難しく、大概の場合に「感度」と「特異度」は一方を高くするともう一方が低くなる、いわゆる「トレードオフ」の関係にあるといわれます。
感度は「病気を見つける」能力を表し、特異度は「健康な人を受け流す」能力と言えます。たくさん見つけようとすると受け流すことが苦手になり、逆になるべく受け流そうとすると見つけることが苦手になります。
筆者が使用したインフルエンザ検査
筆者が使用したインフルエンザ検査について、病院からいただいた説明書きに以下のことが記されていました。
~感度は40~70%、特異度は95%以上と報告されています。~
これを読んだとき、「結構、特異度を重要視してるんだなぁ」と感じました。
特異度について
特異度が95%ということは、$P(X=0 | \theta=0)=0.95$です。
つまり、
\theta=0(インフルエンザでない) \implies X=0(検査が陰性)
を高い精度で保証します。
このとき、対偶である
X=1(検査が陽性) \implies \theta=1(インフルエンザである)
も高い精度で保証されます。
つまり、検査が陽性になった場合は高い確率でインフルエンザに感染しているといえます。
感度について
仮に感度が70%、すなわち$P(X=1 | \theta=1)=0.7$とすると、
\theta=1(インフルエンザである) \implies X=1(検査が陽性)
となるのが70%です。
このとき、対偶である
X=0(検査が陰性) \implies \theta=0(インフルエンザでない)
も70%の精度といえます。逆に言えば、30%は誤った陰性(偽陰性)であると考えられます。
単純に考えると、2回連続で偽陰性になる確率も(独立であるという仮定をおけば)9%になるわけで、「陰性といわれても大丈夫とは言い切れないんだなぁ」と改めて感じました。
まとめ
インフルエンザの検査について、感度・特異度の数値に結構差があることを知りました。
いくつか調べてみると、
- スクリーニング検査(見落としを避けたい場合)→ 感度重視
- 確定診断(誤診を避けたい場合)→ 特異度重視
という側面もあるそうです(間違ってたらすみません)。
インフルエンザ検査は確定診断であることを重視されているということなのでしょうか。
あと実際の診断は、インフルエンザ患者がどのくらいいるか、すなわち$p(\theta=1)$を事前確率として、事後確率$p(\theta=1 | X=1)$を求めることで行われるみたいです。($p(X=1 | \theta=1)$は尤度にあたるんですかね)
インフルエンザ感染をきっかけに、感度・特異度について改めて整理する機会をもらえました。皆さんの整理にもつながれば幸いです。そして、体調にはくれぐれもお気を付けください。
(妻への感染は何とか防げたようで、ほっとしております…)