👇この表の読み方を解説します。
| 分析結果:陽性 | 分析結果:陰性 | |
|---|---|---|
| 正解:陽性 | TP(真陽性) | FN(偽陰性) |
| 正解:陰性 | FP(偽陽性 | TN(真陰性) |
まず大前提
"Positive" は「注目したいもの」 です。
例:
異常を見つけたい → 異常 = Positive
病気を見つけたい → 病気あり = Positive
スパムを見つけたい → スパム = Positive
つまり、Positive = 良いものとは限らないです。
「見つけたい対象」が Positive です。
TP / FP / FN / TN の意味
| 用語 | 読み方 | 意味 |
|---|---|---|
| TP | True Positive | Positive と予測して、実際も Positive |
| FP | False Positive | Positive と予測したけど、実際は Negative |
| FN | False Negative | Negative と予測したけど、実際は Positive |
| TN | True Negative | Negative と予測して、実際も Negative |
ポイントはこれです。
T / F = 予測が当たったか
P / N = AIがどちらと予測したか
例:病気判定AI
「病気あり」を Positive とします。
| 実際:病気あり | 実際:病気なし | |
|---|---|---|
| AI:病気あり | TP | FP |
| AI:病気なし | FN | TN |
それぞれの意味はこうです。
TP:病気ありと判定 → 本当に病気あり
FP:病気ありと判定 → 実は病気なし
FN:病気なしと判定 → 実は病気あり
TN:病気なしと判定 → 本当に病気なし
ようするに・・・
FP = False Positive
→ Positive と言ったけど間違い
→ 誤検知
FN = False Negative
→ Negative と言ったけど間違い
→ 見逃し
病気判定なら、
FP:病気じゃない人を病気と言う
FN:病気の人を見逃す
です。
計算式は丸暗記してください
| 指標 | 見ているもの | 式 |
|---|---|---|
| 正解率 | 全体でどれだけ当たったか | (TP + TN) / 全体 |
| 適合率 | Positive と予測した中で本当にPositiveだった割合 | TP / (TP + FP) |
| 再現率 | 実際のPositiveをどれだけ見つけられたか | TP / (TP + FN) |
📍ポイント
適合率
→ AIが「Positive」と言ったものの正しさ
→ TP / (TP + FP)
再現率
→ 本当のPositiveをどれだけ拾えたか
→ TP / (TP + FN)
📝まとめ(超ざっくり)
TN、FN
→ 正解
FPが多い
→ 誤検知が多い
FNが多い
→ 見逃しが多い
病気判定や不良品検出では、
特に FN=見逃し が問題になりやすいです。
とりあえず、これを理解してから、式を覚えるのが手っ取り早いです。
余談ですが、、、
個人的には日本語より、英語のほうがしっくりくるのは私だけですかね?