#はじめに
分類器の評価に関する内容を整理します。
#分類器の概念
二項分類において、下記の図のように陽性Positiveと陰性Negativeのデータがあるとします。
もし、この分類器の正確度が100%であれば、下記の図のように陽性と陰性データを完璧に分類が可能です。分類器が、陽性として予測した領域をPositive Prediction, 陰性として予測した領域をNegative Predictionと言います。
しかしながら、実世界では正確度100%の分類器は珍しく、下記の図のように分類するケースが多いです。
ここで、用語を整理しましょう。
- データが陽性で、分類器が陽性として正しく予測した場合 → True Positive (TP)
- データが陰性で、分類器が陰性として正しく予測した場合 → True Negative (TN)
- データが陽性で、分類器が陰性として間違って予測した場合 → False Negative (FN)
- データが陰性で、分類器が陽性として間違って予測した場合 → False Positive (FP)
これらの用語を図として表現すると、下記の図になります。
普段、これらの用語をテーブルとして表すと、下記のようになります。あるいは、混合行列(Confusion Matrix)とも言います。
そして、実際(Observed)に陽性Positive, 陰性Negativeは、下記の式が成立します。
P = TP + FN\\
N = FP + TN
この表を用いて、次の指標を計算して、分類器の評価に使います。
##Accuracy(正確度)
全データの中(赤い枠)、正しく分類されたデータ(緑色)の割合を示します。
Accuracy = \frac{TP+TN}{TP+FN+FP+TN} = \frac{TP+TN}{P+N}
Sensitivity(Recall, 敏感度)
陽性データの中(赤い枠)、正しく陽性として分類されたデータ(緑色)の割合を示します。
Sensitivity = \frac{TP}{TP+FN} = \frac{TP}{P}
Precision(精密度)
陽性として予測したデータの中(赤い枠)、実際に陽性のデータ(緑色)の割合を示します。
Precision = \frac{TP}{TP+FP}
Specificity(特異度 True Negative Rate)
陰性データの中(赤い枠)、正しく陰性として分類されたデータ(緑色)の割合を示します。
Specificity = \frac{TN}{FP+TN} = \frac{TN}{N}
##False Positive Rate (1-Specificity)
陰性データの中(赤い枠)、間違って陽性として分類されたデータ(緑色)の割合を示します。
False Positive Rate = \frac{FP}{FP+TN} = \frac{FP}{N} = 1- Specificity
#まだピンとこない方のために
分類器の評価に関するいくつの用語を整理しました。しかしながら、まだピンとこない方もいると思います。
特にSensitivityとSpecificityがなかなな覚えられない意見が多いと聞いています。
例えば、貴方が海軍のためにレーダーを開発しているエンジニアだとしましょう。
貴方の任務は、友軍機(Positive)と敵機(Negative)を正しく捕捉するレーダーを設計することです。
用語 | 定義 | 海軍のレーダー |
---|---|---|
Accuracy | 全データの中、正しく分類されたデータの割合 | レーダーが友軍機、敵機問わず正しく捕捉された割合 |
Sensitivity, Recall | 陽性データの中、正しく陽性として分類されたデータの割合 | 友軍機の中、友軍機として正しく判断された割合 |
Precision | 陽性として予測したデータの中、実際に陽性のデータの割合 | 友軍機と判断した中、実際に友軍機であった割合 |
Specificity | 陰性データの中、正しく陰性として分類されたデータの割合 | 敵機の中で、正しく敵機と判断した割合 |
False positive rate | 陰性データの中、間違って陽性として分類されたデータの割合 | 敵機を間違って友軍機と判断した割合 |
海軍のレーダーの目的を考えますと、
- 友軍機をいかに正しく検知するか → Sensitivityの指標で判断。
- 敵機をいかに正しく検知するか → Specificityの指標で判断。
とう感じでいかがですか?
#参考資料
https://classeval.wordpress.com/introduction/basic-evaluation-measures/
https://bit.ly/3dCX3R8