More than 1 year has passed since last update.

機械学習で使用する評価指標

Posted at 2023-01-09

混合行列について

二値分類では混合行列を用いて予測結果を分類することができる。予測結果の「陽性；Positive」、「陰性；Negative」に対して、それが正解かどうかの「True」、「False」をつけて表現する。

全データのうちどれだけ正解したかの指標。アンバランスなデータセットである場合（ex. 負例が多い）、とりあえず「負例」と答えても accuracy が 99% とかになってしまうので、データの性質に注意。
$$
\frac{TP+TN}{TP+FP+TN+FN}
$$

「陽性」と予測したもののうち、真に陽性であるものの割合。

$$
\frac{TP}{TP+FP}
$$

真に陽性であるもののうち、正しく「陽性」と予測したものの割合。

$$
\frac{TP}{TP+FN}
$$

モデルがすべて「陽性」と予測した場合、FN（偽陰性）はゼロになるため Recall が100% になる
- Recall が高い場合は、真の陽性を逃していないということになる
「すべて陽性」と判定すると、TPも増えるがそれに伴って、FP（偽陽性）も増える
- Precision が低下するので、モデル自体の「陽性判定」に信頼が置けなくなる

Precision と Recall は以下の理由からトレードオフの関係にある。

各種指標を使いたいのは次の場合

とにかくモデルの陽性判定が確度の高いものである必要がある場合→Precision
- ex. 広告マーケティング：DMを送付すれば効果がある、というユーザーを的確に見抜きたい。Precision が低いと、無駄なDMを大量に送付することとなってしまう
陽性者の見逃しを極力避けたい場合→Recall
- ex. がん患者の診断：がん患者かどうかを判定するときに、ひとまず「がんである（＝陽性）」と判定しておけば、見逃しはなく多くの人命を救うことに繋がる

真に陰性であるもののうち、正しく「陰性」と予測したものの割合。
$$
\frac{TN}{FP+TN}
$$

Precision と Recall の調和平均であり、トレードオフの関係にある両者の評価指標を同時に評価し、バランスの良いモデル予測かどうかを調べることができる。

$$
F_1 = \frac{1+1}{1/P + 1/R} = 2\cdot \frac{P\cdot R}{P + R}
$$