Qiita Engineer Festa20242024年7月17日まで開催中！

Average Precisionとは？（初心者向け）

Last updated at 2024-07-14Posted at 2024-06-22

1. 一言で表すと？

偽陽性と偽陰性の両方をどれだけ抑えられたか評価する指標

以降、Average PrecisionをAPと呼びます。

2. 何に使われる？

異常検知・発病リスク予測など、正例が極端に少ない予測を行うモデルの評価に役立ちます。

2.1 ちなみに他の評価指標は？

最も単純なものの一つとしてAccuracy（正答率）を挙げます。学校の試験の点数と一緒で、予測データのうち教師データと合致している割合を計算します。正例と負例のバランスが良いデータなら評価指標として機能します。

2.2 APとAccuracyとの比較

Accuracyは正例と負例の分布が片方に偏っていると機能しません。例えば異常検知タスクの場合、ほとんどのデータが負例と分かりきっています（＝故障は頻繁に起こらない）。予測なんてせずに当てずっぽうで全部負例にしてもそこそこ当たるでしょう。
きちんと学習したモデルと当てずっぽうで予測したモデルとの差がつかないので、評価指標として機能していません。

3. APの定義をきちんと理解する

まずPrecision, Recall, Precision-Recall曲線を理解します。

3.1 Precision

・定義：正と予測したもののうち、実際に正だった割合
・計算式：

・つまり
これが高い＝偽陽性が少ない

3.2 Recall

・定義：実際に正であるもののうち、正と予測できた割合
・計算式：

・つまり
これが高い＝偽陰性が少ない

3.3 Precision-Recall(PR)曲線

偽陽性を減らしたいなら多めに陰性と判断すればよいですし、偽陰性を減らしたいなら多めに陽性と判断すればよいです。つまりPrecisionとRecallはトレードオフの関係にあります。
PR曲線を使うとPrecisionとRecallの関係を表すことができます。
例えば発病予測タスクで、発病予測データと正解データがあるとします。