0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【多クラス分類】マクロ平均再現率と正解率が一致するときもある

Last updated at Posted at 2023-06-09

多クラス分類の混同行列でマクロ平均再現率と全クラスの正解率が一致するときがあり、しばらく詰まってしまったので記事にします。

多クラス分類の評価指標

このページがわかりやすく、大変助かりました。
ほかの評価指標についてはこちらを見てください。

今回はこのような多クラス分類の混同行列で考えます。
image.png
オレンジのマスが予測が正解したときです。

正解率

\frac{正解したデータ数の合計}{すべてのデータ数} 

今回の場合であれば、

\frac{210+240+400}{300+400+500} = \frac{850}{1200} = 70.8%

になります。

マクロ平均再現率

マクロ平均再現率とは、各クラスの再現率を平均したものです。

\frac{それぞれのクラスの再現率の合計}{クラス数} 

それぞれのクラスの再現率は
image.png
になるので、マクロ平均再現率は

\frac{70.0+60.0+80.0}{3}  = \frac{210.0}{3} =70.0%

になります。

マクロ平均再現率と正解率が一致する例

image.png
上の表の例では、マクロ平均再現率は70.0%、正解率は70.8%と一致しませんでした。
一方、下の表の例で考えてみます
image.png
image.png
正解率は

\frac{300+350+400}{500+500+500} = \frac{1050}{1500} = 70.0%

マクロ平均再現率は

\frac{60.0+70.0+80.0}{3}  = \frac{210.0}{3} = 70.0%

になり、一致します。え?なんで?

マクロ平均再現率と正解率が一致する条件

結論から言うと、それぞれの真のクラスの枚数が等しいときにマクロ平均再現率と正解率が一致します。
image.png
a~iはそれぞれの枚数が入ります。
今回は真のクラスの枚数が等しいので、

a+b+c = d+e+f = g+h+i = N

とします。
正解率は

\frac{a+e+i}{(a+b+c)+(d+e+f)+(g+h+i)}  = \frac{a+e+i}{3N} 

となります。

マクロ平均再現率は
image.png
より、

(\frac{a}{N}+\frac{e}{N}+\frac{i}{N})÷3=\frac{a+e+i}{3N} 

となるので、正解率もマクロ平均再現率も

\frac{a+e+i}{3N} 

となります。

まとめ

それぞれのクラスのデータ数(枚数)が同じとき、マクロ平均再現率と正解率が一致します。
image.png

参考

https://analysis-navi.com/?p=553
https://kunsen.net/2021/03/18/post-3653/#Accuracy-2
https://www.haya-programming.com/entry/2018/03/14/112454

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?