多クラス分類の混同行列でマクロ平均再現率と全クラスの正解率が一致するときがあり、しばらく詰まってしまったので記事にします。
多クラス分類の評価指標
このページがわかりやすく、大変助かりました。
ほかの評価指標についてはこちらを見てください。
今回はこのような多クラス分類の混同行列で考えます。
オレンジのマスが予測が正解したときです。
正解率
\frac{正解したデータ数の合計}{すべてのデータ数}
今回の場合であれば、
\frac{210+240+400}{300+400+500} = \frac{850}{1200} = 70.8%
になります。
マクロ平均再現率
マクロ平均再現率とは、各クラスの再現率を平均したものです。
\frac{それぞれのクラスの再現率の合計}{クラス数}
\frac{70.0+60.0+80.0}{3} = \frac{210.0}{3} =70.0%
になります。
マクロ平均再現率と正解率が一致する例
上の表の例では、マクロ平均再現率は70.0%、正解率は70.8%と一致しませんでした。
一方、下の表の例で考えてみます
正解率は
\frac{300+350+400}{500+500+500} = \frac{1050}{1500} = 70.0%
マクロ平均再現率は
\frac{60.0+70.0+80.0}{3} = \frac{210.0}{3} = 70.0%
になり、一致します。え?なんで?
マクロ平均再現率と正解率が一致する条件
結論から言うと、それぞれの真のクラスの枚数が等しいときにマクロ平均再現率と正解率が一致
します。
a~iはそれぞれの枚数が入ります。
今回は真のクラスの枚数が等しいので、
a+b+c = d+e+f = g+h+i = N
とします。
正解率は
\frac{a+e+i}{(a+b+c)+(d+e+f)+(g+h+i)} = \frac{a+e+i}{3N}
となります。
(\frac{a}{N}+\frac{e}{N}+\frac{i}{N})÷3=\frac{a+e+i}{3N}
となるので、正解率もマクロ平均再現率も
\frac{a+e+i}{3N}
となります。
まとめ
それぞれのクラスのデータ数(枚数)が同じとき、マクロ平均再現率と正解率が一致します。
参考
https://analysis-navi.com/?p=553
https://kunsen.net/2021/03/18/post-3653/#Accuracy-2
https://www.haya-programming.com/entry/2018/03/14/112454