0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【ML初心者アドベントカレンダー】混同行列について学ぶ

Last updated at Posted at 2024-12-02

最も Accuracy で最も Precision で、そして最も Recall なやり方でいかさせていただきます。

この記事の目的

混同行列についてプリミティブに説明できるようになる。
(MLとALの違いも判らない段階で学ぶものではないと思うが、機械学習を学ぶ過程で参考にしている書籍やサイトにすごくよく出てくるので気になってもう調べる。)

混同行列(Confusion Matrix)とは

クラス分類の精度評価の指標のこと。
この結果でモデルがどれくらい正確に働いたか、どれだけ間違えたかが一目でわかるので、調節がしやすくなる。

「不特定多数の人間の写真から、服装などの特徴をもとに一般人か地面師かを当てるモデル」を例に、以下の単語を説明する。

真陽性 (True Positive)

モデルが地面師と予測した写真のうち、実際に地面師だった写真の数。

偽陽性 (False Positive)

モデルが地面師と予測した写真のうち、実際には一般人だった写真の数。

真陰性 (True Negative)

実際には一般人で、モデルも一般人だと予想した写真の数。

偽陰性 (False Negative)

実際には一般人だが、モデルが地面師と予想した写真の数。


つまり…

モデルの予想があっていれば 真(True)
間違っていれば 偽(False)

そのうえで

モデルが見つけるべき対象(今回の例でいうと地面師)を指すなら 陽性(Positive)
それ以外は 陰性(Negative)

精度指標

各種スコアが存在し、上記で挙げた真陰性等を基に計算する

正解率(Accuracy)

その名前の通り、モデルの正解率

再現率(Recall)

実際の陽性のうち、陽性として検出されたデータの割合

適合率(Precision)

モデルが陽性と予測したデータのうち、実際に陽性だったデータの割合

F値

再現率と適合率をいい感じに計算した値。
モデルがそれくらい優れているかを判断する指針になる。

ざっくりまとめ

混同行列とは、クラス分類の精度評価の指標のこと。モデルの調節などに用いる。

下記のような表で見るとわかりやすい。

実際は地面師 実際は一般人
モデルが地面師だと予測した 真陽性 偽陽性
モデルが一般人だと予測した 偽陰性 真偽性
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?