1.はじめに
英語で「異常検知(Anomaly Detection)」に関する論文を探していると,「外れ値検知(Outlier Detection)」,「新規性検知(Novelty Detection)」,「分布外検知(Out-of Disbution)」,「1クラス分類(One-class Classification)」などのワードが出てくる.これらのワードは意味が似ていてニュアンスが紛らわしくなりがちである.
今回はこれらのワードの紛らわしさを解消するためにそれぞれの意味を簡単にまとめる.
2.異常検知(Anomaly Detection)
正常なサンプルの分布以外の分布から抽出されたサンプルを検知する.
何を正常として何を異常とするかによってさまざまな問題設定が考えられる.
以下の3~6で説明する項目も,捉え方によっては異常検知であるといえる.
(なんなら上の図は新規性検出,分布外検出,1クラス分類のどの言葉でも表現できる)
3.外れ値検知(Outlier Detection)
正常なサンプルの分布から低確率で抽出されるサンプルを検知する.
4.新規性検知(Novelty Detection)
訓練データに含まれるサンプルの分布以外の分布から抽出されたサンプルを検知する.
5.分布外検知(Out-of Distribution Detection)
6.1クラス分類(One-class Classification)
7.まとめ
それぞれの言葉の意味を考えてみると,実はやっていることは同じで言葉の使い方が違うだけというケースが多そうだということが言える.
また,この中のワードでは異常検知が一番大雑把な意味合いで使われ,その他のワード(外れ値検知,新規性検知,分布外検知,1クラス分類)を包含しているともとらえられるだろう.
論文を探すとき,読むときにこれらのワードを見つけたら,著者がどのような設定を示そうとしているのか意識しながら読もう.
※本記事の内容に誤りや不適切な点がありましたら,お知らせいただけると幸いです.