1. 概要
AIが自信を持って間違えること(overconfident predictions)を防ぐために、誤分類検知(Misclassification Detection: MisD)の研究が進んでおり、誤った予測を信頼できる信頼度を使って補正していく手法が多数提案されている。従来手法では、学習していないデータ分布(Out-of-Distribution: OOD)を検知してこの問題に対処することが多かった。この研究では、誤分類検知(MisD)に対して外れ値(Outliers)のサンプルを用いた最初の研究となっている。
2. 新規性
従来手法で多かった、OODの検知が実は誤分類検知(MisD)に対して何の効果ももたらさないことを明らかにした。その上で、正しいサンプルと誤分類されたサンプルとの間の信頼度がうまく分離できるように学習をさせることで、誤分類検知(MisD)の精度を大幅に改善した。
3. 実現方法
外れ値(Outliers)用のクラスを新たに定義して、外れ値の予測をするネットワークを学習する。次に、学習された外れ値を使って疑似サンプルを生成しこれを見抜けるように別のネットワークを学習する。
4. 結果
提案手法が誤分類サンプルの検知(MisD)だけでなく学習していないデータ分布(OOD)検知としても機能することが分かった。
last updates: July 5 2023