More than 3 years have passed since last update.

学習済 EfficientNet を使った異常検知手法論文のまとめ

Last updated at 2020-09-17Posted at 2020-09-17

（注意: 未完成です！後日追記予定です!）

きっかけはとある1件のツイート

この論文の凄さは、「DNNは学習していない」ということ。学習済モデルを全面的に信用している。それでAUC95.80％は驚愕。

凄まじく早い（学習）ので、エッジなんかで威力を発揮しそう。
（続く） https://t.co/1u6BUQsJnt
— shinmura0 @ 9/26鳥コンペ反省会 (@shinmura0) September 14, 2020

そんなことがあるのかと、思ったので元論文を探して読んでみて自分なりに解釈してみたという記事です。

元記事
Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection

ツイートの返信をみると、どうやら実装もあるらしい（pytorch）

学習済 EfficientNet を使った異常検知手法。MVtec-ADでAUC 95.08（SOTA上回る）を達成。

論文：https://t.co/6zfb9YFotE
実装：https://t.co/rIgdEZK6wa
— shinmura0 @ 9/26鳥コンペ反省会 (@shinmura0) August 24, 2020

もし解釈とかに間違いがありましたら、ぜひぜひコメントや編集リクエスト投げていただけると喜びます。

3行まとめ

EfficientNetを用いたモデルを異常検知に用いることでMVTecデータセットにおけるAUCスコアを95.8%前後達成(SoTAを上回る)
hoge
fuga

概要 - abstract

一般的な異常検知アルゴリズムはデータセットを元に1から学習しようとするが、異常ラベルに該当するデータが少ないことから半教師あり学習のような、不均衡データへのアプローチを行うことがほとんどである。

この論文ではEfficientNetで学習されたモデルへ多変量ガウスを当てはめ、マハラノビス距離を異常度合いを示すスコアとして異常検知したところ MVTec Anomaly Detection Dataset (MVTec AD) において全15クラスでAUC95.8%前後の数値を達成した。またPCAによる性能向上とモデルの複雑性の減少も達成しており、また性能と偽陽性率のバランスについても調査した。

導入 - introdcution

画像における異常検知では異常データにどのような規則性があるかを探すことを目的にしているが、そもそも異常データというものは一般的にデータとして少ないかつ、異常というデータに属するものは規則性がなく曖昧なものである。

本論文では大規模な画像データセットを元に学習したモデルが異常検知に適していることを検証するために、学習済みモデルのネットワークの特徴に対して多変量ガウスを当てはめる。そしてマハラノビス距離を異常度合いを示すスコアとして適用することで MVTec Anomaly Detection Dataset (MVTec AD) において全15クラスでAUC95.8%前後の数値を達成した。

さらにPCAによる主成分分析を用いることで、モデルの表現力がなぜ異常検知に有効なのかも調査した。その結果として、正常データの中で分散の少ない主成分が、正常と異常を分ける重要なポイントであることが分かった。
その分散の少ない主成分に対してのみ多変量ガウスを適合させることで、異常検知能力を向上させるかつモデルの複雑性を減らすことができる。

多変量ガウスを適用した上で、許容可能な偽陽性率（FPR)の基準も調査した。

正常データに対する深層学習によるモデル化 - modeling normal data distribution in deep feature representations

学習済みモデルが異常検知タスクに適用できると仮定して、転移学習時のクラスが増えるのと同様に、正規データのみを用いてモデルを作成しモデルの微調整を省略する。

平均 $\mu$ と共分散 $\Sigma$を持つ多変量ガウス分布の元で、点と分布間の距離測定にマハラノビス距離を計算する。

多変量ガウス分布を仮定した場合、プロットされる点は確率に基づいて推定することができる。これはマハラノビス距離が正常なデータである確率 $p$ に対応する場合に真陰性率（TN)に一致するというもの。この時 1 - p が異常であるにもかかわらず正常と誤って予測された確率(FP)として見ることができる。

実験と結果 - experiments and results

まず事前に学習した分類機モデルの各レイヤーごとに抽出した特徴が異常検知に適していいるかを評価する。ここでは例としてResNetを用いる。レイヤーの最終層で特徴を抽出し、どのレイヤーの特徴が良いかを評価する。

議論 - discussion

todo

結論 - conclusion

todo

まとめと雑感

todo

参考記事

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

学習済 EfficientNet を使った異常検知手法論文のまとめ

きっかけはとある1件のツイート

3行まとめ

概要 - abstract

導入 - introdcution

関連研究 - related work

1. ゼロベースで学習した異常検知モデル

2. 転移学習を用いたディープラーニングモデルによる異常検知

正常データに対する深層学習によるモデル化 - modeling normal data distribution in deep feature representations

実験と結果 - experiments and results

議論 - discussion

結論 - conclusion

まとめと雑感

参考記事

学習済 EfficientNet を使った異常検知手法 論文のまとめ

きっかけはとある1件のツイート

3行まとめ

概要 - abstract

導入 - introdcution

関連研究 - related work

1. ゼロベースで学習した異常検知モデル

2. 転移学習を用いたディープラーニングモデルによる異常検知

正常データに対する深層学習によるモデル化 - modeling normal data distribution in deep feature representations

実験と結果 - experiments and results

議論 - discussion

結論 - conclusion

まとめと雑感

参考記事

学習済 EfficientNet を使った異常検知手法論文のまとめ