More than 5 years have passed since last update.

【高速化】Ano-Unet V2で異常部分の可視化

Last updated at 2019-10-08Posted at 2019-10-08

異常個所を「教師無し学習」で可視化するAno-Unet V2を開発しました。
Ano-Unetに比べ速度と安定性を向上させました。

コード全体はこちらに置きました。

Ano-Unetの問題点

以前に開発したAno-Unetは以下の問題点を抱えていました。

そこで、問題点を解消すべくAno-Unet V2を開発しました。

通常の機械学習と同じく、学習フェーズと推論フェーズを切り離したため
推論は非常に速くなりました（処理時間は画像一枚に1分くらい）。
ただし、学習フェーズは5,6時間かかります。

全体の構造は以下のとおりです。

今回使っている技術は以下のとおりです。

※　Ano-Unet V2とは名ばかりで、メインはPartial Convolutionsの表現力を
　　頼りにしています。ただ、U-netは一応、Partial Convolutionsの中で
　　使われているので、Ano-Unet V2という名前でも許されるかなぁと思います。

以下、各技術を説明します。

Patial Convolutions（以下PCs）はマスクした部分をリアルな画像で補完
するネットワークです。

上の図は、PCsの論文より引用したものです。
かなりリアルな画像が再現されています。

Ano-Unet V2では、まず、PCsを正常画像で学習させます。そして、異常部分をマスクして
PCsで補完すれば異常部分が正常に変わるのでは？という発想で成り立っています。

以下の図が分かりやすいです。

これは、異常部分をマスクした画像を学習させたPCsに入れ、補完させた画像
を取得したものです。期待通り異常部分が消え、正常っぽい画像に変化しました。

PCsは正常画像で学習させているため、マスクした部分は必ず正常っぽい絵柄で
補完してくれます。

そして、マスクを移動させながら、補完した画像を異常検知させ、異常スコアで
評価すれば、異常部分のときだけ異常スコアが下がるため、どこが異常なのかを
特定することができます。

マスクは画像の端から端まで満遍なく移動させます。そして、マスクのサイズは
4種類を用意し、微小な異常個所から大きい異常個所までをカバーしています。

あらかじめディープラーニングによる異常検知を学習させておく必要がありますが、
これはディープラーニングじゃなくても何でも良いです。画像の異常度を算出できる
手法であれば良いです。

極端なことをいえば、画像を二値化して明るいところの面積で合否判定する手法でも
適用できます。（精度は保証できませんが。。。）

ただし、スコアを出す異常検知手法はオートエンコーダのような面積ベースの
評価方法の方が向いている気がします。metric learningのような特徴ベースの
ものだと最も異常な部分を消さないと、スコアが全然下がってくれないため、
少しの異常は見過ごされる傾向にあると思われます。

ただ、オートエンコーダによる異常検知は元々可視化できる構造なので、そもそも
Ano-Unet V2は使う必要ないよ！というジレンマもあるわけですが。。。

今回は、cifar-10は使わずに、製造業で出てきそうな画像を使います。
使ったデータセットは以下の二つ。

そして、異常検知手法として黒魔術を使いました。

コード全体はこちらに置きました。
Colabで動くはずです。

うまくいく確率は約70％という印象。

@daisukelab さんの自己教師あり学習と比べると見劣りしますが、
教師無し学習なので良しとします(^^；

うまくいく確率は約50％という印象。
結構難しいデータセットでした。