Universal Adversarial Perturbations Against Semantic Image Segmentation
Deep learningモデルはadversarial perturbationに弱い事が知られている.
このperturbationは人にはほぼ違いが分からないようなノイズを加えて,
deep learningモデルの推論結果を大きく変える事を示す.
さらには,入力に依存しない幅広く適用可能なuniversal perturbationが
存在する事も分かっている.
従来研究は画像分類においてこうした問題を研究してきたが,
本論ではsemantic segmentationに対する適用を考える.
本論では望んだ出力をモデルに出させるようなuniversal perturbationの
generatorを提案する.
結果,人間の目にはほぼ分からないようなノイズを加える事で,
どのような入力に対しても同じ一定の出力を出させる事に成功した.
Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes
Semantic segmentationは従来分類問題向けに設計されたCNNをベースにして設計されてきた.
しかしそうしたモデルは物体の場所を特定する事には特化しておらず問題であった.
本論ではそうした問題に対して,resnetライクな2つのパスを持つようなネットワークモデルを
提案する.
1つ目のパスは,フル解像度の情報を保持するようにする事で,クラス毎の境界を高精度に認識出来るようにする.
もう一つのパスでは,プーリングの処理を行っていく事で,ロバストな物体認識を可能にする.
この2つのパスはそれぞれの層においてresidual networkの構造として繋ぐ事で情報がやり取り可能である.
Semantic Segmentation using Adversarial Networks
Semantic segmentationの予測結果を見ると,予測ミスによって現実的にありえないような位置関係を持ったセグメントが得られる事が多い(例えば空に車があるなど).
そこで,通常のセグメント損失に加えて予測結果と真の値の間で,それがどちらであるか判別するモデルを騙すようにする敵対的損失と組み合わせる事で,現実的にありえないような予測ミスを軽減可能にした