【特徴部位可視化】Grad-CAMとGuided Grad-CAMで遊んでみた♬「DLの不安定問題」 #Python

前回の大きな問題は、
「※なぜか、上で一個だけ得たときのものはここでは二番目の候補になっていますが、このまま掲載することとします（バグがありそうですが見つけた時点で修正します）」
という問題です。

特に何か変更していないのに、結果が異なるというのはちょっと勘が働きます。

ということで原因調査してみた結果、「DLの不安定問題」という大発見をしたので、掲載しておきます（笑）
（１）オリジナル画像；論文等の画像から処理したもの
※入力画像を元画像としています。番号は予測ランキングを示します。
　モデルはmodel = VGG16(weights='imagenet')であり、なんら変更していません。

元画像	１	２	３	４	５
cat_dog	242boxer	243bull_mastiff	282tiger_cat	292tiger	246Great_Dane

（２）ダウンロード画像；ウワンの記事からダウンロードしてそのまま利用
※ちょっとフチがあります

元画像	１	２	３	４	５
dog_cat	243bull_mastiff	242boxer	292tiger	246Great_Dane	247Saint_Bernard

（３）フチなし画像；（２）の画像のフチを処理してフチなしにしたもの

元画像	１	２	３	４	５
dog_cat_noframe	242boxer	243bull_mastiff	246Great_Dane	292tiger	247Saint_Bernard

（４）フチあり画像；（２）の画像にさらにフチを広げたもの

元画像	１	２	３	４	５
dog_cat_Bigframe	163bloodhounddog	166Walker_hounddog	246Great_Dane	161basset	167English_foxhound

同じ画像にフチがあるか無いか程度の差で予測が異なっています。
ただし、Grad-CAMやGuided-Grad-CAMの絵はそれほど大きく変わっているわけではなく、そうなんだろうという程度の結果を出力しています。
つまり、元々カテゴリが近すぎて、混在しやすいというリスクがあるものと想像できます。
この辺りは、まだまだ研究が必要だと思います。
「DLといえども、ほどほどなカテゴリ数なり、特徴が異なるカテゴリでの適用が無難なのかもしれません」

まとめ

・バグだと思っていたが、「DLの不安定問題」という結論でした
・入力画像のちょっとした違いにより、同じ画像も異なった分類をする危険性があることが判明

・騙しとの関連で、カテゴリ間類似性の問題をさらに研究する必要がある
・「DLといえども、ほどほどなカテゴリ数なり、特徴が異なるカテゴリでの適用が無難なのかもしれません」⇒容認できる（誤答しない）基準が必要なので目安を見つけたいと思う