前回の大きな問題は、
「※なぜか、上で一個だけ得たときのものはここでは二番目の候補になっていますが、このまま掲載することとします(バグがありそうですが見つけた時点で修正します)」
という問題です。
特に何か変更していないのに、結果が異なるというのはちょっと勘が働きます。
ということで原因調査してみた結果、「DLの不安定問題」という大発見をしたので、掲載しておきます(笑)
(1)オリジナル画像;論文等の画像から処理したもの
※入力画像を元画像としています。番号は予測ランキングを示します。
モデルはmodel = VGG16(weights='imagenet')
であり、なんら変更していません。
元画像 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
cat_dog | 242boxer | 243bull_mastiff | 282tiger_cat | 292tiger | 246Great_Dane |
(2)ダウンロード画像;ウワンの記事からダウンロードしてそのまま利用
※ちょっとフチがあります
元画像 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
dog_cat | 243bull_mastiff | 242boxer | 292tiger | 246Great_Dane | 247Saint_Bernard |
(3)フチなし画像;(2)の画像のフチを処理してフチなしにしたもの
元画像 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
dog_cat_noframe | 242boxer | 243bull_mastiff | 246Great_Dane | 292tiger | 247Saint_Bernard |
(4)フチあり画像;(2)の画像にさらにフチを広げたもの
元画像 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
dog_cat_Bigframe | 163bloodhounddog | 166Walker_hounddog | 246Great_Dane | 161basset | 167English_foxhound |
同じ画像にフチがあるか無いか程度の差で予測が異なっています。
ただし、Grad-CAMやGuided-Grad-CAMの絵はそれほど大きく変わっているわけではなく、そうなんだろうという程度の結果を出力しています。
つまり、元々カテゴリが近すぎて、混在しやすいというリスクがあるものと想像できます。
この辺りは、まだまだ研究が必要だと思います。
「DLといえども、ほどほどなカテゴリ数なり、特徴が異なるカテゴリでの適用が無難なのかもしれません」
まとめ
・バグだと思っていたが、「DLの不安定問題」という結論でした
・入力画像のちょっとした違いにより、同じ画像も異なった分類をする危険性があることが判明
・騙しとの関連で、カテゴリ間類似性の問題をさらに研究する必要がある
・「DLといえども、ほどほどなカテゴリ数なり、特徴が異なるカテゴリでの適用が無難なのかもしれません」⇒容認できる(誤答しない)基準が必要なので目安を見つけたいと思う