More than 5 years have passed since last update.

乃木坂と欅坂メンバーをVGG16,VGG19,InceptionV3で転移学習してみた

Last updated at 2018-02-04Posted at 2018-01-28

転移学習を利用すると比較的簡単に精度よく一般物体認識ができるということで、筆者だと難しい乃木坂や欅坂メンバーのデータで認識できるのかどうか、やってみた。

コードは、以下に掲載している。

利用したモデルは、以下のKerasDocumentionにあるVGG16,VGG19そしてInceptionV3のPreTrainingなモデルを利用した。ちなみに同じようにResNet50も利用しようとしたが、入力が一致せず利用できなかった。
※ResNet50の入力は、width と height は197以上ということで、データサイズ（２２４，２２４）で実施

【参考】

Keras　Documentation　Applications
https://keras.io/ja/applications/

Fine-Tuningのコードは以下を参考にした。

【参考】

VGG16のFine-tuningによる17種類の花の分類 by　id:aidiary はてなブログPro
http://aidiary.hatenablog.com/entry/20170131/1485864665

やったこと

①データは、「MNISTのACGANを利用して、カラー画像のGANをやってみる - Qiita」と同じデータ

【参考】

https://qiita.com/MuAuan/items/0223aa3538029d498d14
②モデルは上記のとおり、ほぼ同じプログラムで実行できる。
　問題は、どの層までFineTuningするかということだが、１０層、１５層（つまりFineTuningなのか？）とVGG16については最後の全結合層（FineTuning）の三種類を実施。なお、１０層に対しては、、「MNISTのACGANを利用して、カラー画像のGANをやってみる - Qiita」と同じくデータサイズ（１２８，１２８）で実施。１５層とFineTuningはもともとのVGG16のデータサイズ（２２４，２２４）とした。
ResNet50で、Fine-Tuningの層を変えて、epoch当たりの時間を計測。やはり、Fine-Tuningの効果はありそう。精度とのトレードオフ。
しかし、収束性はResNet50が安定してるように見える。

③検証のために、TrainingされたVGG16モデルを使って、実際に認識してみた。

全層Training時とVGG16についてのFineTuningのACCの推移は以下のとおりとなった。

【結果】

各カテゴリーの画像がどの程度予測と一致しているかは以下の通りとなった
　その結果、どうもカテゴリ９が全く訓練されていないことが判明
　また、フィッティング率もカテゴリ毎にばらつきが大きい
　⇒これらについては是非とも改善したい
　　因みにこの場合のフィッティング率は６９．２％であり、ほぼ今回のフィッティング率と同程度である　　　　
　　

上記の結果はやはり、カテゴリ９を訓練していませんでした。
ということで、正常に訓練された（Data＿Augmentationしましたが）は以下の通りでした。

この結果から

１．データ数が多いカテゴリが精度よく、少ないカテゴリは悪い
２．ミスはカテゴリ０を除けば、乃木坂メンバー内、欅坂メンバー内でのミスが多い
　　⇒ほんとに検索の結果がカテゴリどおりか検証する必要がある
３．データ数の少ないカテゴリでは、データ数の多いカテゴリへのミスが多い
４．この段階で、フィッティング率は、７５．６％でほぼ今回以下のAugmentationのフィッティング率と同程度