ペンギン分類器をつくってみた（後編）

Last updated at 2018-12-23Posted at 2018-12-23

はじめに

この記事はSRA Advent Calendar 2018 の23日目の記事です。

やったこと

下準備

前編記事のとおりです。
128x128サイズ（足りない部分は黒でパディング済み）のペンギン6種（エンペラーペンギン、キングペンギン、アデリーペンギン、ヒゲペンギン、ジェンツーペンギン、イワトビペンギン）各500枚の写真を用意しています。これをトレーニングデータ、検証用データにして、Keras(backendはtensorflow)で学習させます。
さらに、各60枚のテストデータで、作成した学習モデルの正解率を計算します。

ディレクトリ構成は下記の通り

|
|-  penguin_classfications_class.ipynb   : jupyter notebook (4層CNN)
|-  penguin_classfications_class_imagenetbased.ipynb  : jupyter notebook(VGG16 ImageNet based)
|- train　　(train+validation用画像　各500枚)
    |- adelie_penguin      : アデリーペンギン
    |- chinstrap_penguin   : ヒゲペンギン
    |- emperor_penguin     : エンペラーペンギン
    |- gentoo_penguin      : ジェンツーペンギン
    |- king_penguin        : キングペンギン
    |- rockhopper_penguin  : イワトビペンギン
|- test     (test用画像　各60枚)
    |- adelie_penguin
    |- chinstrap_penguin
    |- emperor_penguin
    |- gentoo_penguin
    |- king_penguin
    |- rockhopper_penguin

コード（jupyter notebook)はgithubにあげました。

作成したモデル

今回のモデル作成はおもに「PythonとKerasによるディープラーニング」の第5章を参考にしています。
あと、コード実装では小さなデータセットで良い分類器を学習させるときを参考にさせていただきました。

データの読み込みはImageDataGenerator.flow_from_directory() を使っています。ImageDataGeneratorのvalidation_splitを指定することで、トレーニングデータと検証用データにわけています。validation_split=0.2としました。

flow_from_directoryメソッドでsubset='training' を指定するとトレーニング用のサブセット、subset='validation'を指定すると検証用サブセットがとれるようなので、これを使いました。本家のドキュメントには書いてあるんですが、日本語版のドキュメントに入ってないのでわりと新しいオプションなんでしょうか。

4層CNN、データ拡張なし

以下のような単純な畳み込み層とプーリング層が交互に4層重ねたネットワークを使いました。

def network(input_shape, num_classes):
    model = models.Sequential()
    model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=input_shape))
    model.add(layers.MaxPooling2D(2, 2))
    model.add(layers.Conv2D(64, (3, 3), activation='relu'))
    model.add(layers.MaxPooling2D(2, 2))
    model.add(layers.Conv2D(128, (3, 3), activation='relu'))
    model.add(layers.MaxPooling2D(2, 2))
    model.add(layers.Conv2D(128, (3, 3), activation='relu'))
    model.add(layers.MaxPooling2D(2, 2))
    model.add(layers.Flatten())
    model.add(layers.Dense(512, activation='relu'))
    model.add(layers.Dense(num_classes, activation='softmax'))
    return model