環境
・windows
・python
・Google Colaboratory
概要
・作ったもの
・乃木坂46とは
・深層学習とは
・画像を学習/検証データに分ける
・モデルの構築と学習
・webアプリ化
作ったもの
乃木坂46について
AKBの公式ライバルとして秋元康のプロデュースによって誕生したアイドルグループです。
「乃木坂46、欅坂46、日向坂46」を総称して坂道グループと呼ばれています。詳しくはこちらをご覧ください。
深層学習とは
多層のニューラルネットワークによる機械学習の手法です。
ニューラルネットワークは人間の神経細胞を数式モデルで人工的に表現したものです。
上図はニューラルネットワークのモデル図です。
「入力層、隠れ層、出力層」の各層を持ちノードとノードが繋がっている構造である。データが入力層から入り、入力層ー隠れ層、隠れ層ー出力層との間で重みが調整されていきます。
詳しくはこちら
画像を収集及び顔の切り出し
画像を収集はpythonライブラリicrawlerを使い簡単に画像データを集めるを参考に収集しています。
顔の切り出しについてはopencvで顔を検出してみたを参考にし、上手く切り出せなかった画像については手動で調整しました。
画像を学習/検証データに分ける
学習用と検証用にデータを3:1に分けます。
モデルの構築/学習
webアプリ化する必要がなければ、こちらで試された方が爆速でできよいと思います。
from keras import layers,models
from keras import optimizers
from keras.utils import np_utils
import numpy as np
import keras
classes=["asuka","ikuta","nana","maiyan"]
num_classes=len(classes)
image_size=50
def main():
X_train,X_test,y_train,y_test=np.load("./nogi.npy")
X_train=X_train.astype("float")/255
X_test=X_test.astype("float")/255
y_train=np_utils.to_categorical(y_train,num_classes)
y_test=np_utils.to_categorical(y_test,num_classes)
model=model_train(X_train,y_train)
model_eval(model,X_test,y_test)
def model_train(X,y):
#モデルの作成
model=models.Sequential()
model.add(layers.Conv2D(32,(3,3),activation="relu",input_shape=(50,50,3)))
model.add(layers.MaxPooling2D(2,2))
model.add(layers.Conv2D(64,(3,3),activation="relu"))
model.add(layers.MaxPooling2D(2,2))
model.add(layers.Conv2D(128,(3,3),activation="relu"))
model.add(layers.MaxPooling2D(2,2))
model.add(layers.Conv2D(128,(3,3),activation="relu"))
model.add(layers.MaxPooling2D(2,2))
model.add(layers.Flatten())
model.add(layers.Dense(512,activation="relu"))
model.add(layers.Dense(4,activation="softmax"))
#コンパイル
model.compile(loss="binary_crossentropy",optimizer=optimizers.RMSprop(lr=1e-4),
metrics=["acc"])
#モデルの学習
model.fit(X,y,batch_size=10,epochs=50)
#モデルの保存
model.save("./nogi_cnn.h5")
return model
def model_eval(model,X,y):
scores=model.evaluate(X,y,verbose=1)
print("Test acc",scores[1])
if __name__=="__main__":
main()
今回のテスト用の結果は91%になりました。
おわりに
今回はKerasとopencvを使いました。より精度を上げるために画像の水増しや学習させる画像の増加を検討しています。さらなる上達のために、転移学習にも挑戦したいと考えています。
検証用データでは正解率が9割ですが、個人的に試した感じでは7割くらいな感じがしました。
質問や間違いがありましたらコメントまたは編集リクエストをしてもらえると幸いです。
全体のコードはこちらに載せておきます。
参考
pythonライブラリicrawlerを使い簡単に画像データを集める
Opencvで顔を検出してみた
機械学習で乃木坂46を顔分類してみた
FlaskとOpenCVで投稿された画像をOpenCV加工してで返す