More than 5 years have passed since last update.

ねこ顔学習のpix2pix(encoder-decoder版)の出力はみんな猫顔になりました！

Last updated at 2018-02-23Posted at 2018-02-22

前の記事の通り、「女性顔学習のpix2pix(encoder-decoder版)の出力はみんな女性顔になりました！」の続きです。

今度は猫顔抽出して、猫顔を学習させてそれをいろいろな対象のTest出力画像を見てみました。

当たり前かもですが、みんな猫顔になりました。

そして、pix2pix(u-net版)が過学習であるという有力が証拠が見つかりました。
これは、猫顔以上にウワンにとっては重要なことかもしれません。
そして、これまでの中心テーマであった、「pix2pixは１データで学習できる」ことも併せて検証できました。

まあ、以下これら二つのエビデンスにたどり着くまでの経緯を記載していきます。

まずは猫顔の収集

これが今回一番むつかしそうな事項です。
しかし、実は人の顔と同じアプリで猫や犬の顔を抽出できました。
もちろん、人ほどヒット率というか収集率は上がりませんでしたが、１０個集めればOKなので、犬猫併せて１０個集めることができました。

早速、猫顔、犬顔の学習

１０カテゴリに１個ずつ、猫か犬の顔データを当てました。

そして、学習はpix2pix(encoder-decoder版)で実施

ここで、今回は学習させることが主眼なので、TrainデータもTestデータも同じセットを使いました。ただし、TrainはGray画像、Testは輪郭画像としました。

学習１　Gray画像の学習

train
gray

test
輪郭画像

学習２　輪郭画像の学習

train
輪郭画像

test
gray

学習３　学習のスウィッチ

学習2の後の結果パラメータを使って、gray画像を学習することにしました。これは、テンソルのパラメータは汎用的に学習されていれば、さらに学習しても今までの記憶を失わないだろうという仮説に基づいて実施することにしました。
その結果は以下の通りになりました。
train
gray

test
輪郭画像

仮説が成り立っているようです。両方とも最初の100epochから美しい画像を出力しました。
上の画像はねんのため少し回して500epoch時のものです。
１個データなので、500epochといっても６分くらいしかかっていません。
そして以下ウワンにとっては重要な発見をすることになりました！

pix2pix(u-net版)で学習実施

学習１　輪郭画像の学習

train
輪郭画像

600epochですが、美しい
test
gray

やはり、いまひとつ美しくない

学習２　学習のスウィッチ　gray画像の学習

train
gray
100epoch

test
輪郭画像
０epoch

100epoch

そうです！輪郭画像のTestは、最初は覚えていたのですが、たかだか１００epoch１分もたたずに消えてしまいました。
これは、もともと最初にgray画像を学習したときの輪郭画像のTest結果と同一になってしまいました。