More than 5 years have passed since last update.

pix2pixの出現で「DLで大量データが必要」は伝説になった～検証編～

Last updated at 2018-02-19Posted at 2018-02-18

前回、ちょっと言いすぎかな。。でも検証してみても、やはり１データで学習してしまう。。。

いやいや、言い方がちょっと違うかもしれません。
汎用性は全くない。。Trainデータをしっかり覚えてくれます。
つまり、普通の意味で言うと、完全に過学習！

いくつか改変したコードを以下に置きました
MuAuan/pix2pix

pix2pixの原理

pix2pixは、普通のGANと異なり、二つの画像の関連性の真偽から学習して、習得した関連に関しては再現よく表現するというものです。したがって、利用は２つの画像ペア（画像に表せれば何でもOKだし、二つである必要も無いらしい）間の変換や途中の補完などに利用するものであるようです。

pix2pixは原理として以下の工夫をしています。
（１）pix2pixは、cGANである
条件付きという意味は、今回はもともとの画像と加工先の画像等が必要で、どっちがどっちでもいいですが、この二つの画像ペアの一致度をDiscriminatorが判断しつつ学習します。
（２）Generatorにu-netを使っている
u-netは、encoder-decoderにおいて、対象的な構造としており、対応する（相似な）中間層のパラメーターをencoderから直接decoderに渡す構造を採用しています。
※一応、普通のencoder-decoderでもよさそうですが、論文中ではよい結果は得られていないようです
（３）patchGANを利用して、L1相関を強化
論文見るとL1相関強くして、全体的な変化を均一化してDiscriminatorを欺く戦略とのこと。確かに効果が表れている根拠図が示されています。

因みに、Generatorは、例えばGray画像や輪郭画像のみで目的の図を出力しています。