More than 5 years have passed since last update.

Deep LearningのGANで打線組んでみた【画像生成】

Last updated at 2020-01-28Posted at 2019-02-07

はじめに

Deep Learningの基礎を学習した人であればGAN（敵対的生成ネットワーク）をご存知でしょうか。Goodfellow氏によるGenerative Adversarial Nets(GAN)発表以来、特に画像生成の領域ではトレンドが続いています。

さて、毎月百以上の新しいGANが発表される昨今。2018年も終わった節目にこれまでに世界各国で生み出されてきたGANで打線を組んでみました。

打線発表

1(一) cGAN
2(遊) ACGAN
3(二) InfoGAN
4(中) DCGAN
5(右) starGAN
6(三) WGAN
7(左) LSGAN
8(捕) SAGAN
9(投) cycleGAN

それでは簡単に解説していきます。（各図は論文から引用しています。）

解説

１．cGAN( Conditional GAN )

条件付きのGAN。入力する画像と共にラベル情報を追加することで、狙った条件の画像を生成できる。画像を条件として与えたpix2pixもcGANの一種である。

参考：ペアで2つのドメインの画像変換を学習させるpix2pix

２．ACGAN

Generatorに入力画像のclass情報を同時に与え、Discriminatorは、生成画像の真偽だけでなくclassの判別も行う。Imagenetの画像を対象に、通常のDCGANより高精度な画像生成を実現した。

参考：Imagenetで学習した対象クラスの画像の生成

３．InfoGAN

教師なし学習で、生成画像の中で利用価値の高い特徴を勝手に学習する。cGANのようにラベル付けをしたデータの準備は不要である。潜在変数と画像分布の相互情報量を評価関数に導入し、生成画像分布に大きな影響を与える潜在変数の獲得を目指す。

参考：教師なし学習だが潜在変数を変化させることで回転角や幅を連続的に変化させられる。

４．DCGAN

入力ノイズとして与えたベクトルzを元にDeepCNNを介して画像を生成する。Generatorが生成した画像の真偽の判別をDiscriminatorが行い、画像生成をターゲットとしたあらゆるGANのベースとなっている。

[参考]DCGANによってゼロから生成されたベッドルーム画像

５．StarGAN

複数のドメイン変換を単一のGeneratorとDiscriminatorで学習することができる。CycleGANとACGANを組み合わせた考え方で、G(x,c)→yを複数のドメインラベルのcでできるように学習する。ACGANで用いられるDomain Classification LossとCycleGANのReconstruction Lossを損失関数として導入する。