Python×Keras×GANチュートリアル　人工知能でファッション生成（2）

Last updated at 2018-10-07Posted at 2018-10-07

コードの解説

（２）もお読み頂きありがとうございます。
　それでは、さっそく、コードの解説に移らせていただきたいと思います。まずはganの仕組みをしっかり理解する必要があります。原論文をきちんと読んだ上で、実装に即した形で説明したいと思います。

GANの実装の仕組み

基本の構成要素

　GANは、２つのニューラルネットワークでできています。
　generaterとdescriminaterです。面倒なので、ｇ，ｄと呼びます。ｇは、ニセの画像を作り出すニューラルネットワークです。ｄは、ｇが作ったニセの画像と、本物の画像を識別するニューラルネットワークです。
　なので、ｇが偽造者、ｄが判別者などと呼ばれたりもします。
ｇとｄをトレーニングしていくと、最終的には、本物っぽい画像を生み出すｇが得られることになります。このｇを使えば、以後、本物っぽい画像をいくらでも生成できることになります。

gとｄの実装理念

　ｇは、ノイズの入力に対してニセ画像を出力するニューラルネットワークです。
　ノイズは、サイズが(ｎ×１)で、各要素が標準正規分布から発生させた乱数になっているnumpyndarrayです。
　ニセ画像は、サイズが（row×columun×３）で、各要素は−１から１の範囲に収まるnumpyndarrayです。
　　ｇ（ノイズ）＝ニセ画像
ですね。
　ｄは、画像の入力に対して本物かどうかを出力するニューラルネットワークです。
　画像は、ニセ画像または真の画像です。真の画像は、サイズがニセ画像と同じで、実際の写真等をndarrayに変換したものです。ただし、各要素は２５５で割り算して−１されているので、範囲は−１から１になります。出力は、０から１のスカラーで、ニセ画像に対しては０，真の画像に対しては１を出力するようにトレーニングされます。
　ｄ（画像）＝０〜１ですね

学習のやり方

　ここが、元の論文以外でなかなか説明されていない部分です。
　学習は２ステップの組み合わせになります。
　１ステップ目は、gのパラメタを固定してdのパラメタだけを鍛えます。つまり、真の画像の入力には１を、ニセ画像＝ｇ（ノイズ）の入力には１を返すように、dだけをトレーニングします。
　２ステップ目は、ｄのパラメタを固定してｇのパラメタだけを鍛えます。この際、ｇとｄを組み合わせたモデルを作って、トレーニングします。組み合わせたモデルは、
ｄ（ｇ（noise））
ですね。その出力が１になるようにgのパラメタだけを鍛えます。
　各エポックごとに、このステップ１と２を繰り返していくのです。これがポイントです。敵対的生成モデルとは言うものの、gとｄを同時に鍛えるのではなく、交互に鍛えるんですね。ですから、実装がカンタンに済むのです。

　説明が長くなってしまったので、コードの解説は次回行いたいと思います。お読み頂き、ありがとうございました。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Python×Keras×GANチュートリアル 人工知能でファッション生成（2）