More than 3 years have passed since last update.

敵対的生成ネットワーク（GAN）についての概要

Last updated at 2022-04-24Posted at 2022-04-23

GANとは

GAN(Generative Adversarial Networks)は敵対的生成ネットワークとよばれます。
生成器と識別器と呼ばれる二つの人工知能を互いに競わせるようにすることで、画像や小説、音楽などのデータ分布を模倣するディープラーニングモデルです。

二つの人工知能の役割としては以下のようになります。

生成器：データ分布を生成する
識別器：本物か生成器が生成した偽物かを識別する

生成器は偽札を作成する偽造者で、識別器は偽札かどうかを識別する警察
などのような、たとえ方をされることが多いです。

生成器は識別器をだませるような偽物を生成するように学習し、識別器は偽物かどうかを正確に予測するように学習します。
このように、互いに競いながら学習させることから敵対的生成ネットワークと呼ばれています。

生成と識別器のうちGANとして必要なのは生成器のほうです。
生成器を用いて、この世に存在しない画像や小説、音楽などを生成します。

構成

GANの全体的な構成は以下の通りです。

識別器

識別器の役割は偽物か本物かを正確に判別することです。
学習では本物かどうかを正確に見分けられた確率をもとに学習していきます。
入力：本物か偽物のどちらか
出力：本物かどうかの確率（0に近いほど偽物確率が高く、1に近いほど本物の確率が高い）

生成器

生成器の役割は識別器をだませる偽物を生成することです。
学習では以下のように生成した偽物を識別器が本物と判断した確率をもとに学習していきます。
入力：潜在変数
出力：偽物データ

潜在変数

潜在変数とは生成器が画像を生成するための種になる変数のことです。
一般的に100次元の変数で正規分布から抽出します。

損失関数

GANの損失関数は以下の式になります。

一見難しく感じますが、生成器、識別器が何を目的としているかについて着目するとそこまで難しくはありません。

本物データ（$p_{data}$）に対して識別器（D(X)）をかけた値に対して対数をとります。(logD(x))
識別器が

本物（１）と判断すると値が最大になります。
偽物（０）と判断すると値が最小になります。

偽物データ（$p_{data}$）に対して、1から識別器（D(X)）をかけた値を引いた値に対して対数をとります(log(1-D(G(z)))
識別器が

本物（１）と判断すると1-1=0で値が最小になります。
偽物（０）と判断すると1-0=1で値が最大になります。

対数について

対数のグラフは以下のようになります。
Dの出力は本物かどうかを0~1で表現します。

識別器

識別器の役割は偽データか本物データかを見分けうことが役割としてあります。
目的としてはできる限り高い精度で本物かどうかを見分けることとなります
そのため、損失関数の値が最大になるように学習します。

生成器

生成器の役割は識別器をだませるような本物データに近い偽物データを生成することが役割としてあります。
目的としてはより本物に近いデータを生成し、識別器の騙し精度が低くなるようにすることとなります
そのため、損失関数の値が最小になるように学習します。
また、生成器はより本物に近いデータを生成し識別器の騙すことが目的のため、学習時には本物データを使用する必要はありません。
そのため、右辺第一項は損失値を計算するときには使用しません。