【文系合格者が図解】G検定「GAN（敵対的生成ネットワーク）」完全攻略｜仕組みから派生モデルまで一気に整理

Posted at 2026-05-24

title: 【文系合格者が図解】G検定「GAN（敵対的生成ネットワーク）」完全攻略｜仕組みから派生モデルまで一気に整理
tags: G検定 AI ディープラーニング JDLA 資格

はじめに

G検定の勉強をしていると、GAN（Generative Adversarial Network：敵対的生成ネットワーク） という用語に必ず出会います。「敵対的」という物騒な名前に加えて、派生モデルが大量に出てくるので、文系の私は最初かなり混乱しました。

この記事では、2026年1月にG検定に合格した文系出身の筆者が、GANの仕組みから試験に出る派生モデルまでをたとえ話を交えてスッキリ整理します。

※ この記事はJDLA公式のものではありません。個人の学習経験に基づく内容です。

GANの基本的な仕組み

GANは2014年にIan Goodfellow氏が提案した生成モデルで、2つのネットワークを競わせることでリアルなデータを生成します。

登場人物は2人

役割	ネットワーク名	やること
偽札職人	Generator（生成器）	ランダムなノイズから偽のデータ（画像など）を作る
鑑定士	Discriminator（識別器）	入力されたデータが本物か偽物かを見分ける

私はこれを「偽札職人 vs 鑑定士」のたとえで覚えました。

偽札職人（Generator）は、鑑定士を騙せるような精巧な偽札を作ろうとする
鑑定士（Discriminator）は、本物と偽物を正確に見分けようとする

この2人が切磋琢磨することで、最終的にGeneratorは本物と見分けがつかないデータを生成できるようになります。

学習の流れ

Generatorがランダムノイズから偽データを生成する
Discriminatorが本物データと偽データを受け取り、真偽を判定する
Discriminatorの判定結果をもとに、両方のネットワークが同時に学習する
繰り返すうちに、Generatorの生成精度が向上する

最終的な理想状態は、Discriminatorが本物と偽物を区別できなくなる（正答率50%）状態です。

G検定で問われるGANのポイント

試験では以下のような知識が問われます。

必須の基礎知識

GANは教師なし学習に分類される
提案者はIan Goodfellow（2014年）
GeneratorとDiscriminatorのミニマックスゲームとして定式化される
学習が不安定になりやすい（モード崩壊が代表的な問題）

モード崩壊（Mode Collapse）とは

Generatorが特定のパターンしか生成しなくなる現象です。たとえば手書き数字を生成するGANで、「3」ばかり生成してしまうような状態。Discriminatorを騙せる「楽な答え」に逃げてしまうイメージです。

試験に出る！GANの派生モデル一覧

G検定では派生モデルの名前と特徴を問う問題が出ます。以下の表で一気に整理しましょう。

モデル名	特徴	キーワード
DCGAN	CNNをGANに導入し、高品質な画像生成を実現	畳み込み、安定した学習
CGAN（Conditional GAN）	条件（ラベル）を指定して生成を制御	条件付き生成
Pix2Pix	ペア画像を使い画像変換を学習	画像→画像変換
CycleGAN	ペアなしで画像のスタイル変換が可能	馬→シマウマ、unpaired
StyleGAN	スタイル情報を段階的に注入し超高精細画像を生成	顔画像生成、NVIDIA
Progressive GAN	低解像度から段階的に解像度を上げて学習	段階的学習
WGAN	Wasserstein距離を使い学習を安定化	学習安定化

覚え方のコツ

私は以下のように名前から機能を連想して覚えました。

DCGAN → Deep Convolutional → 「深い畳み込み」でCNNを使う
CGAN → Conditional → 「条件付き」で指定した画像を生成
Pix2Pix → Pixel to Pixel → ピクセル単位で画像を変換（ペア必要）
CycleGAN → 行って戻る「サイクル」→ ペアなしで相互変換
StyleGAN → 「スタイル」を操作 → 髪型だけ変えるなどの部分制御

文系の私がGANを理解するためにやったこと

正直に言うと、数式を追うのは諦めました。代わりに以下のアプローチが効果的でした。

たとえ話で仕組みを理解する：偽札職人と鑑定士の比喩が一番しっくりきました
派生モデルは「何ができるか」で覚える：数式ではなく、入力と出力の変化に注目
実際の生成結果の画像を見る：YouTubeでStyleGANの顔画像生成を見て「すごい」と実感すると記憶に残る
表にまとめて比較する：上の表のように一覧にすると、違いが明確になる

試験直前の確認リスト

GANの提案者と年（Goodfellow, 2014）を言えるか
GeneratorとDiscriminatorの役割を説明できるか
モード崩壊が何か説明できるか
DCGAN、CGAN、Pix2Pix、CycleGAN、StyleGANの違いを言えるか
GANが教師なし学習であることを覚えているか

まとめ

GANは「2つのネットワークを競わせて学習する」というシンプルな発想がベースです。文系の方は数式を無理に追わず、「何ができるモデルか」「他のモデルとどう違うか」に集中すると効率よく得点できます。

派生モデルは名前が似ていて混乱しがちですが、名前の由来 → 機能 → 代表的な応用の順で覚えると整理しやすいです。