はじめに
昨今の画像生成AIといえばStable Diffusion
のような拡散モデルが主流となっており、写真と見分けがつかないほど高精度な画像を汎用的に生成できることから、さまざまな場面で活用されています。
しかし、画像生成AIは拡散モデルだけでなく、GAN(敵対的生成ネットワーク)も依然として広く利用されています。中でも StyleGAN
は、「写真が証拠となる時代は終わった」と言われるほど、人間では識別できないリアルな画像を生成できることで大きな注目を集めました。そこで、今さらではありますが、この StyleGAN
を実際に使ってみようと思います。
StyleGAN
StyleGAN
は、2018年にNVIDIAによって開発された画像生成モデルで、高解像度かつリアルな画像を生成できることで注目を集めました。特に「顔画像」の生成で非常に有名です。通常のGANとは異なる構造を持ち、生成画像のスタイル(例:顔の表情・髪型・照明など)をコントロール可能にしたのが大きな特徴です。
やってみたこと
今回はStyleGAN
を用いて、絵画の画像を学習させ、新たな絵画風画像の生成を行ってみます。一般にGANの欠点としてよく挙げられるのが、学習の難しさです。特に自前のデータセットを使うと、学習がうまくいかず、歪な画像が生成されてしまいます。しかし今回は、あえてその特徴を活かしてみることにしました。というのも、絵画において歪な表現は「抽象画」として受け取られる可能性があり、偶然にも魅力的な作品が生成されるかもしれないからです。
使用するデータ
メトロポリタン美術館の公式ウェブサイトでは、多くの作品画像が無料で公開されています。これらの画像は機械学習用途にも利用可能です。ただし、すべての画像が著作権フリーというわけではなく、使用の際にはライセンスや権利に注意する必要があります。
結果
学習はそれっぽい画像が生成されるまでに2週間ほどかかりました。以下は、絵画のデータセットを学習させたStyleGAN
によって生成された画像です。生成された画像は、大きく分けて肖像画、風景画、抽象画のようなものの3つのタイプに分類されました。
- 肖像画




- 風景画




- 抽象画?




おわりに
今回はStyleGAN
を実際に使用してみました。想像していたよりもうまく学習ができたと思います。学習時間の都合上、生成画像のサイズは 256×256
に制限しましたが、やはり解像度の低さが少し残念でした。StyleGAN
は、潜在空間上でさまざまな要素をうまく結びつけながら学習を進めるのが特徴とのことで、今後はこの特性を活かして、もっと面白い生成の仕方にも挑戦してみたいと思います。