More than 1 year has passed since last update.

Stable DiffusionをGoogle Colaboratory上で動かして神絵ガチャを回してみる

Last updated at 2023-02-05Posted at 2022-08-23

はじめに

最近神絵生成AIが話題ですね。
絵描きの端くれとしてこの波に乗り遅れるわけにはいかない！ということで、つい最近公開された Stable Diffusion を Google Colaboratory （以下Google Colab）上で実行して遊べるようにしてみました。
こちらに記載されている diffusers library を使用してサクッと動かすのがゴールです。

以下環境構築をしてコードを動かすまでのまとめです。
作成したGoogle Colabのノートブックは GitHub で公開しているため、過程とかどうでもいいから使ってみたい方はこちらからどうぞ。

Stable Diffusionについて

オープンソースの画像生成AIです。
私は機械学習の専門家ではないので技術的なことは詳しくないですが、テキストから画像を生成するtext-to-imageのモデルだそうです。

処理に若干時間がかかりますが、こちらのデモサイトでとりあえず使用感を試せます。
添付の画像は「concept art, realistic, soft lighting, pale color, landscape of cumulonimbus background, summer, sunset, twilight, coast, starry sky」というテキストから生成されたものです。

画像生成の処理を専用のサーバで行うことができる DreamStudio Beta というサービスも存在します。
こちらはアカウント登録が必要ですが、アカウント登録をすると2ポンド分のクレジットがもらえ、クレジットを使い切るまでは爆速での画像生成を体験できます。

・・・ということで、お試しで数回触ってみるだけであれば上記のサイトで十分です。
ただせっかくオープンソースで公開されていますし、実際に触ると分かりますが同じテキストでもランダムにいろいろ生成されるので神絵が出るまでガチャを繰り返したいという場合は自分で実行環境を用意するのがよさそうです。

Google Colaboratoryについて

ブラウザ上でPythonのコードを実行できるサービスです。
もう少し詳しく言うと、Googleが提供しているJupyter Notebookのマネージドサービス的なものです。
こんな感じにコードを実行したり結果を表示したりできます。

ブラウザ上でコードを実行できるサービスは他にもいろいろありますが、Google ColabではGPUが使えます、しかも無料で！
ということで機械学習の実行環境として重宝されています。

ただ無料で機能制限なく使い放題というわけではなくこちらにあるように制限も存在します。
有名なのが12時間ルールというもので、12時間経つと実行環境が初期化されてしまいます。
もちろん作成したコード、正確には「ノートブック」というドキュメントはちゃんと保存されており、ノートブック内のコードを再実行することで実行環境を再構築できます。

・・・ということで、今回はGoogle Colab上にStable Diffusionの実行環境を構築して、無料で爆速画像生成＆神絵ガチャを回してみたいと思います！

Stable Diffusionを使うための事前準備

Google Colab上に実行環境を構築する前にStable Diffusionを使うための準備を行います。

Hugging Faceのアカウント作成

まずはStable Diffusionのモデルを使用するために Hugging Face へのユーザ登録を済ませます。
ページ右上の「Sign Up」から画面の指示に従ってポチポチしていってください。

Stable Diffusionのモデルの使用に関する規約への同意

モデルを使用するにあたり、規約（CreativeML OpenRAIL-Mライセンス、およびメールアドレスとユーザー名がモデルの作成者と共有されること）に同意する必要があります。
こちらにアクセスし同意できる方は「Access repository」をクリックしてください。

Hugging Faceのアクセストークンの発行

diffusers libraryを実行する際に使用するアクセストークンを発行します。
こちらにアクセスし「New Token」より自分のアクセストークンを発行し、控えておいてください。

トークンの名前は自分で分かるものであれば何でも構いません。
権限は「read」で十分でした。

Google Colabの実行環境構築

Stable Diffusionを使うための準備が終わったのでGoogle Colab上に実行環境を構築していきます。

ノートブックの作成

Googleアカウントでログインした状態でこちらにアクセスし「ノートブックを新規作成」をクリックします。
作成したノートブックはGoogleドライブに自動で保存されます。

以下作成したノートブックにいろいろな処理を記載していきます。

GPUの使用

実行環境でGPUを使用するために「編集」→「ノートブックの設定」からGPUを割り当てます。

割り当てが問題なく行えているかどうかは以下のコードで確認できます。

!nvidia-smi -L

依存関係のインストール

以下のコードを実行し、必要なライブラリをインストールします。

!pip install --upgrade diffusers==0.12.1 transformers==4.26.0 accelerate==0.16.0 scipy==1.* ftfy==6.*

セットアップ

Stable Diffusionのモデルのダウンロードやパイプラインの構築を行います。
予め発行したHugging Faceのアクセストークンを access_token に設定し、以下のコードを実行します。

import torch
from diffusers import StableDiffusionPipeline

#@title Settings
access_token = "your-access-token"  #@param {type:"string"}

# パイプラインを構築する。
pipe = StableDiffusionPipeline.from_pretrained(
  "CompVis/stable-diffusion-v1-4",
  torch_dtype=torch.float16,
  use_auth_token=access_token
).to("cuda")

画像生成

画像を生成します。
生成したい画像の内容を prompt に記述し、以下のコードを実行します。

from IPython.display import display_png, Image
from torch import autocast

#@title Parameters
prompt = "a description of the image"  #@param {type:"string"}

# 画像を生成する。
with autocast("cuda"):
  image = pipe(prompt).images[0]

# 画像を保存する。
file_name = "image.png"
image.save(file_name)

# 画像を表示する。
display_png(Image(file_name))

神絵ガチャを回す

自分で環境構築を行うとこういうことが自由に行えるのがいいですよね。
大量の画像を生成し、生成した画像をGoogleドライブに保存してみます。
なお、ガチャを回しすぎるとGoogle Colabのリソース制限に引っかかってしばらくGPUが利用できなくなるのでほどほどに（ドキュメントによると状況によって変動する動的な使用制限を設けているとのことで、どのくらい使ったら制限に引っかかるのかはよく分かりません・・・）。

まずはGoogleドライブをマウントするために以下のコードを実行します。

from google.colab import drive
drive.mount("/content/drive")

画像を生成します。
パラメータを設定して以下のコードを実行します。

prompt ：生成したい画像の内容。
number_of_images ：生成する画像数。
drive_directory ：保存先ドライブのディレクトリ。

import datetime
import os
from torch import autocast

#@title Parameters
prompt = "a description of the image"  #@param {type:"string"}
number_of_images = 10  #@param {type:"slider", min:1, max:100, step:1}
drive_directory = "/content/drive/MyDrive/output"  #@param {type:"string"}

# 画像の保存先となるディレクトリがなければ作成する。
os.makedirs(drive_directory, exist_ok=True)

# 画像のファイル名が被らないようにするための文字列を用意する。
yyyymmddhhmmss = datetime.datetime.now().strftime("%Y%m%d%H%M%S")

# 指定した回数、画像生成＆保存を繰り返す。
for i in range(number_of_images):
  with autocast("cuda"):
    image = pipe(prompt).images[0]

  file_path = os.path.join(drive_directory, f"image-{yyyymmddhhmmss}-{i:03}.png")
  image.save(file_path)

神絵ガチャ無料10連の結果です。
こんな感じに画像がマイドライブの output 配下に保存されます。

今回はGoogleドライブに保存しましたが、他にもローカルにDLすることも可能です。
詳しくはこちらを参照ください。

まとめ

生成した画像の中からいい感じのものを選んでベースとして使えば、背景とか描くのだいぶ楽になりそうな予感。
今後はこういったツールもうまく使いこなしながら創作活動していきたいですね。

あとこちらのブログによると画像生成時に他にもパラメータを設定できるようなので、気が向いたらまたいろいろ触ってみようと思います。

主な更新履歴

2023/02/05

2023/02/05現在 StableDiffusionPipeline.from_pretrained の実行時に TypeError: getattr(): attribute name must be string となってしまう件を修正しました。

diffusersライブラリを0.2.4から0.12.1を使用するように変更しました。
ライブラリのバージョンアップに伴い、使い方が変わった部分があるので一部コードを修正しました。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up