必要なもの
・Colab proアカウント
・Colab(pro)-Dreambooth
https://github.com/TheLastBen/fast-stable-diffusion
・512x512,768x768の画像
手順
ドライブにコピーする。
T4を使っている状態なのでA100に変更する。
ランタイムのタイプ変更をします。
自身のドライブにアクセスできるようにする。
依存関係の話なのでそのままクリック
学習モデルの設定をします。基本SD1.5でいいですが、希望があれば2.1を指定します。
Path_to_HuggingFaceのトークンが必要になるのは指定したいモデルがあるときだけです。空欄にしておいてください。
Session_Nameはモデルの名前になります
このままクリック。
下にファイル選択が出てくるのでファイルを複数枚選択して開く。
※注意点。画像の命名がプロンプトになります。今回はJapaneseGirlとしています。JapaneseGirl(1)、JapaneseGirl(2)となるようにしましょう。画像サイズは512x512に加工する。
背景、ポーズ、表情、などすべてがばらばらになるようなものを用意しましょう。
これはクリックしなくてよいです。
コードを表示し、UNet_Learning_Rateの部分を書き換える必要があります。
UNet_Learning_Rate = 2e-6 #@param ["2e-5","1e-5","9e-6","8e-6","7e-6","6e-6","5e-6", "4e-6", "3e-6", "2e-6"] {type:"raw"}
となっているのを、
UNet_Learning_Rate = 2e-6 #@param ["1e-6","1e-5","9e-6","8e-6","7e-6","6e-6","5e-6", "4e-6", "3e-6", "2e-6"] {type:"raw"}
untlr=UNet_Learning_Rate
に書き換えてください
1x10の-6乗
わざわざ小さい学習量を作る理由はstep数を多くして、学習量を小さくすることで高ビットレートで学習できるような状態を作りたいためです。
以上の形に変更し、実行するとトレーニングが開始されます。
学習が終わったらJapaneseGirlColの直下にckptファイルができています。(画像ではまだ学習中なのでできてません)