LoginSignup

This article is a Private article. Only a writer and users who know the URL can access it.
Please change open range to public in publish setting if you want to share this article with other users.

Stable Diffusion Forgeをより使いやすくするための準備(限定公開)

Last updated at Posted at 2024-03-12

はじめに

以降の記事を実施する際、必要に応じてcivitaiのサイトへアクセスする必要があります。

事前にアカウントを登録しておかないと、対処できない内容が含まれるかもしれませんので、ご注意ください。

Tagcomplete

  • これをインストールすれば、プロンプトを入力する際に、予測変換ができるようになり、スムーズにプロンプトを入力することができるようになる。

サンプル
https://github.com/DominikDoom/a1111-sd-webui-tagcomplete.git
  • ExtensionsのULR入力欄に、URLを入力してインストールする
    image.png

  • インストール項目一覧に、拡張機能が追加されていることを確認し、適応するために再起動する
    image.png
    image.png

  • プロンプト上で文字を入力して、タグの一覧が表示されれば、OK
    image.png

Tagger

  • これをインストールすれば、画像を挿入することで、その画像のタグ(プロンプト)を抽出することができる。
  • 画像生成する際、必要なプロンプトを画像から入手したり、画像の高解像度化で使用することができる。

サンプル
https://github.com/toriato/stable-diffusion-webui-wd14-tagger.git
  • ExtensionsのULR入力欄に、URLを入力してインストールする
    image.png

  • インストール項目一覧に、拡張機能が追加されていることを確認し、適応するために再起動する
    image.png
    image.png

  • 再起動して、Taggerタブが表示されているはず...表示されていなかった...
    image.png

  • 以下の記事に対処法が載っていました。(2か所コードを修正する必要があるみたい)

  • コード修正後に、ローカルサーバーを立ち上げなおすと、Taggerのタブが増えているはず。
    image.png

  • 画像を挿入すると、その画像に関連するタグを取得できるようになる。
    image.png

embedding

  • 高品質な画像を作るためのツール
  • ネガティブプロンプト(プロンプト?)に設定することで、指などの奇形を抑えることができるようになるらしい(抑えられているかどうか実感はあまり沸かない)

easynegative

  • LFSファイルをダウンロード
    image.png

bad-hands-5

  • LFSファイルをダウンロード
    image.png

bad_promptとbad_pronmt_version2

  • LFSファイルをダウンロード(bad_promptとbad_pronmt_version2の2つ)
    image.png

bad-artist-animeとbad-artist

  • LFSファイルをダウンロード(bad_artist-animeとbad_bad-artistの2つ)
    image.png

bad-picture-chill

  • LFSファイルをダウンロード(bad-picture-chill-75vの1つ)
    image.png

badquality

  • LFSファイルをダウンロード
    image.png

Deep-Negative

  • Deepnegativeのファイルをダウンロード
    image.png

embeddingsフォルダにダウンロードしたファイルを移動

image.png

ローカルサーバーを再起動すると、UIにembeddingが適応される

  • これらをネガティブプロンプトへ反映することで、指の奇形などに対処することができるらしい(あまり実感はわかないが...)
    image.png
    ※調べれば他にも便利なembeddingがあると思う

Clip skip(プロンプトをどれだけ綺麗に反映するか)

  • settingsタブのユーザーインターフェー→Quicksettings listでCLIP_stop_at_last_layersを選択
  • Apply setting → Reload UI で反映完了
    image.png

Eta noise seed delta(ノイズを制御する設定、画像にどれだけのバリエーションを含ませるか)

  • サンプルパラメータ Eta noise seed deltaを「31337」に設定する
  • Apply setting → Reload UI で反映完了
    image.png

Controllnet

  • これはstable diffusion forgeでは、デフォルトでついている機能であり、被写体のポーズを決めたり、画像を高画質化したりすることができる
  • ただし使用する際には、サイトから必要なファイルをダウンロードしないと、使うことができない

Tile

  • 生成した画像や解像度の低い画像をアップスケールすることができるようになる

  • Cntrolnet 1.1 Modelsへアクセスし、Tileをダウンロードする
    image.png
  • ダウンロードしたファイルを、models>ControlNetフォルダに配置する
    image.png
  • txt2imgタブまたはimg2imgタブのControlNetを有効化し、先ほどダウンロードしたファイルを選択できることを確認する。もしなければ更新ボタンで更新してみる。
    image.png
  • 高画質化したい画像をControlNetへ挿入し、実行する(プロンプトはあってもなくてもよい)
    image.png
  • 生成した結果、よりリアルな画像に仕上がる(左から512×512、1024×1024、2048×2048)
    image.png

OpenPose

  • 生成した画像の被写体にポーズを設定することができるようになる

  • Cntrolnet 1.1 Modelsへアクセスし、Tileをダウンロードする
    image.png
  • ダウンロードしたファイルを、models>ControlNetフォルダに配置する
    image.png
  • txt2imgタブまたはimg2imgタブのControlNetを有効化し、先ほどダウンロードしたファイルを選択できることを確認する。もしなければ更新ボタンで更新してみる。
    image.png
  • txt2imgタブで、必要なプロンプトを入力し、ポーズを指定する
  • 指定するポーズは画像として挿入し、赤色マーク?を押して、解析を実行すると、ポーズを読み取れる
  • Editボタンで修正することも可能
  • 自分は人を生成する場合、dw_openpose_fullにして対応している(これがポーズを読み取ってもらいやすいと思っているから)
    image.png
    image.png
  • 生成した結果、指定したポーズで画像を生成することができる
    00046-2878021291.png

CheckPoint

  • 画風を設定するためのファイル(という理解でいいと思う)

civitaiからCheckpointをダウンロードする

↓はこの記事でサンプルとしてダウンロードするCheckpoint

  • ダウンロードする際はクレジット表記を十分に確認して使用しなければならない
    image.png

ダウンロードしたファイルを移動

  • 場所は models>Stable-diffusionのフォルダに配置する
    image.png

checkpointを更新し、checkpointを設定する

image.png

画像生成すると、checkpointに応じた画風の画像が生成できる

  • 今回の場合、アニメ風の犬が生成されたことで適応が完了
    image.png

checkpointの管理場所

  • Checkpointsというタブで確認ができる
    image.png

LoRA

  • キャラクター、装飾品、ポーズなどを追加で適応するためのファイル(追加学習ファイルという認識でよいと思う)

civitaiからLoRAをダウンロードする

↓はこの記事でサンプルとしてダウンロードするLoRA

  • ダウンロードする際はクレジット表記を十分に確認して使用しなければならない
    image.png

ダウンロードしたファイルを移動

  • 場所は models>Loraのフォルダに配置する
    image.png

LoRAを設定

  • Loraタブを更新すると、LoRAファイルがあるので、それをクリックすると、プロンプトにLoRAが設定される
    image.png

トリガーワードを入力し、画像生成すると、LoRAが適応される

  • この場合、白いかわいいワンちゃんが生成されれば、適応成功となる
    image.png

  • トリガーワードはこの場合、civitaiに記載されている
    image.png

Loraを見やすくする方法

LoRAフォルダに生成した画像などを、同じファイル名で保存すると、見やすくなる
image.png
image.png

0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up