This article is a Private article. Only a writer and users who know the URL can access it.
Please change open range to public in publish setting if you want to share this article with other users.

More than 1 year has passed since last update.

Stable Diffusion Forgeをより使いやすくするための準備（限定公開）

StableDiffusion

Last updated at 2024-08-11Posted at 2024-03-12

Stable Diffusion Forgeはすでに更新を停止しているとのことです。この記事を読んで、実装したとしても、拡張機能が破損するなどの不具合が生じる恐れがあります。

はじめに

以降の記事を実施する際、必要に応じてcivitaiのサイトへアクセスする必要があります。

事前にアカウントを登録しておかないと、対処できない内容が含まれるかもしれませんので、ご注意ください。

Tagcomplete

これをインストールすれば、プロンプトを入力する際に、予測変換ができるようになり、スムーズにプロンプトを入力することができるようになる。

サンプル

https://github.com/DominikDoom/a1111-sd-webui-tagcomplete.git

ExtensionsのULR入力欄に、URLを入力してインストールする
インストール項目一覧に、拡張機能が追加されていることを確認し、適応するために再起動する
プロンプト上で文字を入力して、タグの一覧が表示されれば、OK

Tagger

これをインストールすれば、画像を挿入することで、その画像のタグ（プロンプト）を抽出することができる。
画像生成する際、必要なプロンプトを画像から入手したり、画像の高解像度化で使用することができる。

サンプル

https://github.com/toriato/stable-diffusion-webui-wd14-tagger.git

ExtensionsのULR入力欄に、URLを入力してインストールする
インストール項目一覧に、拡張機能が追加されていることを確認し、適応するために再起動する
再起動して、Taggerタブが表示されているはず...表示されていなかった...
以下の記事に対処法が載っていました。（2か所コードを修正する必要があるみたい）

コード修正後に、ローカルサーバーを立ち上げなおすと、Taggerのタブが増えているはず。
画像を挿入すると、その画像に関連するタグを取得できるようになる。

embedding

高品質な画像を作るためのツール
ネガティブプロンプト（プロンプト？）に設定することで、指などの奇形を抑えることができるようになるらしい（抑えられているかどうか実感はあまり沸かない）

easynegative

LFSファイルをダウンロード

bad-hands-5

LFSファイルをダウンロード

bad_promptとbad_pronmt_version2

LFSファイルをダウンロード(bad_promptとbad_pronmt_version2の2つ)

bad-artist-animeとbad-artist

LFSファイルをダウンロード(bad_artist-animeとbad_bad-artistの2つ)

bad-picture-chill

LFSファイルをダウンロード(bad-picture-chill-75vの1つ)

badquality

LFSファイルをダウンロード

Deep-Negative

Deepnegativeのファイルをダウンロード

embeddingsフォルダにダウンロードしたファイルを移動

ローカルサーバーを再起動すると、UIにembeddingが適応される

これらをネガティブプロンプトへ反映することで、指の奇形などに対処することができるらしい（あまり実感はわかないが...）

※調べれば他にも便利なembeddingがあると思う

Clip skip(プロンプトをどれだけ綺麗に反映するか)

settingsタブのユーザーインターフェー→Quicksettings listでCLIP_stop_at_last_layersを選択
Apply setting → Reload UI で反映完了

Eta noise seed delta(ノイズを制御する設定、画像にどれだけのバリエーションを含ませるか)

サンプルパラメータ Eta noise seed deltaを「31337」に設定する
Apply setting → Reload UI で反映完了

Controllnet

これはstable diffusion forgeでは、デフォルトでついている機能であり、被写体のポーズを決めたり、画像を高画質化したりすることができる
ただし使用する際には、サイトから必要なファイルをダウンロードしないと、使うことができない

Tile

生成した画像や解像度の低い画像をアップスケールすることができるようになる

Cntrolnet 1.1 Modelsへアクセスし、Tileをダウンロードする
ダウンロードしたファイルを、models>ControlNetフォルダに配置する
txt2imgタブまたはimg2imgタブのControlNetを有効化し、先ほどダウンロードしたファイルを選択できることを確認する。もしなければ更新ボタンで更新してみる。
高画質化したい画像をControlNetへ挿入し、実行する（プロンプトはあってもなくてもよい）
生成した結果、よりリアルな画像に仕上がる（左から512×512、1024×1024、2048×2048）

OpenPose

生成した画像の被写体にポーズを設定することができるようになる

Cntrolnet 1.1 Modelsへアクセスし、Tileをダウンロードする
ダウンロードしたファイルを、models>ControlNetフォルダに配置する
txt2imgタブまたはimg2imgタブのControlNetを有効化し、先ほどダウンロードしたファイルを選択できることを確認する。もしなければ更新ボタンで更新してみる。
txt2imgタブで、必要なプロンプトを入力し、ポーズを指定する
指定するポーズは画像として挿入し、赤色マーク？を押して、解析を実行すると、ポーズを読み取れる
Editボタンで修正することも可能
自分は人を生成する場合、dw_openpose_fullにして対応している（これがポーズを読み取ってもらいやすいと思っているから）
生成した結果、指定したポーズで画像を生成することができる