Sampling Methodごとの所要時間と品質を比較してみました。
品質は同時に4枚生成して(Batch count
を4)にして、一番できのよかった写真の品質で評価しています。
結論
用途ごとにモデルを使い分けようと思いました。
- 速さ重視・品質最低限👉DDIM - 10ステップ (4秒/枚)
- 速さ重視・高品質👉DPM++ 2M Karras - 15ステップ(5秒/枚)
- 品質重視👉DPM++ 2M Karras - 25 (8秒/枚)
感想
なんとなくデフォルトのEuler a を最初に使っていたし、DDIMが早いと聞いていたので、結果を早く知りたいときはそれを使っていたが、DPM++ 2M Karrasでもステップ数を少なくすれば早いこともわかったし、ステップ数を上げても構図自体はあまり変わらないので、DPM++ 2M Karrasを使っていこうと思いました。
評価結果
上段:4枚の所要時間(秒) 下段:品質点数(著者基準)
Model↓ Steps→ | 10 | 15 | 20 | 25 | 30 |
---|---|---|---|---|---|
DDIM | 15.3秒 75点 |
21.5秒 80点 |
25.8秒 90点 |
32.6秒 88点 |
35.9秒 86点 |
DPM++ 2M Karras | 16.1秒 30点 |
22.0秒 90点 |
28.2秒 95点 |
33.7秒 98点 |
39.4秒 99点 |
Euler a | 18.0秒 20点 |
24.1秒 72点 |
30.1秒 95点 |
36.4秒 97点 |
40.2秒 99点 |
Sampling Method | Steps | 所要時間(4枚) | 品質(著者基準) |
---|---|---|---|
DDIM | 10 | 15.3 | 75 |
DDIM | 15 | 21.5 | 80 |
DDIM | 20 | 25.8 | 90 |
DDIM | 25 | 32.6 | 88 |
DDIM | 30 | 35.9 | 86 |
DPM++ 2M Karras | 10 | 16.1 | 30 |
DPM++ 2M Karras | 15 | 22.0 | 90 |
DPM++ 2M Karras | 20 | 28.2 | 95 |
DPM++ 2M Karras | 25 | 33.7 | 98 |
DPM++ 2M Karras | 30 | 39.4 | 99 |
Euler a | 10 | 18.0 | 20 |
Euler a | 15 | 24.1 | 72 |
Euler a | 20 | 30.1 | 95 |
Euler a | 25 | 36.4 | 97 |
Euler a | 30 | 40.2 | 99 |
利用した設定および環境
環境
Google Colab (Pro)
Stable Diffusion WebUI
python: 3.10.11
torch: 2.0.0+cu118
xformers: N/A
gradio: 3.16.2
commit: a9eab236
checkpoint: fc2511737a
モデル(Checkpoint)
ChilloutMix [ハッシュ:fc2511737a]
プロンプト
A girl walking on street for shopping, (8k, RAW photo, best quality, masterpiece:1.2),High detail RAW color photo, professional photograph, (realistic, photo realistic:1.37), ((best quality)), 1 girl, cinematic light, (finerly detailed face:1.2), (masterpiece:1.5), (best quality:1.2), beautiful face, sunlight, smile, t-shirt, overalls, makeup
Negative Prompt
bad-hands-5 bad_prompt_version2 badhandv4 bad-picture-chill-75v
いずれもTextual Inversion
画像
Sample Method - Steps