とんでもない絵からスタート
最初に Chroma1-HD を動かして出てきたのは…
「猫を描いてほしい」とお願いしたはずなのに、なかなかカオスなアート。
思わず「とんでもない絵ができた!」と声に出してしまいました。
プロンプト調整の試行錯誤
・次に取り組んだのが「改善のための工夫」でした。
最初のプロンプト
prompt = "桜の花びらが舞う公園で、猫がベンチに座っている、幻想的で美しいアートワーク"
negative_prompt = "low quality, blurry, distorted, watermark"
・ネガティブプロンプトで文字や奇形を排除
・ガイダンススケールを上げて指示を忠実に
・ステップ数を増やして安定化
・スタイル指定で「anime style illustration」と明記
これらを組み合わせることで、モデルが余計な解釈をしにくくなり、イメージ通りの出力に近づきました
手順
1 必要ライブラリをインストール
!pip install diffusers transformers accelerate safetensors
!pip install torch --index-url https://download.pytorch.org/whl/cu121
2 モデルをロード
Hugging Face から Chroma1-HD を読み込みます。
import torch
from diffusers import DiffusionPipeline
model_id = "lodestones/Chroma1-HD"
pipe = DiffusionPipeline.from_pretrained(
model_id,
torch_dtype=torch.bfloat16
)
# GPUへ移動 & メモリ節約
pipe.enable_model_cpu_offload()
3 プロンプトを設定して生成
prompt = "A cute cat sitting on a park bench under cherry blossoms, anime style illustration, highly detailed, soft lighting, pastel colors"
negative_prompt = "text, logo, watermark, deformed, extra limbs, distorted face, low quality"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=40, # ステップ数(クオリティに影響)
guidance_scale=3.0, # テキスト指示の強さ
num_images_per_prompt=1, # 生成枚数
generator=torch.Generator("cpu").manual_seed(42)
).images[0]
image.save("chroma_art.png")
image
完成した一枚
そして出来上がったのがこの一枚。
桜の花びらが舞うベンチに、穏やかに座る猫。
アニメ調の柔らかいタッチと光の表現が心地よく、最初のカオス絵との落差も含めて「AIアートの醍醐味」を体感できました。
まとめと感想
・Chroma1-HD は「そのまま」使うと予想外の絵が出てきて楽しい。
・でも調整を重ねると、驚くほど美しい作品になる。
・アートとして「偶然を楽しむ」のもよし、狙って「作品を仕上げる」のもよし。
AI生成の魅力は、この 「思いがけないカオス」と「狙い通りの美しさ」 の両方を味わえるところにあると実感しました。
こんにちは、だいすけです。
ぼくはフリーランス・エンジニアで、 AR や 機械学習のアプリの実装をしています。
お仕事のご相談こちらまで。
rockyshikoku@gmail.com
Core MLを使ったアプリを作っています。
機械学習関連の情報を発信しています。