とんでもない絵から美しい桜猫まで：Chroma1-HDで遊んでみた

Last updated at 2025-08-16Posted at 2025-08-16

とんでもない絵からスタート

最初に Chroma1-HD を動かして出てきたのは…
「猫を描いてほしい」とお願いしたはずなのに、なかなかカオスなアート。

思わず「とんでもない絵ができた！」と声に出してしまいました。

プロンプト調整の試行錯誤

・次に取り組んだのが「改善のための工夫」でした。
最初のプロンプト

prompt = "桜の花びらが舞う公園で、猫がベンチに座っている、幻想的で美しいアートワーク"
negative_prompt = "low quality, blurry, distorted, watermark"

・ネガティブプロンプトで文字や奇形を排除
・ガイダンススケールを上げて指示を忠実に
・ステップ数を増やして安定化
・スタイル指定で「anime style illustration」と明記
これらを組み合わせることで、モデルが余計な解釈をしにくくなり、イメージ通りの出力に近づきました

手順

1 必要ライブラリをインストール

!pip install diffusers transformers accelerate safetensors
!pip install torch --index-url https://download.pytorch.org/whl/cu121

2 モデルをロード
Hugging Face から Chroma1-HD を読み込みます。

import torch
from diffusers import DiffusionPipeline

model_id = "lodestones/Chroma1-HD"

pipe = DiffusionPipeline.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16
)

# GPUへ移動 & メモリ節約
pipe.enable_model_cpu_offload()

3 プロンプトを設定して生成

prompt = "A cute cat sitting on a park bench under cherry blossoms, anime style illustration, highly detailed, soft lighting, pastel colors"
negative_prompt = "text, logo, watermark, deformed, extra limbs, distorted face, low quality"

image = pipe(
    prompt=prompt,
    negative_prompt=negative_prompt,
    num_inference_steps=40,   # ステップ数（クオリティに影響）
    guidance_scale=3.0,       # テキスト指示の強さ
    num_images_per_prompt=1,  # 生成枚数
    generator=torch.Generator("cpu").manual_seed(42)
).images[0]

image.save("chroma_art.png")
image

完成した一枚

そして出来上がったのがこの一枚。
桜の花びらが舞うベンチに、穏やかに座る猫。
アニメ調の柔らかいタッチと光の表現が心地よく、最初のカオス絵との落差も含めて「AIアートの醍醐味」を体感できました。

まとめと感想

・Chroma1-HD は「そのまま」使うと予想外の絵が出てきて楽しい。
・でも調整を重ねると、驚くほど美しい作品になる。
・アートとして「偶然を楽しむ」のもよし、狙って「作品を仕上げる」のもよし。
AI生成の魅力は、この「思いがけないカオス」と「狙い通りの美しさ」の両方を味わえるところにあると実感しました。

こんにちは、だいすけです。
ぼくはフリーランス・エンジニアで、 AR や機械学習のアプリの実装をしています。
お仕事のご相談こちらまで。
rockyshikoku@gmail.com

Core MLを使ったアプリを作っています。
機械学習関連の情報を発信しています。

Twitter
Medium

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up