ComfyUI Flux プロンプト完全攻略ガイド
自然言語で語りかける、次世代画像生成のプロンプト術
ねらい
ComfyUIでFluxを使いたいけど、プロンプトの書き方がStableDiffusionと違って戸惑っていませんか?この記事では、Fluxの各モデル(Dev、Schnell、Pro)の特徴から、ComfyUIでの具体的な設定、そして最高の結果を得るためのプロンプト技法まで、実践的に解説します。
対象
- StableDiffusionからFluxに移行したい方
- ComfyUIでFluxを使い始めたばかりの方
- プロンプトの品質を向上させたい方
ゴール
この記事を読み終える頃には、Fluxの自然言語プロンプトを自在に書けるようになり、ComfyUIでの設定も完璧にマスターしている状態になります。
TL;DR
- Fluxは自然言語プロンプトに最適化(キーワードの羅列ではなく文章で書く)
- 重み付け構文(
:1.5など)は使えない → "with emphasis on"など自然な表現で - Flux Guidance(CFG)は3.5〜4.0が推奨、長いプロンプトなら1.0〜1.5
- Dev版は詳細なプロンプトが必要、Schnellは4ステップで高速、Proは簡潔でもOK
- "white background"はDevでぼやけの原因になるので避ける
1. Fluxモデルの種類とComfyUIでの違い
モデルバリエーション
Fluxには主に3つのバリエーションがあり、ComfyUIでそれぞれ異なる使い方をします。
| モデル | パラメータ | 用途 | ComfyUI配置先 | 特徴 |
|---|---|---|---|---|
| Flux.1 [Dev] | 12B | 非商用/研究 | diffusion_models/ |
詳細なプロンプトが必要、最高品質 |
| Flux.1 [Schnell] | 12B | 個人利用 | unet/ |
4ステップで高速生成 |
| Flux.1 [Pro] | - | 商用 | API経由のみ | 簡潔なプロンプトでもOK |
どれを選ぶべき?
- 品質重視 → Flux.1 [Dev](ライセンス購入で商用利用可)
- スピード重視 → Flux.1 [Schnell](Apache 2.0ライセンス)
- 最高品質&商用 → Flux.1 [Pro](API経由)
ComfyUIでの基本セットアップ
必要なモデルファイル:
ComfyUI/
├── models/
│ ├── diffusion_models/
│ │ └── flux1-dev.safetensors # Dev版の場合
│ ├── unet/
│ │ └── flux1-schnell.safetensors # Schnell版の場合
│ ├── clip/
│ │ └── clip_l.safetensors
│ ├── text_encoders/
│ │ └── t5xxl_fp16.safetensors # または t5xxl_fp8_e4m3fn_scaled.safetensors
│ └── vae/
│ └── ae.safetensors
注意点:
- Devは
diffusion_models/フォルダに配置 - Schnellは
unet/フォルダに配置 - CLIP LoaderではDual CLIP Loaderを使用(T5とCLIPの両方をロード)
2. Fluxの仕組み:T5とCLIPの協調
なぜFluxは「自然言語」が得意なのか?
Fluxは、従来のStableDiffusionとは根本的に異なるアーキテクチャを採用しています。
StableDiffusion:
- CLIPのみでプロンプトを解釈
- キーワードマッチング的な理解
Flux:
- T5(自然言語処理モデル)+ CLIP の協調
- T5がCLIPに「通訳・指示」を出しながら画像生成を誘導
比喩で理解するFlux:
CLIPは才能ある画家だが、英語があまり得意ではない。単語は理解できるが、複雑な文章は苦手。
T5はCLIPの言語と英語の両方を話せる優秀な通訳者。CLIPのために文章を言い換え、適切なタイミングで指示を出す。
(Civitaiコミュニティより)
この仕組みにより、Fluxは自然な文章を理解し、文脈を把握した画像生成が可能になっています。
3. プロンプトの基本構造:自然言語で語る
鉄則:文章で書く、キーワードを羅列しない
StableDiffusionスタイル(NG):
1girl, red hair, blue eyes, detailed, masterpiece, best quality,
photorealistic, ultra detailed, 8k, HDR
Fluxスタイル(OK):
A young woman with long, wavy red hair and striking blue eyes.
She wears a flowing white dress and stands in a sunlit meadow.
Soft golden hour lighting creates a warm, dreamy atmosphere.
Shot with an 85mm lens at f/2.8 for a shallow depth of field.
推奨プロンプト構造
[Subject] → [Action] → [Environment] → [Lighting] → [Style/Modifiers]
具体例:
Subject: Portrait of a middle-aged marathon runner
Action: post-race smile
Environment: city street at dawn
Lighting: soft backlight with cool tones
Style: ultra-detailed, natural skin texture
完成プロンプト:
Portrait of a middle-aged marathon runner, post-race smile,
city street at dawn, soft backlight with cool tones, ultra-detailed,
natural skin texture.
4. 重み付け構文は使えない:自然な強調表現を使う
StableDiffusionの重み付け構文について
Fluxでは、StableDiffusionの(keyword:1.5)や{keyword}といった重み付け構文はサポートされていません。
使えない構文:
(red hair:1.5)
{beautiful face:1.3}
[blurry:-0.5]
代替案:自然言語での強調
| やりたいこと | StableDiffusion | Flux |
|---|---|---|
| 赤髪を強調 | (red hair:1.5) |
with vibrant, striking red hair |
| 顔の美しさ | {beautiful face:1.3} |
with delicate facial features and captivating expression |
| 特定要素を目立たせる | (element:1.2) |
focus on [element], emphasizing [details] |
| 背景を控えめに | [background:0.7] |
with subtle, blurred background |
強調フレーズ集
重要度を上げる:
with emphasis onfocus onhighlightingfeaturing prominentlythe main focus is
詳細を追加:
intricate details ofmeticulously craftedultra-detailedhighly refined
特定の質を強調:
-
vibrant/striking/vivid(鮮やか) -
subtle/delicate/soft(繊細) -
dramatic/bold/intense(劇的)
5. ComfyUIでの重要パラメータ設定
Flux Guidance(CFG)の設定
Flux GuidanceはStableDiffusionのCFGと同様の役割ですが、推奨値が大きく異なります。
推奨設定:
| プロンプトの特徴 | 推奨Guidance | 理由 |
|---|---|---|
| 短いプロンプト(〜50単語) | 3.5〜4.0 | プロンプト遵守を強化 |
| 長いプロンプト(50単語以上) | 1.0〜1.5 | 創造性を確保 |
| 詳細な指示が多い | 3.2〜3.8 | バランス型 |
公式の制約:
- Dev版: 1.5〜5.0
- 一般的な使用: 3.5前後がスイートスポット
Guidance値の影響:
- 高い値(4.0以上): プロンプト遵守が強いが、テクスチャが不自然になることがある
- 低い値(1.5以下): より自然なテクスチャだが、プロンプトからずれることがある
Sampling Steps(ステップ数)
| モデル | 推奨ステップ | 範囲 |
|---|---|---|
| Dev | 20〜30 | 20〜50 |
| Schnell | 4 | 1〜4 |
Devでのステップ数の影響:
- 20ステップ未満: 画像が不完全、意味不明な結果
- 20〜30ステップ: バランスの取れた品質
- 30〜50ステップ: 細部の向上、生成時間増加
画像サイズ
推奨設定:
- 解像度: 32の倍数(例:1024×1024、1280×720)
- 範囲: 256〜1440(Dev API制約)
- アスペクト比: 幅×高さで暗黙的に指定
人気のアスペクト比:
-
1024×1024(正方形) -
1280×768(16:9風) -
768×1280(ポートレート)
6. 実践プロンプトテンプレート集
フォトリアリスティック・ポートレート
基本テンプレート:
[Subject description], [clothing details], [pose/action], [setting/location],
[lighting details], [camera/lens specs], [mood/atmosphere]
実例:
A young woman with long, wavy brunette hair rests her head on her clasped hands,
looking directly at the camera. She is dressed in a black top and wears a delicate
bracelet on her left wrist. Her expression is gentle and thoughtful, enhanced by
natural makeup and a hint of pink lipstick. The background is dark and blurred,
drawing attention to her face and hands. Shot with an 85mm lens at f/1.8, creating
a shallow depth of field.
プロダクトショット
テンプレート:
[Product name and description], [material/texture], [placement/angle],
[lighting setup], [background], [style reference]
実例:
Minimalist product shot of matte black wireless earbuds case, on a neutral backdrop
with softbox lighting from the left creating crisp shadows. High contrast,
commercial photography style with ultra-detailed texture. Clean composition
emphasizing the product's sleek design.
風景写真
テンプレート:
[Location/scene], [time of day], [weather/atmosphere], [lighting quality],
[composition notes], [camera technique]
実例:
A lone lighthouse stands on a stormy coastline with waves crashing against rocks.
Long exposure look creates smooth, ethereal water motion. Dramatic rim lighting
from breaking storm clouds. Moody teal-and-orange color grade with cinematic
composition. Shot with a wide-angle lens (24mm) for expansive perspective.
コンセプトアート
テンプレート:
[Character/subject], [detailed features], [setting description], [atmosphere],
[artistic style], [mood]
実例:
A battle-hardened female warrior standing atop a crystalline cliff in a fantastical
alien world. She has long, braided silver hair and glowing purple eyes. Her armor
is a mix of sleek metal and organic materials that shimmer in the bioluminescent
landscape. The sky is filled with twin moons and distant nebulae. Hyper-realistic
style with intricate details and dramatic lighting.
7. 避けるべき表現とトラブルシューティング
"white background"問題(Dev版)
問題:
Flux.1 [Dev]では、white backgroundという表現を使うと、画像全体がぼやけたり、エッジが薄れる現象が報告されています。
回避策:
# NG
logo for 'Eco Harmony' with modern typography against a white background
# OK(代替表現)
logo for 'Eco Harmony' with modern typography on a neutral backdrop
logo for 'Eco Harmony' with modern typography, soft light, high contrast
logo for 'Eco Harmony' with modern typography on a clean, minimal background
注意:
この問題は[Schnell]では発生しません。[Dev]特有の問題です。
あいまいな表現を避ける
NG:
beach at dawn, the sun, 'Welcome' sign, green, vibrant colors
→ 「green」が何を指すのか不明確(サインの色?海の色?)
OK:
beach at dawn with a golden sun rising over the horizon. A wooden sign
reading 'Welcome' in green lettering stands in the foreground. Vibrant
colors throughout the scene with warm orange and pink tones in the sky.
矛盾する指示を避ける
NG:
dark, moody atmosphere with bright, cheerful colors and soft, gentle lighting
that creates harsh shadows
OK(矛盾を解消):
dark, moody atmosphere with muted color palette and directional lighting
that creates dramatic shadows
8. 透明素材の表現:Fluxの得意技
Fluxは、ガラス、氷、ビニール袋などの透明素材を通した表現が得意です。
透明素材プロンプトのコツ
- 前景と背景を明示的に分ける
- 「〜を通して」「〜の向こうに」という表現を使う
- 透明素材の特徴を詳細に記述
実例:
A hanging glass terrarium featuring a miniature rainforest scene with colorful
orchids and tiny waterfalls. The terrarium is made of clear glass with visible
reflections. Just beyond the glass, a neon sign reads 'Rainforest Retreat' in
bright green letters. The glass creates subtle distortions and highlights,
adding depth to the composition.
別の例(氷を通して見る風景):
A frozen window covered in intricate frost patterns. Through the ice, a cozy
cabin with warm yellow lights is visible in the distance. The ice creates a
dreamlike blur and refraction of the cabin lights. Close-up macro shot
emphasizing the crystalline texture of the frost.
9. スタイル指定のベストプラクティス
アーティスト名・プラットフォーム参照
Fluxは、有名なアーティストや芸術プラットフォームの名前を理解します。
効果的な参照:
in the style of Vincent van Gogh's 'Starry Night'
inspired by ArtStation trending artwork
DeviantArt featured illustration
Studio Ghibli animation aesthetic
技術的な用語を活用
写真用語:
-
shot with [camera model](例:shot on Canon EOS R5) -
[focal length] lens(例:85mm lens,wide-angle 24mm lens) -
aperture f/[value](例:f/1.8,f/2.8) -
[shot type](例:macro shot,close-up,establishing shot)
ライティング用語:
golden hour lightingrim lightsoft diffused lighthard directional lightvolumetric lighting
カラーグレーディング:
teal-and-orange color gradedesaturatedhigh contrastmuted color palette
10. ネガティブプロンプトについて
Fluxにネガティブプロンプトは必要?
公式見解:
Fluxは基本的にポジティブプロンプトのみで動作するよう設計されています。
ネガティブプロンプトの実装:
一部のComfyUIワークフローでは、独自の方法でネガティブプロンプト機能を実装していますが、公式にはサポートされていません。
重要:
ポジティブプロンプトに「避けたいもの」を書かないこと。書くと逆に生成されてしまいます。
# NG
A beautiful landscape without any buildings or people
# OK
A pristine natural landscape with rolling hills and forests, untouched wilderness
11. プロンプト拡張ツールの活用
ComfyUIには、Fluxのプロンプトを自動で拡張・改善するツールがあります。
Flux Prompt Enhancer
機能:
- 短いプロンプトを詳細な記述に拡張
- 自然言語処理で文脈を理解
- 一貫性のある出力を保証
使い方:
# カスタムノード "Flux Prompt Enhance" を使用
Input: "a woman in a forest"
Output: "photography of a woman with long hair, dressed in a dress,
standing in a sunlit forest with dappled light filtering through
the canopy, creating a dreamy atmosphere"
Flux Prompt Generator
機能:
- カテゴリーベースのプロンプト生成
- ランダム要素の組み合わせ
- シード制御で再現性確保
カテゴリー例:
- Art forms(デジタルアート、油絵、水彩画など)
- Photo types(ポートレート、風景、マクロなど)
- Body types, Hairstyles, Clothing
- Place(森、都市、ビーチなど)
12. Dev vs Schnell:プロンプト戦略の違い
Flux.1 [Dev]
特徴:
- 詳細なプロンプトが必要
- 20〜30ステップで高品質
- 簡潔なプロンプトでは期待した結果が出にくい
推奨プロンプト長:
100〜200単語
プロンプト例:
A cozy, warmly lit bookstore cafe on a rainy evening. The interior features
floor-to-ceiling bookshelves filled with worn leather-bound books. Vintage
Edison bulbs cast a warm amber glow over weathered wooden tables where patrons
sit reading and sipping coffee. Rain streams down the large front window,
creating bokeh effects from the street lights outside. Steam rises from cups
of hot beverages. The atmosphere is intimate and nostalgic, shot with a
50mm lens at f/2.0 for a shallow depth of field that draws focus to the
foreground details while softly blurring the background shelves.
Flux.1 [Schnell]
特徴:
- 4ステップで高速生成
- 簡潔なプロンプトでも良好な結果
- Devほど詳細な指示は不要
推奨プロンプト長:
30〜80単語
プロンプト例:
A cozy bookstore cafe on a rainy evening with warm lighting and vintage decor.
Rain on the window, people reading with coffee. Warm amber tones, intimate
atmosphere.
13. 高度なテクニック
レイヤードプロンプト(階層的記述)
背景、中景、前景を明確に分けて記述することで、深度のある画像を生成できます。
Background: A majestic mountain range at sunset with pink and orange clouds.
Middle ground: A serene alpine lake reflecting the mountains, with pine trees
lining the shore.
Foreground: Wildflowers in sharp focus, with individual petals and dewdrops
visible. Shot with a wide-angle lens to capture the entire scene.
スタイル融合
複数のスタイルを組み合わせることで、ユニークな表現が可能です。
A portrait combining the geometric abstraction of Pablo Picasso with the soft,
dreamy quality of Impressionism. The subject's face is fragmented into angular
shapes while colors blend softly, creating a harmonious tension between structure
and fluidity.
時間的表現
1枚の画像で時間の経過を表現する高度な技法です。
A single image showing the passage of time in a city square. The left side
shows morning with fresh market stalls and early risers. The center depicts
bustling midday activity with crowds. The right side transitions to evening
with street lights turning on and people relaxing at cafe tables. Seamless
blending between time periods creates a dreamlike temporal narrative.
まとめ
ComfyUIでFluxを使う際の5つの黄金律:
- 自然言語で文章を書く → キーワードの羅列ではなく、人に説明するように
- 重み付け構文は使わない → "with emphasis on"などの自然な表現で代替
- Flux Guidanceは3.5前後 → 長いプロンプトなら1.0〜1.5に下げる
- "white background"を避ける(Dev) → "neutral backdrop"などで代替
- 詳細に記述する(特にDev) → 100単語以上が理想
StableDiffusionからの移行者へ:
最初は違和感があるかもしれませんが、「AIに指示を出す」のではなく「AIと対話する」感覚でプロンプトを書くと、Fluxの真価が発揮されます。
T5とCLIPの協調による自然言語理解は、プロンプトエンジニアリングの新時代を切り開いています。慣れれば、StableDiffusionよりも直感的に、思い通りの画像を生成できるはずです。