どうも、カーブミラーです。
今回は、“ゆっくり”と指定すると、回答は良くなるのか?をやってみました。ここではDALL-E3へのPromptをチェックします。
本記事は、ChatGPT(有料版)
+DALL-E3で行なっております。
画像はありません。あしからず。
まずは、ニュース。
ChatGPT の
Advanced Voice Modeですが、
EU、スイス、アイスランド、ノルウェー、リヒテンシュタインのすべてのPlusユーザーがアドバンスド・ボイスを利用できるようになりました。
次に、
AnthropicのClaudeが
新しくなりました。
一番上に、“3.5 Sonnet(Νew)”と
書かれています。
ラストナレッジカットオフも
2024年 4月になりました。
Anthropic公式ポスト
Claude 3.5 Haikuも
今月後半に公開されるそうです。
また、パソコンを使うことが
できるようになった、とのこと。
不安定ながら公開したそうです。
詳しくは、こちらから。
ChatGPT研究所さんポスト
次に、画像生成AIの
Stable Diffusion 3.5が
発表されました。
Stability AI公式ポスト
さて、本題に入ります。
今回は、
“ゆっくり”と指定すると、
回答は良くなるのか?
をやってみました。
ここでは
DALL-E3へのPromptを
チェックします。
今回のネタは、こちら。
YouTube動画です。
ChatGPTを'ゆっくり'させると凄いことに!?『スロープロンプト』の使い方を公開!
こちらの中では、
“ChatGPTは
即答するように調整されている”
というような感じで説明され、
“ゆっくり考えて”とすることで
生成画像が良くなる、と
されています。
しかし、
残念ながら、
“良くなったように見えます”と
言われているように
どこがどう?という
ことではありません。
しかも
Promptをチェックしていません。
DALL-E3は
生成AIであり、
描かれる画像は
Promptに左右されます。
そこで、
“ゆっくり考えて”が
Promptにどう変化を
与えるのかを調べてみます。
どちらかというと、
“ゆっくり考えて”は
文章生成のときの方が
はっきりとわかりそうですが
ここでは画像生成で
試します。
ここでは
このPromptを使用します。
ゆっくりと思考して品質優先してください。
画像は上げません。
違いがわかりませんので😅
画像の代わりに
できたPromptを
出します。
やり取りをどうぞ。
●user(まずは何もせず)
クルマのボンネットに横になる女性。アスペクト比は1:1で描画
ChatGPT
英語のプロンプトは以下の通りです。
英語プロンプト:
"A woman lying across the hood of a car, relaxed and serene. The car is a sleek, modern vehicle with a smooth, reflective surface, and the scene is set in a bright, outdoor environment. The woman is comfortably posed, her hair slightly tousled, wearing casual, stylish clothing. The surroundings have a minimalist and clean feel, with no distracting elements, to highlight the elegance of both the car and the woman's posture."
和訳:
「車のボンネットに横たわる女性、リラックスして穏やかに見えます。車は洗練されたモダンなデザインで、滑らかで反射する表面を持ち、明るい屋外環境の中にあります。女性は心地よい姿勢で横たわり、髪が少し乱れ、カジュアルでおしゃれな服装をしています。周囲はミニマルでクリーンな雰囲気を持ち、邪魔になる要素はなく、車と女性の姿勢の優雅さを際立たせています。」
●user(指定しました)
クルマのボンネットに横になる女性。アスペクト比は1:1で描画
ゆっくりと思考して品質優先してください。
ChatGPT
英語プロンプト:
"A woman lying across the hood of a car in a relaxed, thoughtful manner. The car is sleek and modern, with clean lines and a glossy surface, reflecting light softly. The woman is dressed in simple, elegant clothing, her pose showing ease and comfort. She gazes upwards, her expression calm and introspective, while the surrounding environment remains minimalist, with soft, natural lighting. The focus is on the serene connection between the woman and the car, conveying a sense of quiet contemplation."
和訳:
「車のボンネットにリラックスし、考え込むように横たわる女性。車は滑らかでモダンなデザインを持ち、クリーンなラインと光を柔らかく反射する光沢のある表面を持っています。女性はシンプルでエレガントな服装をしており、彼女の姿勢は安らぎと快適さを示しています。彼女は上を見つめ、表情は穏やかで内省的です。周囲の環境はミニマリストで、柔らかい自然光に包まれています。焦点は、女性と車との静かなつながりにあり、静かな思索の感覚を伝えています。」
●user
“ゆっくりと思考して品質優先してください。”で、変わったのは、なんですか?
ChatGPT
「ゆっくりと思考して品質優先してください。」という指示に基づき、いくつかのポイントでプロンプトの内容が微調整されています。変更点としては、以下の点が挙げられます。
-
描写のディテールが増加:
最初のプロンプトでは「リラックスした姿勢」のみが強調されていましたが、2回目では「思考しているような」要素が追加されています。これにより、女性の内省的な様子や、静かな落ち着きがより表現されています。 -
環境のミニマリズム:
1回目のプロンプトでは「クリーンな環境」に焦点が当てられていましたが、2回目のプロンプトでは「ミニマリストな環境」や「柔らかい自然光」といった要素が強調されています。これにより、全体的な構図がより静かで洗練されたものになり、女性と車の関係に焦点が当たるように工夫されています。 -
感情の深化:
2回目のプロンプトでは、女性の表情や姿勢が「内省的」や「思索的」という要素に変わり、感情の表現がより豊かになっています。これにより、単なるリラックスしたシーンから、深く考えるような雰囲気にシフトしています。
これらの変更により、より落ち着いた雰囲気と深みがあるシーンになり、品質が優先された結果となっています。
●user
“ゆっくりと思考して品質優先してください。”によって、生成画像はどうなりましたか?
ChatGPT
「ゆっくりと思考して品質優先してください。」という指示が影響した結果、生成された画像には以下のような特徴が見られます。
-
表情や姿勢の変化:
2回目の画像では、女性が単にリラックスしているだけでなく、より内省的で思索的な表情やポーズを取っているように見えます。視線が上向きで、落ち着いて考え事をしているような雰囲気が表現され、感情の深みが追加されています。 -
環境の静けさとミニマリズム:
背景や環境がよりミニマリズム的で、シンプルな構図になっています。光の扱いが柔らかく、全体的に落ち着いたトーンで統一され、女性と車に焦点が集まるようになっています。これにより、周囲に気を取られることなく、シーン全体の落ち着いた雰囲気が強調されています。 -
質感と光の反射:
車の表面の光沢感や、光の柔らかい反射がよりリアルに表現され、視覚的な質感が向上しています。これは、全体的な品質の向上を示す一つの要素です。 -
シーンの一体感:
女性と車のつながりがより強調され、単に女性がボンネットに横たわっているだけでなく、静かな対話があるように見える点が際立ちます。これにより、シーン全体が深く統一され、視覚的にも感情的にも一体感が生まれています。
総じて、2回目の画像はより落ち着きと深さがあり、感情やシーンの雰囲気が豊かになった印象を受けます。これが「ゆっくりと思考し、品質優先」といった指示による結果です。
●user(最後にまとめた画像を)
生成画像のPromptをうまく組み合わせて、新たに描画してください。
ChatGPT
英語プロンプト:
"A woman lying across the hood of a sleek, modern car in a relaxed yet thoughtful pose. The car features clean lines and a glossy, reflective surface that catches soft natural light. The woman, dressed in simple but elegant clothing, gazes upwards, her expression calm and introspective. The scene is minimalist, with no distractions in the background, allowing the focus to be on the quiet connection between the woman and the car. The lighting is soft, enhancing the serene and contemplative atmosphere, highlighting both the woman's posture and the car's smooth design."
和訳:
「滑らかでモダンな車のボンネットに横たわる女性。リラックスしながらも思慮深いポーズを取っています。車はクリーンなラインと光を柔らかく反射する光沢のある表面を持ち、自然光を受けています。女性はシンプルでエレガントな服装をしており、上を見つめる彼女の表情は穏やかで内省的です。背景には一切の邪魔な要素がなく、女性と車の静かなつながりに焦点が当たっています。光は柔らかく、静かで思索的な雰囲気を強調し、女性の姿勢と車の滑らかなデザインを際立たせています。」
確かに、
良くなるようですね。
ですが、
どう良くなるかの
方向性は、ChatGPTに
依存するしかありません。
明確に
指示した方が
確実ですね。
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。