どうも、カーブミラーです。
今回は、画像がすでにあり、それをアップロードして、そこから解析して特徴を取り出す。その特徴から指示プロンプトを作成する方法をお伝えします。
本記事は、ChatGPT(有料版)
+DALL-E3で行なっております。
あしからず。
言っておきますが、
完コピは無理ですw
また、
画像全体のすべてを
解析しようとすると
断片的な情報しか
収集できないです。
おそらく
将来的には
可能かと思いますけどね(=^・^=)
さて、
説明は
ここまでにして
やり取りをごらんください。
そこにプロンプトも
登場します。
user(一番目)
(キャラ弁の画像をアップ)
これはお弁当です。
詳細な特徴を捉えて教えてください。
箇条書きでお願いします。
ChatGPT
このお弁当は以下の特徴を持っています:
- 主要な要素はキャラクターの顔を模しており、お米で作られた大きな丸い顔が中心にあります。
- 顔の周りにはピンク色の飾りがあり、これが髪の毛を表しているようです。
- 目は大きく、茶色の海苔で瞳が作られ、白い部分はカットされたチーズか薄い卵の白身で作られています。
- 頬はピンク色の薄切りの食材でできており、おそらくかまぼこや魚肉ソーセージです。
- 口元には赤い蝶ネクタイがあり、これも海苔や他の食材で作られています。
- 弁当箱の右上にはイチゴが数個添えられていて、新鮮さを加えています。
- 左側には緑のレタスが敷かれており、色と食感のコントラストを提供しています。
デザインは非常に工夫されており、食べるのがもったいないほどの可愛らしさがあります。
user(二番目)
上記の箇条書きをDALL-E3に渡すためのプロンプトにまとめ直してください。描画はなし。
ChatGPT
以下のプロンプトはDALL-Eに渡すために再構成されたものです:
キャラクター風の可愛らしいお弁当が特徴的な弁当箱に入っている。中心にはお米で作られた大きな丸い顔があり、ピンク色の髪の毛を模した飾りが顔の周りに配されている。目は茶色の海苔で大きく描かれ、白い部分はチーズか薄い卵の白身で作られている。頬はピンク色の薄切りの食材であり、口元には赤い蝶ネクタイがある。右上には新鮮なイチゴが数個、左側には緑のレタスが敷かれている。全体として、食材を使って繊細に作り上げられた、食べるのが惜しいほどのアートピースのような弁当。
user(三番目)
上記プロンプトを英訳して、それをDALL-E3に渡してください。
ChatGPT
(キャラ弁画像が描画される)
一番目のプロンプトの
「これはお弁当です」は
解析したい対象を指示します。
“お弁当”を“女性”とかに
変更してやってみて
ください。
二番目のプロンプトで
“描画はなし”と書いていますが、
これは作成された
プロンプトを
確認するためのものです。
三番目は
作成されたプロンプトを
確認したので、
英訳して描画を
指示しました。
なぜ、
英訳するのか?
英語の方が、DALL-E3が
出力する画像の質が
いいからです。
もちろん、
日本語であっても
ChatGPTが翻訳してから
DALL-E3に渡しているはず
なので、英訳の必要性は
ないような気もします。
それから、今思い出しましたけど
日本語のままだと、
ChatGPTさんが盛る可能性が
ありますので、
その対策ですね(=^・^=)
それはさておき、
修正や追加が
必要な場面もあります。
その場合は
プロンプトをコピって、
編集、そのプロンプトを
入力して、描画指示すれば
いいわけです。
ちなみに、
描画されたお弁当は
食べられそうでしたけど、
アメリカンヒーローや
ピカチュウなんかは
色がヤバそうでした(笑)
これが、
みなさんの
作品制作の糧になれば
幸いです。
今回は、ここまで。