どうも、カーブミラーです。
今回は、“DALL-E3は日本語がわからない”がテーマです。
本記事は、ChatGPT(有料版)
+DALL-E3で行なっております。
画像はありません。あしからず。
まずは、ニュース。
サム・アルトマンが
X-Twitterにポストしました。
サム・アルトマンのポスト
おっ、ChatGPTの2歳の誕生日は来月だ!
誕生日プレゼントに何を贈ろうか...。
2022年11月30日に
ChatGPTが、お披露目され、
私たちに生成AIという世界が
あることを教えてくれました。
サムのプレゼントは
なんでしょうね😸
さて、本題に入ります。
今回は、
「DALL-E3は日本語がわからない」
という内容を書きます。
みなさんは、
“DALL-E3は日本語がわかる”と
思っていませんか?
日本語で指示できるので
そう思いがちです。
実際には、
ChatGPTが仲介して
英訳してから
不足している要素を追加
しています。
このことは、今年の6月の記事で
ChatGPTに尋ねた
DALL-E3までの工程が
あります。
【ChatGPT+DALL-E3】Promptの流れ。
ここで少し趣旨が
違うかもしれませんが、
Promptを変えないようにも
指示ができます。
例をお見せしましょうか。
まずはふつうに。
●user
クルマのボンネットに横たわる女性。アスペクト比は1:1で描画
ChatGPT
(指定どおり)
●user
英語プロンプト出力。略さずに和訳。
ChatGPT
英語プロンプト:
"A scene showing a woman lying gracefully on the hood of a car. The car is sleek and modern with smooth curves, and the woman is elegantly posed, wearing a flowing dress that drapes over the side of the vehicle. The background is simple, perhaps a twilight sky, emphasizing the scene with a touch of cinematic elegance. The lighting casts soft shadows, highlighting the contours of both the car and the woman."
和訳:
「女性が車のボンネットに優雅に横たわっているシーン。車はなめらかでモダンな曲線を持ち、女性はエレガントなポーズを取り、流れるようなドレスを着ており、車の側面に垂れ下がっている。背景はシンプルで、たぶん黄昏の空が広がり、映画のような優雅さがシーンを強調している。照明は柔らかい影を投げかけ、車と女性の輪郭を引き立てている。」
このとおり、
最初の一文以外は
すべてChatGPTが
盛っています。
次に
“Promptを変更するな”という感じで
指示します。
英訳を指示していますが、
日本語のまま、DALL-E3に渡すと
関係ない画像が生成されます😅
日本語をわかっていないのが
わかりますね。
●user
“クルマのボンネットに横たわる女性。アスペクト比は1:1で描画”
このPromptを変えずに英訳してDALL-E3に渡して描画してください。
ChatGPT
(詳細はDALL-E3が補完)
●user
英語プロンプト出力。略さずに和訳。
ChatGPT
英語プロンプト:
"A woman lying on the hood of a car. The aspect ratio is 1:1."
和訳:
「クルマのボンネットに横たわる女性。アスペクト比は1:1。」
となります。
これは
“そのままならば、どうなるか”を
示しているに過ぎません。
普段使うようなものでは
ありませんので、
参考にする程度でしょう。
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。