0
0

【OpenAI o1】にDALL-E3の縦長画像について相談しました。

Last updated at Posted at 2024-09-16

 どうも、カーブミラーです。

 今回は、OpenAI o1にDALL-E3の縦長画像について相談しました。

本記事は、ChatGPT(有料版)
で行なっております。画像は
あります。 あしからず。

 まずは、ニュースです。

 OpenAI o1(o1-Preview)、
  メンサのIQテストで
   IQ120と判明。
    TrackingAI

 “人類の90%より
  賢いことが証明された”

 “人間の平均IQは
  90〜100なので、圧倒的”

 とX-Twitter上で騒がれています。

 とはいえ、
  理系に強いだけで
   文系が弱いんだから
    ダメじゃんって話ですけどね😸

 まぁ、
  知能レベルが上がったのは
   確かなので、我々も頑張んべぇ〜


 iekyさんという方が
  メリットデメリットを
   書いてくださいました。
    そのまま出します。

iekyさんポスト内容
OpenAIの新モデルo1(preview)のメリット・デメリット👇

1. メリット
・複雑なタスクに強い
・簡潔な指示で済む
・思考の可視化でブラックボックス解消

2. デメリット
・簡単なタスクでは旧モデルと大差なし
・料金高、使用回数制限
・速度が遅い
・ファイルアップロード、ブラウジング等機能制限

 iekyさんポスト

 このデメリットを受容しても
  メリットの方が大きい、と
   思う思わない、は
    それぞれの判断に
     お任せします。

 私は、
  やりたいことの
   道筋を立ててもらえるので、
    メリットあり、ですね😸

 それでも
  早く、Web、ADA、画像生成を
   接続して欲しいところです。


 さて、本題です。

 今回は、
  久々にDALL-E3ネタをやります。

 とはいえ、
  やはり流行りの
   OpenAI o1を使ってみないと
    いけませんよね😸

 実は、
  前々から
   縦長の画像を生成すると
    縦長だけど横長画像になる
     という問題があり、
      辟易しておりました。

 それで
  o1に相談してみたわけです。

 ではやり取りをどうぞ。


user
DALL-E3に与えるPromptについて相談したいです。
アスペクト比を縦長で指定するのですが、確かに縦長で出てきます。
しかし、画像は横倒しになってしまうことが多いです。
例えば、女性の全身を出したいのに、どうしても横倒しになってしまい、せっかくの縦長指定が横長指定と同じになってしまうのです。
解決方法はあるでしょうか?

o1-mini
DALL-E 3で縦長の画像を正しく生成するためには、プロンプトに具体的な指示を追加することが重要です。以下の方法を試してみてください:

  1. 明確な指示を追加する:

    • 「縦向き」や「ポートレート形式」といったキーワードをプロンプトに含めることで、縦長の画像を生成しやすくなります。
    • 例:
      縦向きのポートレート形式で、全身が映る女性のイラスト
      
  2. 構図を具体的に指定する:

    • 「立っている姿」や「全身がフレームに収まっている」といった具体的な姿勢や構図を記述すると、横倒しになるリスクを減らせます。
    • 例:
      縦向きのポートレート形式で、立っている女性の全身像
      
  3. アスペクト比の指定を明確にする:

    • アスペクト比を明示的に指定することで、縦長の画像生成を促します。例えば「9:16のアスペクト比」など。
    • 例:
      9:16の縦長アスペクト比で、全身が映る立っている女性のポートレート
      
  4. 視点や方向性を指定する:

    • 「正面から見た」や「縦方向に配置された」といった視点を追加することで、意図した向きでの画像生成を助けます。
    • 例:
      正面から見た縦向きのポートレート形式で、全身が映る女性
      
  5. 不要な回転を避ける指示を加える:

    • 「横向きにしない」や「回転させない」といった指示を追加することで、横倒しを防ぐことができます。
    • 例:
      縦向きのポートレート形式で、回転させずに全身が映る女性のイラスト
      
  6. 具体的な例を参考にする:

    • 他の成功例や参考画像のスタイルをプロンプトに含めると、より期待に近い結果が得られる可能性があります。
    • 例:
      縦向きのポートレート形式で、ファッション雑誌風の全身が映る女性
      

まとめ:
プロンプトを作成する際には、縦向きやポートレート形式を明確に指定し、全身が映るような具体的な構図や姿勢を詳細に記述することが重要です。これにより、DALL-E 3が意図した通りの縦長画像を生成しやすくなります。試行錯誤しながら、最適な表現を見つけてください。


 「縦向きのポートレート形式」が
  キーワードのようですね。

 6番のPromptを
  GPT-4oに渡してみました。
1726457674662.jpg

 そのまま、
  少しずつ指示を出して
   変更していきますが、
    縦長画像ばかりになりました。

 しかし、
  人物に踊らせると
   縦長に横長画像で描画されます。
    うまくいく場合もありますが。

 ようするに
  横長になりやすい画像を
   得ようとすると
    ダメなようですね。

 それでも
  キーワードがわかっただけでも
   ありがたいです。

 みなさんの
  作品制作の糧に
   なれば、幸いです。

 今回は、ここまで。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0