0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【ChatGPT有+DALL-E3】のオプションについて

Posted at

 どうも、カーブミラーです。

 今回は、オプションについて書きますね。“オプションなんてあった?”となりますよねw OKOK。

本記事は、ChatGPT(有料版)
+DALL-E3で行なっております。
画像はあります。 あしからず。

 昨日(2024/02/28)は
  矢継ぎ早に、とある技術が
   発表されていました。

 PIKAと
  アリババからです。
  
 動画生成時の
  人物の口パク、
   いわゆるLip Sync。

 画像と音声データを
  入力するだけで、
   口パク動画が生成されます。

 サンプル画像を見ると、
  PIKAは、まわりがボケてしまう。
  アリババは自然な感じですが
   歌を歌っているのに
    張り上げた際の動きは
     ありませんでした。

 まぁ、
  現時点では
   こんなものでしょうね。

 ただ、
  動画生成に
   力が注がれていますので
    もっと自然なものに
     なるかと思います。

 楽しみに
  待つとしましょう。


 Adobeが
  今度は、
   音楽ですってよ、奥さん。
Adobe Music GenAI

 これは
  研究段階な感じがありますが、
   それなりの準備が
    整えられてきている感が
     ありますね。

 sunoも
  バージョンアップ
   してるみたいだし、
    新たな風が吹きまくるかも。


 さて、
  本題です。

 DALL-E3に
  オプションなんて
   ない、と思いますよね。
    同感ですw

 ここでいう“オプション”というのは
  スイッチやボタンなどの
   UIデザインを指すのではなく、
    スタイルのパターンだと
     思ってください。


 とあるポストが
  X-Twitterでされました。
   残念ながら、
    リンク先のコピーを
     し忘れており、
      その内容だけを
       コピーしました。

 英語圏の方の
  ポストでした。

 そこには
  DALL-E3の
   スタイルのオプションが
    羅列されていました。

 以下のとおりです。
  もちろん英語でした。
   それをDeepL翻訳しました。

35ミリフィルム, 抽象画, アニメ, アールデコ, アールヌーボー, 人工照明, バロック, モノクローム, 漫画, チョークアート, 木炭, クレイメーション, クローズアップ, コミックブック, コンセプトアート, クレヨン、 キュビスム、夜明け、デジタルアート、夕暮れ照明、ダッチアングル、ディストピア、表現主義、極端なクローズアップ、ファンタジー、フォーヴィスム、フェルト、フィッシュアイ、未来派、ゴールデンタイム、ゴシック、グラフィティ、手描き、 ハイアングル, ハイコントラスト, 印象派, インクウォッシュ, ラインアート, リノカット, ローアングル, ミニマリスト, モザイク, モーションブラー, ミュート, 夜, 油絵, パステル, 鉛筆画, ピンホールカメラ、 ピクセルアート、点描画、ポップアート、レトロ、ロココ、SF、彫刻、セピア、シルクスクリーン、ソラーパンク、スチームパンク、シュルレアリスム、シンセウェーブ、浮世絵、ヴィクトリアン、水彩画、広角、木版画

 どうです?
  ずっとDALL-Eを
   触ってきた方なら
    全部とはいかなくても
     それなりに指定してきた
      ようなものが
       並んでいますね。

 さて、
  これらすべてが
   有効なのでしょうか?

 聞いてみました。
  やり取りをどうぞ。


user
以下を、DALL-E3に有効と思われるオプションと有効ではないオプションに分けてください。また、なぜそう分けられたのかの説明もお願いします。

(上記オプションは略w)

ChatGPT
DALL-Eにおいて有効と思われるオプションとそうでないオプションを分ける基準には、その技術が生成する画像の特性や対象の表現能力に基づいています。具体的には、DALL-Eは画像生成において特定の芸術スタイル、技法、視覚効果を模倣することができますが、物理的なメディアや具体的な撮影技術(例えば「35ミリフィルム」や「ピンホールカメラ」のようなもの)を直接反映することはできません。ただし、これらのメディアや技術によって生み出される視覚的な特徴や効果を模倣することは可能です。

有効なオプション

  • (多いので略w) - これらはすべて特定の芸術スタイル、技法、または視覚効果を指し、DALL-Eはこれらの特性を模倣して画像を生成することができます。

有効ではないオプション

  • 35ミリフィルム、人工照明、クローズアップ、夜明け、夕暮れ照明、ダッチアングル、ディストピア、極端なクローズアップ、フェルト、ゴールデンタイム、ハイアングル、ハイコントラスト、ローアングル、モーションブラー、ミュート、夜、ピンホールカメラ、広角 - これらは物理的な撮影技術や特定の環境条件(例えば「夜」や「夕暮れ照明」)を指し、直接的にはDALL-Eの能力範囲外です。しかし、これらの条件や技術によって生じる視覚効果は模倣することが可能です。例えば、「モノクローム」や「セピア」のような視覚効果は有効ですが、それを生み出す具体的な技術(「35ミリフィルム」や「ピンホールカメラ」)は直接的には有効ではありませんが、その視覚効果を指示することは可能です。

この区分けは、DALL-Eが視覚効果やスタイルを理解し、それに基づいて画像を生成できる能力に基づいています。物

理的なメディアや撮影技術自体を模倣するのではなく、それらによって生み出される視覚的な特徴や効果を生成することが可能です。


 略していますが、
  大事なのは、
   有効ではないものです。

 しかし、
  これを見る限り、
   それほどの心配はなさそうです。

 指定したとしても
  おそらく、ChatGPTさんが
   補正してくれるんでしょう。

 DALL-E3さんとの
  仲介役ですからね、
   ChatGPTさんは😄


 次は
  たまたまなんですが、
   同じ質問をして
    オプション羅列を
     入力し忘れて、
      やり取りを
       続けてしまった
        ものをどうぞ(汗)


user
以下を、DALL-E3に有効と思われるオプションと有効ではないオプションに分けてください。また、なぜそう分けられたのかの説明もお願いします。

(入力し忘れ……)

ChatGPT
DALL-Eの機能を最大限に活用するためには、画像生成時に適切なオプションを選択することが重要です。ただし、具体的なオプションのリストが提供されていないため、一般的なオプションとその有効性について説明します。

有効と思われるオプション

  1. 画像の解像度選択:

    • 例: 1024x1024、1792x1024など。
    • 理由: 用途に合わせた最適な解像度を選択することで、高品質な画像を生成できる。
  2. スタイル指定:

    • 例: 水彩画、油絵、デジタルアートなど。
    • 理由: 特定のスタイルを指定することで、望む芸術的効果や雰囲気を得られる。
  3. 色彩指定:

    • 例: 明るい色調、暗い色調、特定の色(青、赤など)。
    • 理由: 色彩の指定により、画像のムードやテーマをコントロールできる。

有効ではないオプション

  1. 非常に細かい詳細指定:

    • 例: 微細な背景の物体の配置や、非現実的な物理法則に従う要求など。
    • 理由: DALL-Eは驚異的な画像生成能力を持つが、非常に細かい指定や非現実的な要求に対しては予測不可能な結果を生む可能性がある。
  2. 著作権で保護されたキャラクターやブランドの直接的な言及:

    • 理由: 著作権や商標法に触れる可能性があるため、DALL-Eのポリシーではこのような指定は避けるべき。
  3. 過度に抽象的なコンセプト:

    • 例: 「宇宙の意味」などの哲学的または抽象的な概念。
    • 理由: 抽象的な概念は視覚的に具体化するのが難しく、期待通りの結果が得られない可能性がある。

これらの区分は、DALL-Eが持つ能力とその使用上の制約を考慮したものです。実際のオプションや使用する際の具体的な要求によって、何が有効で何が有効でないかは変わる可能性があります。

user
あなたが有効だと考えるオプション名をすべて箇条書きでお願いします。

ChatGPT
以下は、DALL-Eで有効だと考えるオプション名です:

  • 画像の解像度選択
  • スタイル指定
  • 色彩指定

user
それぞれをさらに細かくしてください。

ChatGPT
DALL-Eにおける有効なオプションをさらに細かく分類すると、以下のようになります。

画像の解像度選択

  • 1024x1024: 標準的な正方形の画像に適しています。
  • 1792x1024: ワイドな画像に適しており、風景や横長のシーンに最適です。
  • 1024x1792: 縦長の画像に適しており、フルボディのポートレートや縦長のシーンに最適です。

スタイル指定

  • 水彩画: 柔らかく透明感のある仕上がりにしたい場合に適しています。
  • 油絵: 豊かな質感と深みのある画像を生成したい場合に適しています。
  • デジタルアート: 現代的でクリーンな仕上がりを求める場合に適しています。
  • 鉛筆画: 細かいディテールと繊細なタッチを重視したい場合に適しています。

色彩指定

  • 明るい色調: 明るく活気のあるシーンを表現したい場合に適しています。
  • 暗い色調: 落ち着いた雰囲気やミステリアスなシーンを表現したい場合に適しています。
  • 特定の色の強調: 画像全体で一色を主体にしたい、または特定の色を強調したい場合に適しています。例えば「青を基調とした」と指定することが可能です。

これらのオプションを適切に組み合わせることで、目的に合った高品質な画像を生成することが可能です。オプションの選択は、求める画像の内容やスタイルに大きく依存します。

user
スタイル指定をさらに細かく

ChatGPT
スタイル指定において、より細かいカテゴリーに分けることで、DALL-Eに具体的なビジュアルスタイルを要求する際に役立ちます。以下は、スタイル指定の細分化例です。

伝統的な芸術スタイル

  • 印象派: 光の変化を捉え、動きとして表現する画風。クロード・モネやエドガー・ドガの作品が代表的です。
  • 表現主義: 感情や個人的な視点を強調した画風。エドヴァルド・ムンクの「叫び」などが有名です。
  • キュビスム: 物体を幾何学的な形に分解して描く画風。パブロ・ピカソやジョルジュ・ブラックの作品が知られています。
  • 超現実主義: 夢や無意識の世界を描く画風。サルバドール・ダリやルネ・マグリットの作品が代表的です。

現代のビジュアルスタイル

  • ポップアート: 大衆文化の主題を明るく、風刺的に表現するスタイル。アンディ・ウォーホルやロイ・リキテンスタインの作品が有名です。
  • ストリートアート: グラフィティや公共の場に描かれるアート。バンクシーやシェパード・フェアリーの作品が例です。
  • ミニマリズム: シンプルな形、限られた色彩、最小限のデザインに焦点を当てたスタイル。
  • デジタル抽象: コンピュータを用いて作成される、抽象的な形と色彩の組み合わせ。

技法に基づくスタイル

  • 水彩画: 水を使って薄めた顔料で描く、透明感のある画法。
  • 油絵: 油を混ぜた顔料で描き、豊かな質感と深みを出す画法。
  • 鉛筆画: 鉛筆を使用して細かいディテールや陰影を描く、繊細なタッチの画法。
  • 木版画: 木を彫ってインクを塗り、紙に押し付けて形を残す伝統的な印刷技術。

これらのスタイル指定は、DALL-Eによる画像生成時に、より具体的なビジュアル要求を伝えるために使用できます。これにより、生成される画像が期待により密接に合致する可能性が高まります。

user
色彩指定をさらに細かく

ChatGPT
色彩指定においてさらに細かく分類すると、以下のような指定が可能です。これらを具体的に指示することで、DALL-Eが生成する画像の色調や雰囲気をより細かくコントロールできます。

基本の色調

  • 明るい色調: 明るくポジティブな雰囲気を演出します。朝や春を連想させるシーンに適しています。
  • 暗い色調: 落ち着いた、あるいは不穏な雰囲気を演出します。夜や冬を連想させるシーンに適しています。

色温度に基づく指定

  • 暖色系: 赤、オレンジ、黄色などの暖かみのある色。温かい雰囲気や活動的なシーンに適しています。
  • 寒色系: 青、緑、紫などの冷たさを感じさせる色。落ち着いた雰囲気や静けさを表現するのに適しています。

特定の色での強調

  • 単色主体: 一色をメインにして、その色の様々なトーンで画像を構成します。例えば、青一色で様々な明るさや彩度の青を使う。
  • 補色でのコントラスト: 対照的な色を用いて、視覚的な魅力を高めます。例えば、青とオレンジのような補色関係にある色を使う。

感情や雰囲気に基づく指定

  • ロマンティック: ピンクや赤など、愛や情熱を象徴する色を用いた色調。
  • 神秘的: 深紫や濃い青など、未知や神秘を感じさせる色調。
  • 自然主義: 緑や茶色など、自然を感じさせる色を中心にした色調。

シーンやテーマに合わせた色彩

  • 海洋: 青やターコイズなど、海や水を連想させる色。
  • 森林: 緑や茶色、黄緑など、森や木々を連想させる色。
  • 砂漠: オレンジや黄色、ベージュなど、砂や乾燥した大地を連想させる色。

これらの色彩指定を使用することで、DALL-Eに対してより具体的なビジュアルイメージを指示し、意図した雰囲気やテーマを持つ画像を生成させることが可能になります。


 これは
  参考になりますね。

 よし、
  さらに
   うまくミックスしてもらおう。


user
スタイルや色彩をうまくミックスして、背景と女性を描く英文プロンプトを作成してください。その後、和訳。

ChatGPT

英文プロンプト

"Create an image of a woman standing in a serene forest during autumn. The woman is wearing a flowing, elegant dress that harmonizes with the surrounding autumn leaves. The style should blend impressionism with digital art techniques, showcasing soft, brush-like textures and vibrant colors. The color scheme is a mix of warm autumn tones, with rich reds, deep oranges, and golden yellows dominating the scene. The forest background is detailed with impressionistic brush strokes, creating a sense of depth and tranquility. The woman’s expression is contemplative and peaceful, reflecting the calmness of the forest."

和訳

秋の穏やかな森の中に立つ女性を描いてください。女性は、周囲の秋の葉と調和する流れるようなエレガントなドレスを着ています。スタイルは印象派とデジタルアート技術を融合させ、柔らかなブラシのような質感と鮮やかな色彩を表現します。色彩は、豊かな赤、深いオレンジ、黄金色の黄色がシーンを支配する温かい秋のトーンのミックスです。森の背景は印象派の筆跡で詳細が描かれ、深みと静けさの感覚を生み出しています。女性の表情は、森の静けさを反映して、思索的で平和です。


 そのまま、
  描画させようとすると
   初期段階でエラーが出て、
    再試行ボタンが出てくるので
     プロンプト生成と
      描画を段階的に指示。

 出力されたのがこちら。
  次が、リトライ。
Create_an_image_of_a_woman_standing_in_a_serene_fo.jpg
Create_an_image_of_a_woman_standing_in_a_serene_fo_new.jpg

 この記事が
  みなさんの
   作品制作の糧に
    なれば、幸いです。

 今回は、ここまで。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?