1
0

【ChatGPT有+DALL-E3】にもネガティブプロンプトはあるのか?

Posted at

 どうも、カーブミラーです。

 今回は、ほかの画像生成AIにはあるネガティブプロンプトはDALL-E3にあるのか?です。

本記事は、ChatGPT(有料版)
+DALL-E3で行なっております。
画像はありません。あしからず。

 先日、発覚したことですが、
  スマホアプリBingから、
   ImageCreatorが
    なくなりました。

 だから
  Copilotを
   立ち上げて〜の
    Designerを
     メニューから
      選択する形に。

 ImageCreatorは
  過去のものとなりました。

 私は、手間が掛かるので
  Copilotアプリを
   ダウンロードします。

 手順からすると、
  わざわざBingを
   立ち上げる意味が
    ありませんからね。

 つまり、
  検索エンジンとしてのBingは
   今後は、ChatGPTからの
    利用だけになります。

 スマホのアプリの位置も
  交代です。Bingは死蔵かな。


 まだ、
  本題ちゃうよぉw

 私は、スマホアプリ利用者です。

 Google Play ストア経由で
  ChatGPT Plusに課金しているわけ
   ですが、QRコード決済なので
    スマホにチャージを
     していなければ、
      支払いが滞って
       しまいます。

 もちろん、銀行口座からの
  チャージも可能ですが
   今のところ、私は手入金ですw

 先日、課金のことを
  うっかり忘れていて、
   請求メッセージが届き、
    慌てて、チャージしました。

 いつもは
  すでにチャージ済だったので
   すっかり頭から課金のことが
    消えていたのでした(汗)

 同じような人は
  少ないかとは思いますが
   お互いに気を付けましょう。


 さて、
  本題です。

 Midjourneyなどには
  ネガティブプロンプトがあります。

 ネガティブプロンプトとは
  画像生成の際に、
   描画して欲しくないことを
    生成AIに
     伝えるためのものです。

 DALL-E3にも
  ネガティブプロンプトは
   あるのでしょうか?

 もちろん、
  あります。

 ほかの生成AIのように
  明確に、入力枠が
   あるわけでは
    ありませんけどね。

 では、
  どのようにするのか。

 ChatGPTさんに
  尋ねてみました。


user
DALL-E以外の画像生成AIで、ネガティブプロンプトがありますが、DALL-E3にもそうしたものはありますか?

ChatGPT
DALL-E 3(またはDALL-Eの以前のバージョン)には、特定のネガティブプロンプトや機能制限を設けて不適切な画像の生成を防ぐ機能が組み込まれています。これは、著作権で保護されたキャラクターや人物、暴力的または不適切なコンテンツを生成することを避けるためです。OpenAIはDALL-Eの利用規約やポリシーを通じて、ユーザーが生成するコンテンツに対するガイドラインを提供しており、その中で特定のタイプのプロンプトや画像生成に制限を設けています。

これらの制限やガイドラインは、AIを用いた画像生成が社会的な責任を持って使用されることを確保するために設けられています。したがって、ユーザーがDALL-Eを使用する際には、これらのガイドラインに従って適切なプロンプトを提供する必要があります。また、DALL-E 2やDALL-E 3などのバージョンアップに伴って、これらの制限やガイドラインは時間とともに進化し、改善される可能性があります。

ただし、DALL-E以外の画像生成AIにおける具体的な「ネガティブプロンプト」の定義や例については、それぞれのAIシステムや提供元によって異なる場合があります。そのため、DALL-E以外のシステムを使用する場合には、そのシステムの具体的な使用条件やガイドラインを確認することが重要です。

user
DALL-E3の場合を知りたい。DALL-E3を用いる側の情報をください

ChatGPT
DALL-E 3に関する使用側の情報、特に機能制限や利用規約については、直接的に「DALL-E 3」という製品がOpenAIによって発表されているわけではありません。最新の情報としては、OpenAIがDALL-E 2をリリースし、その後、技術の進歩を反映したChatGPTやその他のAIモデルを提供しています。DALL-E 2は、テキストから高解像度の画像を生成する能力を持ち、多くの機能制限やガイドラインが設定されています。

DALL-E 2を使用する際には、次のようなガイドラインや制限が適用されます。これらはDALL-E 3またはその後のバージョンにも同様に適用される可能性が高いです。

  • 著作権で保護されたコンテンツの生成制限: ユーザーは、著作権で保護されたキャラクターやロゴ、著名人の肖像などを生成するようなプロンプトを避ける必要があります。
  • 倫理的・道徳的制限: 暴力的、不適切、または差別的な内容を含む画像の生成は禁止されています。
  • セキュリティとプライバシー: ユーザーが生成したコンテンツの扱いに関しては、プライバシーポリシーとセキュリティガイドラインに従う必要があります。

OpenAIはこれらのガイドラインを設定することで、AI技術の責任ある使用を促進し、不適切または有害なコンテンツの生成を防ぐことを目指しています。ユーザーは、これらのガイドラインに従い、創造的で責任ある方法でDALL-Eを使用することが期待されています。

特定の「DALL-E 3」に関する公式な発表や詳細情報を知りたい場合は、OpenAIの公式サイトや公式ブログをチェックすることをお勧めします。技術の急速な進化に伴い、新しい機能やポリシーの更新が頻繁に行われています。

user
ユーザーが画像生成の際に、ネガティブプロンプトとしての何かを書けるのかを知りたいです

ChatGPT
ユーザーが画像生成AI、特にDALL-Eのようなシステムを使用する際に、「ネガティブプロンプト」を使用することは可能ですが、その意図や内容には制限があります。ネガティブプロンプトとは、特定の要素を含めないように指示するプロンプトのことを指します。例えば、「猫がいない風景」のように、生成したい画像から特定のオブジェクトや要素を除外する指示です。

OpenAIのDALL-Eや他の画像生成モデルでは、生成する画像の内容をコントロールするために、プロンプトに含める情報を細かく指定することが奨励されています。これには、望まない要素を除外するためのネガティブプロンプトの使用も含まれます。ただし、以下の点に注意する必要があります:

  1. 倫理的・社会的規範の遵守:全てのプロンプトは、社会的に受け入れられる範囲内でなければならず、差別的、不快、または有害な内容を避ける必要があります。
  2. 技術的限界の理解:AIは指示されたプロンプトに基づいて画像を生成しますが、ネガティブプロンプトが常に完全に理解されるとは限りません。特定の要素を除外する指示は、AIの解釈やモデルの訓練データによって、期待通りの結果が得られない場合があります。
  3. 利用規約とガイドラインの遵守:DALL-Eを含む多くの画像生成AIサービスは、利用規約やガイドラインを設けています。これらの文書は、どのようなプロンプトが許可され、どのようなものが禁止されているかについての詳細を提供します。

ユーザーがネガティブプロンプトを使用して画像を生成する場合、これらの規範とガイドラインを尊重し、技術の限界を理解することが重要です。また、生成された画像が意図したものと異なる場合は、プロンプトの表現を調整して再試行することが推奨されます。

user(勘違いされてるので)
ユーザーがネガティブプロンプトを使う方法を教えてください。別にシステム側のコンテンツポリシーを無視しろ、という話ではありません。これこれこういうものは描画しないで欲しい、という意図での使用です。そこは間違えずに、理解してください。

ChatGPT
ユーザーが画像生成AI、例えばDALL-Eを使用して、特定の要素やオブジェクトを「描画しないで欲しい」という意図でネガティブプロンプトを使う方法について説明します。このアプローチは、生成される画像から特定の内容を除外したい場合に有用です。以下に、ネガティブプロンプトの使い方に関するガイドラインを示します。

1. 明確な指示を提供する

  • 明確性:生成したい画像の内容をできるだけ詳細に記述し、除外したい要素についても具体的に指定します。例えば、「犬が遊ぶ公園の風景を描いてください。猫は描かないでください」というプロンプトは、猫を除外するという明確な要望を伝えます。

2. 否定形を使用する

  • 否定形の活用:「〜ないでください」「〜を含まないでください」など、除外したい要素を指示する際には否定形を使って表現します。これにより、AIに対して特定のオブジェクトや特徴を画像から排除するよう指示できます。

3. 代替案を提案する

  • 代替案の提供:除外したい要素の代わりに何を描画するかを提案することも有効です。これにより、AIが空白のスペースをどのように埋めるべきかについてのガイダンスを受け取れます。

4. 試行錯誤を重ねる

  • 調整と再試行:最初の試みで望んだ結果が得られない場合は、プロンプトの表現を微調整して再度試みます。AIの解釈はプロンプトの表現に敏感であり、小さな変更が結果に大きな違いを生むことがあります。

以下に、ネガティブプロンプトの使用例を示します。

  • 望まない: 「青空の下の山の風景。ビルや工場は描かないでください」
  • 望ましい: 「青空の下の自然な山の風景を描いてください。人工的な建造物やビル、工場は含まないでください」

この方法により、ユーザーはAIによる画像生成プロセスにおいて、望まない要素を避けつつ、具体的なビジョンを実現できます。重要なのは、プロンプトがAIのガイドラインや社会的規範に適合していること、そして望まない要素を除外する意図が明確であることです。

user
これらの方法を使っても、描画されてしまう場合は、どうすればいいですか?

ChatGPT
AIによる画像生成で、ネガティブプロンプトを使用しても望まない要素が描画されてしまう場合は、以下のステップを試してみてください:

1. プロンプトの精度を高める

  • より具体的に: 望まない要素に関する指示をさらに具体化します。AIが指示を誤解しやすい場合、より明確かつ詳細にプロンプトを書き換えることが役立ちます。
  • 文脈を追加: 除外したい要素の理由や、その要素がない状況を描写することで、AIにより良い理解を促すことができます。

2. 代替プロンプトの使用

  • 異なる表現を試す: 同じ意図を異なる言葉で表現してみます。AIが特定のフレーズの意図を誤解する可能性があるため、異なる表現を試すことで改善される場合があります。

3. フィードバックを利用する

  • フィードバックを送る: 多くのAI画像生成サービスでは、ユーザーからのフィードバックを歓迎しています。生成された画像が期待に沿わない場合、そのフィードバックを提供することで、将来のアルゴリズムの改善に役立てることができます。

4. 複数の試行

  • 異なる試行: 一度に複数の異なるプロンプトを使用して画像を生成し、その中から最も望ましい結果を選択します。このアプローチは、特にAIの挙動が予測しにくい場合に有効です。

5. 手動での編集

  • 後処理: 望まない要素が含まれてしまった画像については、画像編集ソフトウェアを使用して手動で修正することも一つの解決策です。これにより、最終的な画像から特定の要素を取り除くことができます。

6. サービスプロバイダーへの問い合わせ

  • サポートに連絡: 何度試しても望む結果が得られない場合、使用しているサービスのカスタマーサポートやヘルプデスクに相談することも一つの選択肢です。彼らはプロンプトの改善提案や、サービスの特定の制限に関するアドバイスを提供できる場合があります。

AIによる画像生成は複雑で、時に予測不可能な結果をもたらすことがあります。しかし、上記のアプローチを通じて、より望ましい結果を得る可能性を高めることができます。


 ふむふむ。

 ところで、
  DALL-E3は
   なぜネガティブプロンプト用の
    入力枠を用意しなかった
     のでしょうか?


user
ほかの画像生成AIでは、明確な入力枠があります。でもDALL-E3にはありません。なぜですか?

ChatGPT
現時点での私の知識によれば、具体的に「DALL-E 3」という製品がOpenAIからリリースされたという情報はありません。OpenAIがリリースした最後のバージョンはDALL-E 2であり、その後のアップデートや新バージョンに関する情報は公開されていません。そのため、DALL-E 3に関する特定の機能やインターフェースについて話すことはできません。

しかし、一般的に画像生成AIのインターフェースや入力枠に関する設計選択については、次のような理由が考えられます:

  1. ユーザビリティとアクセシビリティ:ユーザーが直感的に理解しやすいインターフェースを提供することで、さまざまな技術的背景を持つユーザーが容易にアクセスし、使用できるようにするためです。
  2. 柔軟性:単一のテキスト入力欄を提供することで、ユーザーが創造的で柔軟なプロンプトを入力できるようにし、AIの潜在能力を最大限に引き出すことを目指しています。これにより、ユーザーはより自由な形式で自分の意図を表現できます。
  3. 技術的制約と優先順位:AIの開発と設計には、技術的制約やリソースの割り当て、さまざまな機能やユーザー要望に対する優先順位付けが関係します。OpenAIは、ユーザーからのフィードバックや使用状況の分析に基づき、最も有用で利用価値の高い機能を優先的に開発している可能性があります。

DALL-E 2の場合、シンプルなテキスト入力を介してユーザーがプロンプトを提供することで、幅広い創造的な要求に対応しています。ユーザーが特定の要素を含めたり除外したりする要求を行う場合、テキストプロンプト内でその指示を明確にすることが求められます。

将来的にAI画像生成技術が進化し、ユーザーインターフェースや機能に新たな変更が加えられる可能性があります。これにより、より詳細な入力オプションや、ユーザーの意図をより正確に反映する機能が提供されるかもしれません。最新の情報については、OpenAIの公式ウェブサイトや発表を参照することが重要です。


 ということで、
  DALL-E3でも
   ネガティブプロンプトは
    使えるけれど、
     それは指示プロンプトに
      書き込むことで済む、
       ということのようです。

 でも、
  これまでも
   書き込んだけど、
    描画されました。

 それは
  私が何度も経験しています。

 記事にも書きました。

 でも、よくよく思い返すに
  明確に、指示プロンプトと
   ネガティブプロンプトを
    分けたことはありません。

 ここで
  ChatGPTの制限が
   来てしまいましたw

 次回は、
  そこを書こうと
   思います。

 これが
  みなさんの
   作品制作の糧に
    なれば、幸いです。

 今回は、ここまで。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0