0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【ChatGPT+DALL-E3】に指示するためのボキャブラリーが足りないと感じました。

Posted at

 どうも、カーブミラーです。

 今回は、指示するためのボキャブラリーが足りないと感じました。前々からですけどねぇw

本記事は、ChatGPT(有料版)
+DALL-E3で行なっております。
画像はあります。 あしからず。

 まずは、ニュース。

 Anthropicから
  iOSのClaudeアプリが登場。

 すべてのモデルを
  使用できるそうです。

 なお、iOSの17.0以降推奨です。

 “Androidは、まだ?”
  少なくともAnthropicからは何も。


 OpenAIの
  サイトがリニューアルしました。

 ChatGPT体験版への
  アクセスがすぐにできるように
   なっています。

  ただ、すでにログインしていると
   体験版ではなく、
    ログインしているバージョンに
     飛んでしまうので
      注意してください。

 私はスマホなので
  たいしたことは
   わかりませんが、
    パソコンならば
     メニューなども
      見やすくなっている
       ようですよ。


 では、
  本題です。

 タイトルにも書いたんですけど、
  指示するためのボキャブラリーが
   足りないと感じました。

 前々からなんですが、
  特にポーズの取らせ方が
   問題になっています。

 とりあえず、
  やり取りをどうぞ。


user
画像生成AIへの指示をする際のことで、ボキャブラリーが足りない、と感じています。

ChatGPT
画像生成AIへの指示を効果的に伝えるためには、具体的で詳細な説明が重要です。ここでいくつかのアドバイスを紹介します。

  1. 具体的な詳細: 画像に何を含めたいか、具体的に述べます。例えば、「ビーチで日焼けしている人」よりも、「サングラスをかけた若い女性が青い海と白い砂浜のビーチでリラックスしている」といった具体的な描写が望ましいです。

  2. 色や形: 特定の色や形を指定してください。たとえば、「赤いドレスを着た女性」や「丸い形の青いプール」といった具体的な要素が役立ちます。

  3. 動作や感情: 人物がどんなポーズを取っているか、どんな感情を表現しているかを述べます。例えば、「笑っている子供」や「手を振るビジネスマン」など。

  4. 環境や背景: 画像の背景に何があるべきかを説明します。たとえば、「山が背景にある湖」や「都市の夜景」といった背景が挙げられます。

  5. 光と影: 光の方向や強さ、影の使い方についても指定できます。例えば、「夕日の光を浴びる女性」や「ランプの光が強調された暗い部屋」など。

これらの点を踏まえて、画像のリクエストをするときは、できるだけ多くの情報を提供することが、思い通りの画像を得るための鍵となります。

user
人物がどんなポーズを取っているか、をどのように指示したらいいですか? ボキャブラリーが少なくて困っています

ChatGPT
人物のポーズを指示するためには、基本的なアクションや体の動きを表現する語彙が役立ちます。以下はいくつかの例です:

  1. 立っている、座っている、横になっている: これらは基本的な姿勢です。例えば、「椅子に座って本を読んでいる女性」や「草の上で横になり、空を見上げている男性」など。

  2. 手を使って: 「手を振っている」、「両手を上げて喜んでいる」、「顔に手を当てて考えている」など、手の動きを加えるとポーズに生活感が出ます。

  3. 足の位置: 「片足を前に出して立っている」、「膝を曲げて座っている」など、足の位置を指定することで、ポーズにダイナミクスを加えることができます。

  4. 向きや視線: 「カメラを見直すように前を向いている」、「上を向いて空を見ている」など、人物の向きや視線を指定します。

  5. 表情: 「笑っている」、「驚いている」、「考え込んでいる」など、表情を加えるとポーズに感情が込められます。

  6. 動的なポーズ: 「走っている」、「ジャンプしている」、「ダンスをしている」など、より活動的なポーズを使うこともできます。

これらの基本的な表現を組み合わせて、具体的なシナリオを作り上げることで、AIに対してより明確なビジュアル指示を伝えることができます。また、実際に人物のポーズを見ることで学ぶこともお勧めします。写真やアート作品、映画などで見るポーズを参考にすると、さらにボキャブラリーが豊かになるでしょう。

user
写真やアート作品、映画などでは、シーンは思い浮かんでも、それを言葉にできません

ChatGPT
シーンを言葉に表現する際には、視覚的なイメージを言語化するスキルが必要ですが、慣れれば効果的に伝えることができます。以下に、具体的なシーンを言葉にする手順をいくつか紹介します:

  1. シーンの主要な要素を特定する: 何が画像の中心的なポイントかを考えます。たとえば、「人物、物、背景」の3つに分けて考えると良いでしょう。

  2. アクションを明確にする: 人物が何をしているのか、動作や活動を具体的に説明します。例えば、「歩いている」、「話している」、「食事をしている」など。

  3. 感情や雰囲気を加える: シーンに感情や特定の雰囲気があれば、それを表現します。例えば、「落ち着いた雰囲気のカフェ」、「緊張感のある会議室」など。

  4. 詳細を具体化する: 色、形、サイズ、テクスチャなど、視覚的な詳細を追加します。これにより、シーンがよりリアルに、具体的に感じられるようになります。

  5. 言葉を選ぶ: 描述する際に使う語彙を選びます。シンプルな言葉でも良いので、分かりやすく表現します。

例を挙げると、映画の一場面を次のように説明できます:
「雨が降る夜の街角で、黒いコートを着た男性が、路上の電灯の下で新聞を読んでいる。彼の周りはほとんど人がおらず、場面には静けさと孤独感が漂っている。」

この方法で練習を重ねることにより、徐々に言葉で表現するスキルが向上していきます。また、実際に文章を書いてみることで、どのような表現が自分にとって書きやすいか、どのような表現が伝わりやすいかを発見することができます。

user
パルクールなどのポーズは、どのように画像生成AIに指示すればいいですか?

ChatGPT
パルクールのような動的なアクションを含むポーズを画像生成AIに指示する場合、以下のように具体的なディテールを提供すると効果的です:

  1. 基本的なアクションの説明: パルクールのアクションを具体的に説明します。例えば、「壁を駆け上がる」、「跳び越える」、「宙返りをする」など。

  2. 人物の特徴: アクションをしている人物の外見や服装も詳しく説明します。例えば、「筋肉質の若い男性が、タンクトップとショートパンツを着ている」など。

  3. 環境の描写: パルクールが行われている環境を具体的に描写します。例えば、「都市の公園で、背景に高いビルが見える」、「廃墟のような場所で、壁が崩れかけている」など。

  4. 動きの方向とエネルギー: アクションの動きの方向やエネルギーを表現します。例えば、「力強く壁を蹴って空中へ跳び上がる」など。

  5. 表情や感情: 行動中の表情や感情も加えると、画像に生命を吹き込むことができます。例えば、「集中している表情」、「楽しんでいるように見える笑顔」など。

具体的な例としては、次のような指示が考えられます:
「若い男性が、都市の公園でパルクールをしているシーン。彼は黒いタンクトップと赤いショートパンツを着ており、高い壁を力強く駆け上がっている。背景には高層ビルと緑豊かな木々が見え、彼の表情は集中していて、動きにはダイナミックなエネルギーが感じられる。」

このような指示を用いることで、AIに対して具体的かつ明確なビジョンを伝えることができ、思い通りの画像を生成する確率が高まります。
(具体例を描画)
A_young_man_is_practicing_parkour_in_an_urban_park.jpeg

user
“高い壁を力強く駆け上がっている”というシーンのはずですが、壁の上を走っているシーンにしかなりません。

ChatGPT
壁を駆け上がっているシーンを正確に画像生成AIに伝えるには、さらに詳細な指示が必要になります。以下のように表現を調整することで、望むシーンをより正確に反映させることができます:

  1. 動作の描写を具体化: 「壁を駆け上がっている」という動作を「一歩一歩壁に足をかけながら上に登っている」など、具体的に動きを描写します。

  2. 体の位置と角度: 動作中の体の位置や角度を具体的に述べます。例えば、「体を壁に対して斜めに傾けて、足で壁を蹴りながら上へと力強く昇っている」といった表現が有効です。

  3. 手と足の位置: 登っている最中の手や足の位置も具体的に述べます。「両手を壁につけ、右足を壁にかけて体を押し上げている」といった具体的な描写が、シーンのダイナミズムを強調します。

  4. 表情や目線: 努力や集中を表す表情、「目線は壁の上を見据えている」などの詳細を加えると、シーンにリアリティが増します。

これらのポイントを踏まえた例文を以下に示します:
「若い男性が、都市のコンクリートの壁を力強く駆け上がっているシーン。彼は体を斜めに傾け、右足で壁を蹴り上げながら、両手を壁につけて上に登っている。彼の表情は集中しており、目線は壁の頂上を見据えている。背景には高層ビルと薄暗い空が広がっている。」

このような具体的な指示を用いることで、AIは壁を駆け上がっているシーンをより正確に生成することができるでしょう。
(例文を描画)
A_young_man_powerfully_sprinting_up_a_city_concret.jpeg

user
壁を駆け上がるシーンになりました。
ちなみに、こうした身体の動きや位置を言葉にするためのツールはありませんか?

ChatGPT
身体の動きやポーズを言葉にするのに役立つツールやリソースはいくつか存在します。以下に代表的なものをいくつか紹介します:

  1. アニメーションとポーズの辞典: 特定のポーズや動作を表現するのに役立つ専門の辞典やガイドがあります。これらはアーティストやイラストレーター向けに詳細なポーズが記載されていることが多いです。

  2. 3D モデリングソフトウェア: BlenderやPoserのような3Dモデリングツールを使用すると、自分でキャラクターのポーズを作成し、それを様々な角度から見ることができます。これにより、動きを正確に把握し、言葉での説明がしやすくなります。

  3. ポーズリファレンスサイト: QuickposesやPosemaniacsのようなサイトでは、様々なポーズのリファレンス写真を見ることができます。これらのサイトは、特定のポーズをどのように表現するかの参考になります。

  4. モーションキャプチャライブラリ: 多くの映画製作会社やゲームデベロッパーが使用するモーションキャプチャデータを公開しているリソースもあります。これらのデータは、人間の動きを理解するのに役立ちます。

  5. 図解や解剖学の本: 人体の動きを学ぶためには、解剖学や生物学の知識が非常に有効です。「人体の動きのアトラス」のような本は、関節や筋肉がどのように動くかを理解するのに役立ちます。

これらのツールやリソースを活用することで、ポーズや動作を言葉で表現する際の精度を高めることができます。また、実際に視覚的な例を見ながら学ぶことで、より具体的でリアルな表現が可能になるでしょう。


 このあとも
  ポーズと言葉が対になった
   本なりツールなどを
    尋ねてみましたが、
     出てきませんでした。

 本屋でも
  そのような書籍は
   ありませんでした。

 つまり、
  ポーズは、
   身体の部分部分を
    どうするのかを
     詳細に指示していく
      必要があるようです。

 だから
  落書きでポーズを示して
   描いてもらう、というのが
    一番の早道になって
     しまうわけです。
      絵心があれば。

 どちらにせよ、
  手間が掛かるのは
   仕方ありませんね。

 みなさんの
  作品制作の糧に
   なれば、幸いです。

 今回は、ここまで。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?