1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【ChatGPT有とClaude 3 Sonnet】写真を解析させて、DALL-E3に描画させるまで

Posted at

 どうも、カーブミラーです。

 今回は、GPT-4VisionとClaude 3 Sonnetに、写真を解析させて、DALL-E3に描画させるまでをやります。どこまで寄せられるでしょうか。

本記事は、ChatGPT(有料版)
+DALL-E3で行なっております。
画像はあります。 あしからず。

 最初から
  本題です。
   ニュースは
    それなりにあったんですけど
     それなりなので
      今回はありませんw

 さて、
  Claude 3 Sonnetについては
   どの程度、ご存知でしょうか。

 Claudeは、
  Anthropic社という企業が
   開発・運営している生成AIです。

 Anthropicが
  先日、Claude 3を発表して
   話題になっています。

 そこで今回は
  ChatGPT(GPT-4Vision)と
   画像解析で、どこまで
    やれるのかをチェック
     しようと思います。
      画像生成は
       できませんので。

 本当はほかの生成AIを
  使おうと思ったのですが、
   Google Geminiは
    人物画僧には対応していなく、
   MS-Copilotは
    顔をモザイクにして
     解析してしまいました。

 だから
  Claudeを
   対象に選んだ、
    というわけです。


 では
  さっそくやっていきましょう。

 まず
  与える画像を
   紹介します。
IMG_20230323_090745548.jpg

 こちらは
  隔週発売している
   ヤングガンガンに
    連載している福田晋一氏の
  『その着せ替え人形は恋をする』
   という作品のメインキャラの
    “北川海夢(マリン)”です。

 少し前に
  展示会があり、
   そこで撮影したパネルです。

 まずは
  画像をアップして
   “解析してください。”と送信。


ChatGPT
この画像はアニメのキャラクターの等身大パネルで、キャラクターはロングヘアにベレー帽、タンクトップ、デニムスカート、そして魚網タイツを着用しています。背景にはいくつかの日本語テキストがありますが、詳細は小さすぎて読み取れません。パネルは展示またはイベントの一環であるように見えます。

Claude
この画像は、アニメやゲームキャラクターの大きなパネル広告を示しています。長い金髪の女性キャラクターが躍動的なポーズで描かれており、スケートのような靴を履いた足から、ミニスカートスタイルの服装が見て取れます。背景には緑のドアや煉瓦の壁があり、下部には展示会の詳細情報が日本語で記載されています。全体的にポップでカラフルなイラストスタイルで、アニメやゲームファンを対象とした宣伝広告パネルのようです。キャラクターのデザインやポーズから、エネルギッシュでスポーティな雰囲気が伝わってきます。


 どちらかというと
  Claudeの方が
   良さげですね。

 では
  次に
   私が以前に記事にした
    解析プロンプトを
     使うととうなるか。

 ちなみに
  あれから
   改良しまして
    中途半端で出すのを
     控えております。
      アップはご容赦ください。

 まずは
  新しいセッションを開き、
   画像と解析プロンプトをアップ。


ChatGPT
背景の分析:

  • 背景には黄緑色のタイルが壁に貼られている。
  • 左上には暗緑色のドアが見える。
  • キャラクターのスタンディが置かれている台には、白地に灰色の枠で囲まれた情報が記載されたプレートが二つある。
  • 右側のプレートにはQRコードが二つ、左側のプレートにはテキストと何らかのイラストや写真が含まれている。

被写体の分析:

  • フルカラーで描かれた若い女性のキャラクターがスタンディ形式で表示されている。
  • キャラクターは長い金髪で、毛先にはオレンジ色がかっている。
  • 黒いキャップをかぶり、黒のクロップトップと青のデニムスカートを着用している。
  • 腰に巻いた白いシャツ、網タイツ、そして黒のブーツが特徴的。
  • 耳には大きな輪のイヤリングを着用しており、顔には明るい表情が見られる。
  • キャラクターはリュックサックを肩にかけており、ポーズは躍動感があり、軽やかに歩く様子が表現されている。

画風:

  • この画像はアニメスタイルのイラストで、日本のアニメやマンガで一般的なビジュアルスタイルを持っている。
  • 線はクリアで滑らかで、色は鮮やかで明るい。

Claude
この画像は、アニメやマンガのキャラクターを主体としたイラストです。背景、被写体、そして画風について、以下のように詳しく解析できます。

背景の特徴:

  • レンガ造りの壁が見られる
  • 緑色の木製のドアがある
  • 下部に展示会の案内が掲示されている

被写体の特徴:

  • 長い金髪の少女キャラクター
  • 赤い目をした愛らしい表情
  • 黒い布地のトップス
  • 短い青いスカート
  • 網タイツを履いている
  • 黒い長靴を履いている
  • 活発で無邪気なポーズ
  • 鮮やかでコントラストの強い色使い

画風の特徴:

  • アニメ調の萌えイラストスタイル
  • キャラクターのデフォルメがされた可愛らしいデザイン
  • 線画が太く、色鮮やかで平面的
  • 影や陰影はシンプルに表現されている
  • 全体的にポップでカラフルな印象

 それぞれの
  特徴がありますね。

 では
  プロンプトに
   まとめてもらいます。


user
上記を画像生成AIに渡せるように、まとめ直して、プロンプトにしてください。
英文プロンプト出力。
プロンプトを和訳。
描画なし。

ChatGPT
Sure, here's a prompt for an image generation AI based on the description provided:

"Create an illustration of a vibrant young woman in an anime style. She has long golden hair with hints of orange at the tips and wears a black cap. Her outfit consists of a black crop top, a blue denim skirt, and a white shirt tied around her waist. She has fishnet tights and black boots with chunky soles. Her accessories include large hoop earrings. She carries a backpack over one shoulder and has a cheerful expression on her face. The character's pose should convey movement and lightness, as if she is walking gracefully. The background includes greenish-yellow tiled walls and a dark green door. In the foreground, there are informational placards with grey borders, QR codes, and some text and images."

和訳:
"アニメスタイルの活気に満ちた若い女性のイラストを作成してください。彼女は先端にオレンジ色がかった長い金髪と黒いキャップをしています。服装は黒のクロップトップと青のデニムスカート、腰には白いシャツを巻いています。網タイツと厚底の黒いブーツを履いています。アクセサリーには大きなフープイヤリングをしています。彼女は一方の肩にバックパックをかけ、明るい表情をしています。キャラクターのポーズは動きと軽やかさを伝えるように、優雅に歩いているかのようにする必要があります。背景には黄緑色のタイル壁と暗緑色のドアがあります。手前には灰色の枠で囲まれた情報プレート、QRコード、テキストと画像があります。"

Claude
英文プロンプト:

Generate an anime-style illustration of a cute girl with long blonde hair and red eyes. She is wearing a black top, short blue skirt, patterned tights, and black boots. Her expression is lively and innocent. The background is a brick wall with a green wooden door. There is a poster or flyer visible at the bottom advertising an event or exhibition. The art style should be vibrant and colorful, with bold linework, flat shading, and a moe/deformed aesthetic typical of anime character designs.

プロンプトの和訳:

長い金髪と赤い目の可愛い女の子のアニメ調イラストを生成してください。彼女は黒いトップス、短い青いスカート、模様入りタイツ、黒い長靴を着用しています。表情は活発で無邪気です。背景はレンガ造りの壁で、緑色の木製のドアがあります。下部には展示会やイベントを宣伝するポスターやチラシが見えます。アートスタイルは鮮やかでカラフルで、太い線画、フラットな陰影、アニメキャラクターデザインに典型的な萌えやデフォルメの美学があります。


 最後に
  まとめてもらったプロンプトで
   描画してもらいます。

 Claudeは、
  画像生成の機能が
   ありませんので、
    ChatGPTのDALL-E3さんに
     やってもらいます。

 結果がこちら。
1710122841697.jpg
1710122851254.jpg

 まぁ、
  特徴は
   捉えていますが
    ポーズや画風は別として、
     良さげなのは
      ChatGPTさん側ですね。

 最後に
  リアルに描画してもらいます。
1710122831112.jpg
1710122803376.jpg

 やはり
  ChatGPTさん側ですね。

 まぁ、
  たまたまかも
   しれません。

 どちらも
  一度だけの
   試みなので、
    もしかしたら
     逆転するかも
      しれませんね。

 ただ、
  場合にもよるのでは
   ないかとも思います。

 今回は
  解析プロンプトが
   Claudeに合わなかった、
    という可能性が
     あります。

 Claudeの開発者は
  もともとOpenAI社で
   働いていたので
    内部的には
     GPTです。

 開発されて
  それなりの時間が
   経過していることを考えれば、
    両者の違いは、
     顕著になります。

 そこを
  考慮して
   Claudeに合わせた
    プロンプトを用意すべきかも
     しれませんね。

 これらのことが
  みなさんの
   作品制作の糧に
    なれば、幸いです。

 今回は、ここまで。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?