どうも、カーブミラーです。
今回は、ChatGPTアプリを無料版のアカウントで使います。そして、画像解析できるのかをチェック。以前はできませんでした。
本記事は、ChatGPTアプリを
無料版アカウントを使って、
行なっております。あしからず。
さっそく、本題です。
無料でも
GPT-4oが使える、という話が
ありまして、ちょっと確認します。
まずは、
モデルは何かを確認します。
ちなみに
Android版アプリを使用しますね。
右上の“︙”をタップして
“詳細を表示します”を出します。
“Dynamic”モードなので
ChatGPTがPromptの内容で
モデルを変更する状態だと
わかります。
セッションに戻り、
ラストナレッジカットオフを
聞くと、
“最終更新日は2023年10月”
と答えました。
これはGPT-4oですね。
では次に、
使えるサービスを
尋ねます。
user
あなたが自身で使えるサービス(画像生成AIなど)を教えてください
ChatGPT
私が利用できるサービスやツールについて説明します。以下のリストは、現在の機能に基づいています。
1. ブラウザツール
- 検索と閲覧: インターネット検索を行い、最新の情報を収集できます。これにより、リアルタイムの情報やニュース、特定のトピックに関する詳細を提供できます。
2. Pythonコード実行
- データ分析: 数値データの処理や分析を行うことができます。これには、統計計算、データ可視化、数値シミュレーションなどが含まれます。
- ファイル操作: CSVやJSONファイルの読み書き、データベースクエリの実行が可能です。
3. ファイル管理
- ファイルのアップロードとダウンロード: ユーザーがアップロードしたファイルを解析したり、処理結果をダウンロードできるようにしたりします。
4. 画像の読み取りと解析
- OCR機能: アップロードされた画像からテキストを抽出することができます(光学文字認識)。
- 画像解析: 画像の内容を説明したり、画像に含まれる要素についての情報を提供します。
現在利用できない機能
- 画像生成: 私自身は画像生成AI(例えば、DALL-Eなど)を直接操作することはできません。
- 外部APIの呼び出し: リアルタイムでの外部APIを直接呼び出すことはできません。
これらのツールを組み合わせることで、多様なリクエストに対応できます。具体的なリクエストがあればお知らせください。それに応じて最適なツールや手法を提案いたします。
ここに
GPTsも含まれますね。
ただ、GPTsでも
外部APIを呼び出している場合、
上記のように、使えません。
さて、本題です。
画像解析が行なえる、と
いうことなので、やってみます。
ChatGPT
この画像には、非常に洗練されたビジネスカジュアルな装いをした若い女性が映っています。彼女はオフィスのような設定に座っており、控えめな笑みを浮かべています。以下に、画像の詳細を解析します。
ファッションとスタイル
-
服装:
- 彼女はキャメル色のダブルブレストのジャケットを着ています。ジャケットには金色のボタンが付いており、フォーマルさとエレガンスを兼ね備えています。
- 彼女の首には青いスカーフが巻かれています。スカーフはシンプルでありながら、全体のコーディネートにアクセントを加えています。
- キャメル色のハイウエストスカートを履いています。このスカートはジャケットと色を合わせており、統一感があります。
-
アクセサリー:
- 小ぶりのイヤリングを着けています。シンプルで洗練されたデザインであり、全体のスタイルを邪魔しない程度のアクセントとなっています。
外見と表情
-
ヘアスタイル:
- 髪はストレートにセットされ、自然な光沢があります。髪は肩のあたりまで垂れ下がっており、清潔感とプロフェッショナルな印象を与えています。
-
メイク:
- メイクはナチュラルであり、肌の美しさを引き立てています。リップは控えめな色合いで、全体のバランスを保っています。
-
表情:
- 彼女の表情は穏やかで、自信に満ちています。カメラに向けてまっすぐ座り、落ち着いた雰囲気を醸し出しています。
背景と環境
-
場所:
- 彼女が座っているのはおそらくオフィスや会議室のような室内です。背景には淡い色合いの壁とカーテンがあり、シンプルでありながらも高級感があります。
-
家具:
- 彼女が座っている椅子はベージュ色で、シンプルかつ上品なデザインです。全体のインテリアも彼女のスタイルにマッチしています。
この画像からは、彼女がプロフェッショナルな場面で働く人物であり、ファッションにも気を使っていることがうかがえます。全体的に落ち着いた色合いとシンプルなデザインが特徴であり、彼女の自信と洗練されたセンスが感じられます。
おお、確かに解析できました👍
内容も、ほぼほぼ合っています。
ちなみにMS-Copilotでも
やってみましたが、
あちらは人物の顔を
モザイク加工してからの
解析になりますので
解析内容が
少ないです。
なぜ
モザイクにするかと言いますと
フェイク画像の防止策
なんですね😅
それはともかく、
無料版を使うユーザーでも
画像解析ほかを使えるわけです。
これを使えば
こういうことも可能です。
user
上記から、DALL-E3に渡すための指示Promptを作成してください。
ChatGPT
Sure, here's a detailed prompt you can use for DALL-E 3 to recreate an image similar to the one you provided:
Create an image of a sophisticated young woman sitting in an office setting. She is dressed in business casual attire. Her outfit includes a camel-colored double-breasted blazer with gold buttons, a matching high-waisted skirt, and a blue neck scarf. She is wearing small, elegant earrings. Her hair is straight, shiny, and falls naturally to her shoulders. Her makeup is natural, highlighting her flawless skin and featuring a subtle lip color. She is seated on a beige chair, exuding a calm and confident demeanor, with a gentle smile. The office background should have light-colored walls and curtains, contributing to a refined and professional atmosphere.
user
和訳して
ChatGPT
もちろん、こちらがその指示の和訳です:
オフィス環境で座っている洗練された若い女性の画像を作成してください。彼女はビジネスカジュアルな服装をしています。服装は、金色のボタンが付いたキャメル色のダブルブレストジャケット、マッチするハイウエストスカート、そして青いネックスカーフを含みます。彼女は小ぶりで上品なイヤリングをしています。髪はストレートで光沢があり、自然に肩まで垂れています。メイクはナチュラルで、肌の美しさを引き立てる控えめなリップカラーが特徴です。彼女はベージュ色の椅子に座っており、落ち着いた自信に満ちた表情で、優しい微笑みを浮かべています。オフィスの背景には淡い色合いの壁とカーテンがあり、洗練されたプロフェッショナルな雰囲気を醸し出しています。
このPromptを
MS-Copilotに渡せば、
描画してくれます。
Geminiは人物画像を
描画拒否します😅
ちなみに
上記Promptでは
黒人ではなく、
ヨーロッパ系の白人女性が
出てきてしまいました。
解析で、
人種については
出てきていなかったためですね。
つまり、
最初に、人種についても
尋ねるべきでした。
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。