More than 1 year has passed since last update.

【ChatGPT】【Bing＋ImageCreator】GPT-4Visionはまだないけど、疑似体験してみよう。

Last updated at 2023-10-13Posted at 2023-10-08

　どうも、カーブミラーです。

　今回は、GPT-4Visionがまだ届かない、あるいは課金していないから使えない方に、事前練習や疑似体験ができる方法を提示します。

本記事は、
　ChatGPTは使っていません。
　　あしからず。

　GPT-4Visionは、
　　なかなかの盛り上がりを
　　　見せていますね。

　先日、
　　YouTuberかわごんさんの
　　　ところで行なった勉強会は、
　　　　まさにGPT-4Visionでした。

　そのようすは、
　　You Tube動画として
　　　アップされています。
【2023/10/05】かわごん勉強会：ChatGPTに画像でプロンプト

　私の声も録音されていて、
　　少し恥ずかしく感じますね。
　　　言っておきますけど、
　　　　私は男ですw

　ChatGPTアプリの
　　音声会話についても
　　　かわごんさんが
　　　　動画をアップ
　　　　　されています。
【ChatGPT】音声マルチモーダルAI：スマホアプリの新機能搭載

　今回は、
　　画像について、
　　　書いていきますね。

　かわごんさん勉強会は、
　　以前から、やっていました。
　　　でも、録音したのは、
　　　　初めてなので、
　　　　　ちゃんと録音
　　　　　　できているかと
　　　　　　　不安でしたねw

　それはともかく、
　　はじめましょう。

　GPT-4Visionの画像関係は、
　　画像を入力して、
　　　解析させることと、
　　　　DALL-E3で出力させること
　　　　　の双方向ができます。

　あっ、出力させるDALL-E3は
　　別口で、機能開放させる
　　　ようです。
　　　　まだまだ先のようですね。

　今回の目的は、
　　GPT-4Visionの
　　　事前練習や疑似体験を
　　　　することです。

　使うのは、
　　Microsoft Bingと
　　　Microsoft Image Creatorです。

　ご存知のとおり、
　　Microsoft Bingは、GPT4であり、
　　　すでに画像入力が可能です。

　Image Creatorについては、
　　ご存知かわかりませんけど、
　　　中身は、DALL-E3です。

　つまり、
　　GPT-4Visionと同等の
　　　機能を有していると
　　　　言うわけです。
　　　　　別々ですけどね。

　このふたつを
　　使って、GPT-4Visionを
　　　疑似体験できるのです。

　では、やってみましょう。

　画像はアップできないので、
　　そこはご容赦くださいw

　まずは、
　　入力枠の右側に、
　　　マイクとGoogleレンズ的な
　　　　マークがありますね。

　レンズ的なマークを
　　タップ（クリック）して、
　　　画像選択してください。

　入力枠に、
　　小さい画面が出てくるので、
　　　プロンプトを入れます。
　　　　どんなことを入れても
　　　　　OKですよ。

　とりあえず、
　　私は、以前に撮影した
　　　某アニメのキャラの立看板を
　　　　入力します。

　それで、
　　プロンプトを
　　　入れます。

画像から特徴を抜き出して、ImageCreatorに渡すプロンプトを作成してください。

　そう、Image to Imageを
　　しようというわけです。

　まぁ、Image Creatorに
　　呪文を食わせる必要は
　　　あるわけで……えっ！？

　Bingさんの回答に
　　画像が出力されました。
　　　知らんかったわ、マジで。

　でも、「画像生成して」と
　　指示しても
　　　「申し訳ありませんが、
　　　　私は画像を作成するための
　　　　　ツールを持っていません」
　　　　　　と言ってきます。

　そのあと、
　　表示してくれる、というのは
　　　ChatGPTさんに似ていますねw

　しかし、
　　Bingさんを
　　　終了して、
　　　　再度立ち上げると、
　　　　　履歴から、
　　　　　　その画像が消えて
　　　　　　　しまうので、
　　　　　　　　ご注意を。

　今回は、
　　ひとつしかやりませんけど、
　　　使い方は、十人十色。
　　　　あなたのアイディアで
　　　　　千変万化すると
　　　　　　思います。

　良い結果が
　　得られますように。

　今回は、ここまで。