どうも、カーブミラーです。
今回は、GPT-4Visionがまだ届かない、あるいは課金していないから使えない方に、事前練習や疑似体験ができる方法を提示します。
本記事は、
ChatGPTは使っていません。
あしからず。
GPT-4Visionは、
なかなかの盛り上がりを
見せていますね。
先日、
YouTuberかわごんさんの
ところで行なった勉強会は、
まさにGPT-4Visionでした。
そのようすは、
You Tube動画として
アップされています。
【2023/10/05】かわごん勉強会:ChatGPTに画像でプロンプト
私の声も録音されていて、
少し恥ずかしく感じますね。
言っておきますけど、
私は男ですw
ChatGPTアプリの
音声会話についても
かわごんさんが
動画をアップ
されています。
【ChatGPT】音声マルチモーダルAI:スマホアプリの新機能搭載
今回は、
画像について、
書いていきますね。
かわごんさん勉強会は、
以前から、やっていました。
でも、録音したのは、
初めてなので、
ちゃんと録音
できているかと
不安でしたねw
それはともかく、
はじめましょう。
GPT-4Visionの画像関係は、
画像を入力して、
解析させることと、
DALL-E3で出力させること
の双方向ができます。
あっ、出力させるDALL-E3は
別口で、機能開放させる
ようです。
まだまだ先のようですね。
今回の目的は、
GPT-4Visionの
事前練習や疑似体験を
することです。
使うのは、
Microsoft Bingと
Microsoft Image Creatorです。
ご存知のとおり、
Microsoft Bingは、GPT4であり、
すでに画像入力が可能です。
Image Creatorについては、
ご存知かわかりませんけど、
中身は、DALL-E3です。
つまり、
GPT-4Visionと同等の
機能を有していると
言うわけです。
別々ですけどね。
このふたつを
使って、GPT-4Visionを
疑似体験できるのです。
では、やってみましょう。
画像はアップできないので、
そこはご容赦くださいw
まずは、
入力枠の右側に、
マイクとGoogleレンズ的な
マークがありますね。
レンズ的なマークを
タップ(クリック)して、
画像選択してください。
入力枠に、
小さい画面が出てくるので、
プロンプトを入れます。
どんなことを入れても
OKですよ。
とりあえず、
私は、以前に撮影した
某アニメのキャラの立看板を
入力します。
それで、
プロンプトを
入れます。
画像から特徴を抜き出して、ImageCreatorに渡すプロンプトを作成してください。
そう、Image to Imageを
しようというわけです。
まぁ、Image Creatorに
呪文を食わせる必要は
あるわけで……えっ!?
Bingさんの回答に
画像が出力されました。
知らんかったわ、マジで。
でも、「画像生成して」と
指示しても
「申し訳ありませんが、
私は画像を作成するための
ツールを持っていません」
と言ってきます。
そのあと、
表示してくれる、というのは
ChatGPTさんに似ていますねw
しかし、
Bingさんを
終了して、
再度立ち上げると、
履歴から、
その画像が消えて
しまうので、
ご注意を。
今回は、
ひとつしかやりませんけど、
使い方は、十人十色。
あなたのアイディアで
千変万化すると
思います。
良い結果が
得られますように。
今回は、ここまで。