0.初めに
この記事は以下の記事の後続として書いていますが…ポエムになりましたw
ドシロウトもGemini APIで遊んでみたかったのでロリポですぐ動くコードを作った
この記事ではGemini APIで「マルチターンの会話の構築(チャット)」ということで、テキストで入力してテキストで回答の継続的に出来るものでした。
これが普通にできたので別のサンプルプログラムを試した結果の話になります。
1.試したサンプル
以下のサンプルプログラムを使いました。
generative-ai-js/samples/web/index.html - · google/generative-ai-js
Googleさんの解説は以下
画像とテキストを入力して、テキストでGemeniが回答するサンプルです。「マルチモーダル」というらしい。
2.試した結果
正しい回答を得られるとおもっていましたが…こうなりました。
これは…さすがに…
3.終わりに
マルチモーダルの未来は遠い…??