【ポエム】テキストと画像⇒テキストを生成してみたけど #ポエム

0.初めに

この記事は以下の記事の後続として書いていますが…ポエムになりましたｗ

この記事ではGemini APIで「マルチターンの会話の構築（チャット）」ということで、テキストで入力してテキストで回答の継続的に出来るものでした。

これが普通にできたので別のサンプルプログラムを試した結果の話になります。

以下のサンプルプログラムを使いました。

generative-ai-js/samples/web/index.html - · google/generative-ai-js

Googleさんの解説は以下

テキストと画像の入力からテキストを生成する（マルチモーダル）-ウェブアプリで Gemini API を使ってみる

画像とテキストを入力して、テキストでGemeniが回答するサンプルです。「マルチモーダル」というらしい。

正しい回答を得られるとおもっていましたが…こうなりました。

これは…さすがに…

マルチモーダルの未来は遠い…？？