Googleが出してきたGemini Pro APIが気になったのでPythonでAPIを使ってみました。
サンプル
適当な車の画像を入れただけなのに、やたら詳しいですね...(全て正しいかはわからないけど)
※APIキーが必要です
↑無料プランの範囲内だとは思うのですが怖かったので、個別のキーを入れる方式にしました。
前準備
APIキーの取得
APIキーを取得します。
モジュールインストール
pip install google.generativeai
シンプル!
コード解説
Streamlitを使ったサンプルはこちら
APIキーの設定
genai.configure(api_key=API_KEY)
モデルの読み込み、送信&レスポンス取得
モデルはtextだけのものと画像を送信可能な2つに分かれています。
gemini-pro
入力:テキスト
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content([text])
gemini-pro-vision
入力:テキスト、画像
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content([text,image])
画像はPIL.Image
結果
print(response.text)
価格
リミットは60QPMで無償。Tokenでなく文字単位なので、日本語は有利で課金されてもGPT-3.5よりかなり安く使える感じとの事。
むにゃむにゃ
まだあまり深くまで掘っていないのですが、とりあえずサクッとできてしまったので、公開します。