Gemini 1.0 Pro プレビュー版は 1 分間に 15 リクエストという制限があります。仕様が分からないとエラーが発生したときに不安なためメモしておきます。
当初は 1 分間に 60 リクエストでしたが制限されました。
2024 年 5 月 14 日に従量課金が始まりますが、無料枠も残ります。👉詳細
制限
レート制限
15 RPM(1 分あたりのリクエスト数)
超過すると 429 エラーが発生して拒否されます。
429 Resource has been exhausted (e.g. check quota).
当初は情報が錯綜していて、制限回数内は無料で、超過分が有料になるかのような記事も散見されます。
実際にはこのエラーが発生したからと言って課金が要求されるわけではありません。間隔を空けて再試行すれば解消します。
正式公開後に課金することで制限が緩和されます。
360 RPM(1 分あたりのリクエスト数)
他のエラー
サーバーが混みあっていると 500 エラーが発生するようです。
500 An internal error has occurred. Please retry or report in https://developers.generativeai.google/guide/troubleshooting
これは回数制限とは別です。間隔を空けて再試行することになります。
混雑している時間帯だと間隔を空けても頻繁に発生します。経験上、30 分から 1 時間くらいはそのような状態が続くこともありました。
混雑が解消すればスムーズに処理されるようになります。
同時クエリ
回数制限内であれば同時に複数のクエリを投げても受理されるようですが、仕様は未確認です。generate_content_async()
のような非同期 API はそのような用途を想定しているのかもしれませんが、こちらも未確認です。
関連記事
安全設定に起因するエラーについては以下の記事を参照してください。