はじめに
2026年4月1日(明日)より、Gemini APIの課金キャップが正式に強制適用されます。
これまでも課金キャップは表示されていましたが、実際の制限は機能していませんでした。4月1日からは、月間利用額がティアの上限に達するとAPIリクエストが一時停止されます。
この記事では、公式ドキュメントをもとに以下を解説します。
- 課金ティア制度の仕組みと上限額
- 無料枠で使えるモデル一覧
- 廃止予定モデルと移行先
- プロジェクト単位の支出上限の設定方法
この記事で解決できること
- 4月1日以降に「APIが突然止まった」を防ぐ
- 無料枠で使えるモデルを正確に把握する
- 廃止モデルへの対応漏れをなくす
前提条件
- Google AI Studio または Vertex AI で Gemini API を利用中
- Google Cloud 課金アカウントを保有(または保有予定)
TL;DR
- 4月1日から課金ティア上限が強制適用(Tier 1 = $250/月、Tier 2 = $2,000/月)
- 無料枠は Flash モデルだけでなく、Gemini 2.5 Pro も利用可能(ただし低レートリミット)
-
Gemini 2.0 Flash-Lite は 2026年6月1日シャットダウン(
gemini-2.5-flash-liteへ移行必要) - AI Studio の「Spend タブ」でプロジェクト単位の支出上限を設定できる
- 上限を超えると次の請求サイクルまで全APIリクエストが停止する
1. なぜ今これが重要か
2025年に発生した課金バグ事例では、一部の開発者が$70,000を超える不正請求を受ける事態が起きました。Googleはこの問題を受け、2026年3月16日に「Giving you more transparency and control over your Gemini API costs」を公開し、課金制御機能の強化を発表しました。
課金キャップ自体は3月中旬から画面に表示されていましたが、4月1日から実際の制限が有効になります。
2. 課金ティア制度の仕組み
Gemini APIの課金は課金アカウント単位のティア制になっています。
2-1. ティア一覧と月間上限
公式ドキュメント1によると、各ティアの上限は以下のとおりです。
| ティア | 移行条件 | 月間上限(課金アカウント全体) |
|---|---|---|
| Free | プロジェクト作成のみ | 上限なし(レートリミットのみ) |
| Tier 1 | 課金アカウント紐付け | $250/月 |
| Tier 2 | 累計$100以上の支払い + 初回支払いから3日経過 | $2,000/月 |
| Tier 3 | 累計$1,000以上の支払い + 初回支払いから30日経過 | $20,000〜$100,000+/月 |
2-2. 重要な注意点
同一課金アカウントに紐付いた複数プロジェクトの利用額が合算されます。複数のプロジェクトを運用している場合、どれか1つのプロジェクトが大量にAPIを使うと、他プロジェクトもまとめて停止されます。
課金データの処理には最大10分の遅延があります。上限に達しても数分間は新規リクエストが通ってしまう可能性があります。Googleは「真の予算上限より5〜10%低い値に設定することを推奨」しています。
2-3. 現在のティアを確認する方法
- Google AI Studio にアクセス
- 左メニューから 「Spend(支出)」 タブを開く
- 現在のティアと月間使用額が表示される
3. 無料枠で使えるモデル
「無料枠はFlashモデルのみ」という情報が出回っていますが、公式のレートリミット情報2によると、複数のモデルが無料で利用可能です。
3-1. 無料ティアで利用可能なモデル
公式ドキュメントには具体的なRPM/RPD数値は掲載されておらず、最新の制限値は Google AI Studio のレートリミット画面 で確認できます。
無料枠で利用可能なモデルとして確認されているものは以下のとおりです。
| モデル | 無料枠 | 備考 |
|---|---|---|
| Gemini 2.5 Pro | あり(低レートリミット) | 最新値はAI Studioで確認 |
| Gemini 2.5 Flash | あり | 最新値はAI Studioで確認 |
| Gemini 2.5 Flash-Lite | あり | 最新値はAI Studioで確認 |
| Gemini 3 Flash Preview | あり(制限あり) | 最新値はAI Studioで確認 |
| Gemini 3.1 Flash-Lite Preview | あり(制限あり) | 最新値はAI Studioで確認 |
| Gemini Embedding 001 | あり | — |
| Gemini Embedding 2 Preview | あり | — |
| Gemma 3 / Gemma 3n | あり | オープンモデル |
無料枠なし(有料のみ):
-
gemini-3.1-pro-preview— 無料枠なし。利用には課金アカウントの紐付けが必要
3-2. 無料枠の制約
無料ティアで送信したプロンプトとレスポンスは、Googleの製品改善に利用される可能性があります。機密情報を含むリクエストには有料ティアを使用してください(有料ティアはデータ収集からオプトアウト済み)。
4. 廃止予定モデルと移行先
Gemini API 変更履歴3に基づく廃止スケジュールは以下のとおりです。
| モデル | 廃止宣言日 | シャットダウン日 |
|---|---|---|
| Gemini 2.0 Flash 画像生成版 | — | 2025年11月14日(シャットダウン済み) |
| Gemini 2.0 Flash Live | 2026年3月3日 | 2025年12月9日(シャットダウン済み) |
| Gemini 2.0 Flash-Lite | — | 2026年6月1日 |
| Gemini 2.0 Flash | 2026年2月18日 | 2026年6月1日 |
4-1. 推奨移行先
| 廃止モデル | 移行先候補 |
|---|---|
gemini-2.0-flash-lite |
gemini-2.5-flash-lite または gemini-3.1-flash-lite-preview
|
gemini-2.0-flash |
gemini-2.5-flash または gemini-3-flash-preview
|
gemini-2.0-flash-live |
gemini-3.1-flash-live |
gemini-2.0-flash (画像生成) |
gemini-3-pro-preview (画像生成) または Imagen 4 API |
4-2. コードの移行例
# Before(廃止予定)
import google.generativeai as genai
model = genai.GenerativeModel("gemini-2.0-flash-lite")
response = model.generate_content("こんにちは")
print(response.text)
# After(推奨)
import google.generativeai as genai
model = genai.GenerativeModel("gemini-2.5-flash-lite") # 移行先
response = model.generate_content("こんにちは")
print(response.text)
5. 有料ティアの料金体系
公式の料金ページ4によると、主要モデルの料金は以下のとおりです。
| モデル | 入力(≤200k コンテキスト) | 出力(≤200k コンテキスト) |
|---|---|---|
| Gemini 2.5 Pro | $1.25/1M トークン | $10.00/1M トークン |
| Gemini 2.5 Pro(>200k) | $2.50/1M トークン | $15.00/1M トークン |
| Gemini 3.1 Pro Preview | $2.00/1M トークン | $12.00/1M トークン |
| Gemini 3.1 Pro Preview(>200k) | $4.00/1M トークン | $18.00/1M トークン |
| Gemini 2.5 Flash | $0.30/1M(テキスト・画像・動画) / $1.00/1M(音声) | $2.50/1M トークン |
| Gemini 2.5 Flash-Lite | $0.10/1M(テキスト・画像・動画) / $0.30/1M(音声) | $0.40/1M トークン |
| Gemini 3.1 Flash-Lite | $0.25/1M(テキスト・画像・動画) / $0.50/1M(音声) | $1.50/1M トークン |
Batch API(バッチ処理): 全モデルで50%割引。
6. プロジェクト単位の支出上限の設定方法
課金アカウントのティア上限とは別に、プロジェクト単位の月間上限を個別に設定できます。複数プロジェクトを運用する場合や、開発環境と本番環境でコストを分けたい場合に有効です。
6-1. 設定手順
- Google AI Studio にアクセス
- 対象プロジェクトを選択した状態で 「Spend」タブ を開く
- 「Monthly spend cap(月間支出上限)」 → 「Edit spend cap(編集)」 をクリック
- 月間のドル上限を入力して保存
必要なロール: プロジェクトの Editor、Owner、または Admin
6-2. 設定例
| 用途 | 推奨上限 |
|---|---|
| 個人開発・学習 | $10〜$50/月 |
| 小規模サービス | $100〜$200/月 |
| 本番サービス(Tier 1) | Tier 上限の90%(例: $225) |
6-3. 上限に達した場合の動作
上限に達すると、そのプロジェクトへの全APIリクエストが停止します。
再開するには以下のいずれかが必要です。
- 翌請求サイクル(翌月)まで待つ
- 上限値を引き上げる
- Googleの上限引き上げリクエストフォームを送信する(大口利用の場合)
7. 4月1日施行前の確認チェックリスト
以下を順番に確認してください。
□ 現在のティアを AI Studio の Spend タブで確認
□ 過去3ヶ月の月間利用額を確認し、Tier 上限($250)を超えていないか確認
□ 廃止済み・廃止予定モデルを使っていないか確認
→ gemini-2.0-flash-image-generation: シャットダウン済み(2025-11-14)
→ gemini-2.0-flash-live-001: シャットダウン済み(2025-12-09)
→ gemini-2.0-flash: 6月1日シャットダウン → gemini-2.5-flash へ移行
→ gemini-2.0-flash-lite: 6月1日シャットダウン → gemini-2.5-flash-lite へ移行
□ プロジェクト単位の支出上限を設定(任意だが推奨)
□ 複数プロジェクトが同一課金アカウントの場合は合算利用額を確認
まとめ
| 変更点 | 施行日 | 対応 |
|---|---|---|
| 課金ティア上限の強制適用 | 2026年4月1日 | ティア確認・プロジェクト上限設定 |
| Gemini 2.0 Flash 画像生成版のシャットダウン | 2025年11月14日(済) | Imagen 4 API へ移行 |
| Gemini 2.0 Flash Live のシャットダウン | 2025年12月9日(済) |
gemini-3.1-flash-live-preview へ移行 |
| Gemini 2.0 Flash のシャットダウン | 2026年6月1日 |
gemini-2.5-flash へ移行 |
| Gemini 2.0 Flash-Lite のシャットダウン | 2026年6月1日 |
gemini-2.5-flash-lite へ移行 |
Gemini APIは2025年の課金バグ事件を教訓に、開発者がコストを事前制御できる仕組みを整備しました。4月1日以降に「突然APIが止まった」という事態を防ぐために、今日中にAI Studioで現在の利用状況を確認しておくことをお勧めします。
参考リンク
- Billing | Gemini API | Google AI for Developers — 課金ティア詳細
- Gemini Developer API Pricing — 最新料金表
- Rate Limits | Gemini API — 無料枠レートリミット
- Gemini API Changelog — 廃止スケジュール
- Giving you more transparency and control over your Gemini API costs — 公式ブログ(2026年3月16日)