はじめに
2026年6月1日付で、Google の Gemini 2.0 Flash系モデル4種がシャットダウンされました。対象モデルを使用中のコードは即座に動作停止します。
⚠️ Breaking Change
gemini-2.0-flash、gemini-2.0-flash-001、gemini-2.0-flash-lite、gemini-2.0-flash-lite-001の4モデルが2026年6月1日付でシャットダウン済みです。既存コードが動作しなくなるため、今すぐ移行対応が必要です。
📌 影響を受ける人
- Gemini API を直接呼び出しているアプリ・サービスの開発者
- LangChain、LlamaIndex など LLM フレームワーク経由で Gemini 2.0 系を使用している開発者
- Google AI Studio 経由でモデル名をハードコードしているプロジェクト
Gemini 2.0 Flash は「速くて安い」コスト効率の高いモデルとして多くのプロダクションシステムで採用されていました。今回の廃止は移行猶予なしのため、すでに本番障害が発生しているケースもあると思われます。
変更の全体像
今回の変更をモデルの世代移行という観点で整理すると、以下のようになります。
廃止された Gemini 2.0 Flash 系から Gemini 3.x 系へのジャンプとなります。Google は世代を1つ飛ばす形で後継モデルを提供しており、性能面での大きな向上が期待できます。
変更内容
廃止モデル一覧
| モデル名 | ステータス | 代替モデル |
|---|---|---|
gemini-2.0-flash |
🔴 Shut Down | gemini-3.5-flash |
gemini-2.0-flash-001 |
🔴 Shut Down | gemini-3.5-flash |
gemini-2.0-flash-lite |
🔴 Shut Down | gemini-3.1-flash-lite |
gemini-2.0-flash-lite-001 |
🔴 Shut Down | gemini-3.1-flash-lite |
移行先モデルの特徴
gemini-3.5-flash(gemini-2.0-flash 系の後継)
- 高速・低コストに加え、マルチモーダル性能が大幅強化
- 長文コンテキスト処理・関数呼び出し精度が向上
-
gemini-2.0-flashと比較して、多くのベンチマークでスコアが向上
gemini-3.1-flash-lite(gemini-2.0-flash-lite 系の後継)
- さらなる軽量・低コスト設計を維持しつつ品質向上
- 大量バッチ処理・高頻度 API コールのユースケースに最適
-
gemini-2.0-flash-liteからほぼ互換の使用感で移行可能
影響と対応
移行対応フロー
対応手順
-
コードベースの検索
gemini-2.0-flashをキーワードにして、ハードコードされているモデル名を全て洗い出す -
モデル名の置き換え
-
gemini-2.0-flash→gemini-3.5-flash -
gemini-2.0-flash-001→gemini-3.5-flash -
gemini-2.0-flash-lite→gemini-3.1-flash-lite -
gemini-2.0-flash-lite-001→gemini-3.1-flash-lite
-
-
環境変数・設定ファイルの更新
.env、config.yaml、CLAUDE.mdなど設定ファイルにモデル名が記載されている場合も忘れずに更新する -
ステージング環境での動作確認
レスポンスの形式・精度・レイテンシに変化がないかテストする -
本番デプロイ
問題がなければ本番環境を更新する
コード例
Python(google-generativeai)
Before(動作停止)
import google.generativeai as genai
model = genai.GenerativeModel("gemini-2.0-flash") # ❌ Shut Down
response = model.generate_content("こんにちは")
print(response.text)
After(正常動作)
import google.generativeai as genai
model = genai.GenerativeModel("gemini-3.5-flash") # ✅ 推奨移行先
response = model.generate_content("こんにちは")
print(response.text)
Python(google-genai 新SDK)
Before(動作停止)
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.0-flash-lite", # ❌ Shut Down
contents="バッチ処理のテスト"
)
print(response.text)
After(正常動作)
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.1-flash-lite", # ✅ 推奨移行先
contents="バッチ処理のテスト"
)
print(response.text)
JavaScript / TypeScript(@google/generative-ai)
Before(動作停止)
import { GoogleGenerativeAI } from "@google/generative-ai";
const genAI = new GoogleGenerativeAI(process.env.API_KEY!);
const model = genAI.getGenerativeModel({ model: "gemini-2.0-flash-001" }); // ❌ Shut Down
const result = await model.generateContent("Hello");
console.log(result.response.text());
After(正常動作)
import { GoogleGenerativeAI } from "@google/generative-ai";
const genAI = new GoogleGenerativeAI(process.env.API_KEY!);
const model = genAI.getGenerativeModel({ model: "gemini-3.5-flash" }); // ✅ 推奨移行先
const result = await model.generateContent("Hello");
console.log(result.response.text());
LangChain(Python)
Before(動作停止)
from langchain_google_genai import ChatGoogleGenerativeAI
llm = ChatGoogleGenerativeAI(model="gemini-2.0-flash") # ❌ Shut Down
response = llm.invoke("タスクの説明をしてください")
After(正常動作)
from langchain_google_genai import ChatGoogleGenerativeAI
llm = ChatGoogleGenerativeAI(model="gemini-3.5-flash") # ✅ 推奨移行先
response = llm.invoke("タスクの説明をしてください")
💡 Tips
LangChain や LlamaIndex を使用している場合、モデル名を環境変数で管理しておくと次回の廃止時に設定ファイルの変更だけで済むため、移行コストを大幅に削減できます。
まとめ
| 項目 | 内容 |
|---|---|
| 変更種別 | モデル廃止(Breaking Change) |
| 発生日 | 2026年6月1日 |
| 対象 | gemini-2.0-flash 系 4モデル |
| 緊急度 | 🔴 即時対応必須 |
| 移行先(flash) | gemini-3.5-flash |
| 移行先(flash-lite) | gemini-3.1-flash-lite |
| 移行難易度 | 低(モデル名の変更のみ) |
ポイントのまとめ:
- 今すぐ対応が必要 — 廃止はすでに実施済みであり、対象モデルへの API コールはエラーになります
- 移行自体は簡単 — モデル名を変えるだけで大半のケースは対応可能です
- 新モデルは高性能 — 2.0 → 3.x の世代ジャンプにより、同コスト帯で性能向上が期待できます
- 設定の外部化を推奨 — モデル名を環境変数で管理することで、将来の廃止にも素早く対応できます
もし既に本番環境でエラーが発生している場合は、上記のコード例を参考にモデル名を変更した上で、速やかにデプロイを行ってください。