はじめに
2025 年の年末、LLM 業界に激震が走りました!
- Google: Gemini 3 の無料枠変更で「改悪だ」と不満噴出
- OpenAI: 対抗馬として GPT-5.2 を緊急投入
この 2 つが同時に発生し、界隈はてんやわんやです。この記事では「結局なにが起きているのか」をまとめます。
🐣 結構緊急だったのでざっくりとした内容です
一体何が起きたのか?
時系列で整理すると、事態の急変ぶりがよく分かります。
- 2025 年 11 月:Google が Gemini 3 を投入。圧倒的な性能を見せつける。
-
11 月下旬:Gemini 3 の無料枠が「1 日 5 回保証」から「Basic access(状況次第)」に変更され、炎上気味に。
9to5 の Google の記事 -
12 月 11 日:OpenAI が GPT-5.2 を発表。「Instant / Thinking / Pro」の 3 構成で迎え撃つ。
OpenAI の公式発表
この 1 か月で、生成 AI は「無料で気軽に試せる」世界から、「無料はあくまで体験版、ちゃんと使うなら課金してね」というフェーズへ移行を始めました。
Gemini 3 の「改悪?」の正体
結論から言うと、Gemini 3 の性能が高すぎてアクセスが集中し、無料で安定提供できなくなった ということです。
「昨日まで 5 回保証」が消えた
これまで無料版でも具体的な回数目安がありましたが、現在は**「Basic access」**という表現に変わりました。
公式ヘルプ(特に英語版の表)を見ると、上限は固定ではなく「プロンプトの長さ、複雑さ、混雑状況」で変動することや、有料プランでも上位機能には上限があることが分かります。
Gemini Apps limits(公式ヘルプ)
ユーザーからすれば「いつ制限がかかるか分からない」状態のため、不満の火種になっています。
🐣 Gemini は課金していても Deep Think が使えないことが多発しています
なぜこうなった?
理由はシンプルに「需要過多」です。Google といえども、高性能モデルを全員に無料で配り続けるのは物理的に限界が来たのでしょう。
🐣 要するに、人気が出過ぎて GPU が足りないということですね
GPT-5.2 の登場で何が変わったか
Gemini 3 の性能を見せつけられた OpenAI も黙ってはいませんでした。Reuters などの報道によると「Code Red(緊急事態)」体制で開発を進め、12 月 11 日に GPT-5.2 を投入しました。
Reuters の報道
3 つの顔を持つ GPT-5.2
今回の GPT は用途別に 3 段構えです。
- Instant:爆速。軽いタスク向け。
- Thinking:推論や計画が得意。じっくり考える。
- Pro:最上位モデル。
単に文章がうまいだけでなく、スプレッドシート操作や複雑な作業を完遂させる「実務能力」に振ってきています。
こちらも結局、上限の話になる
重要なのは、OpenAI 側も「強いモデルほど上限がきつい」点は同じだということ。
公式ヘルプでも、無料版や Thinking モードの上限についてかなり具体的に記述されています。
GPT-5.2 in ChatGPT(OpenAI Help)
Gemini だけが渋いのではなく、「高性能モデル=回数制限厳守」 が業界標準になったと言えます。
🐣 今後は無課金ユーザーには辛い時代になってしまうのかも?
今回の騒ぎからわかったこと
1. 無料枠は「体験版」に戻った
「無料で高性能モデルを使い放題」というボーナスタイムは終了しました。これからは、無料枠はあくまで「お試し用」と割り切る必要がありそうです。
2. 「1 モデルで全部」から「使い分け」へ
Google も OpenAI も、「速いモデル」と「賢い(重い)モデル」を切り替える設計を推奨しています。すべてを最高性能モデルでやるのではなく、適材適所が求められます。
3. ベンチマークより「運用」
スペック上のスコアがいかに高くても、制限ですぐ止まってしまっては仕事になりません。「自分の用途でスムーズに運用できるか?」が最大の評価基準になります。
🐣 ほとんどの人は数学オリンピックに興味はないし、複雑なコードも不要ということでしょうか
使う側の現実的な攻略法
これからの「制限ありき」の時代を生き抜くコツです。
-
Fast 系で下ごしらえ
要約や構成案は軽量モデル(Instant や Flash)で済ませ、ここぞという仕上げだけ上位モデル(Thinking)を使う。 -
長文・巨大ファイルをいきなり投げない
ファイルサイズや長さも制限カウントに含まれます。小分けにする工夫が必要です。 -
逃げ道を用意する
片方のサービスが混雑・制限にかかったときのため、最低 2 系統(Google と OpenAI など)を併用して締め切りを守れるようにしておく。
🐣 もしかすると下ごしらえ用途でオンプレミスな LLM に脚光が当たるようになるかもしれません
おわりに
Gemini 3 の制限変更と、間髪入れずに投入された GPT-5.2。
各社とも「プロ用途」を明確に取りに来ており、無料枠の扱いは今後も厳しくなることが予想されます。引き続き注視する必要がありそうです。
個人的に面白かったのは Google も OpenAI も「速くて安いモデル(Fast/Instant)」と「遅くて賢いモデル(Thinking)」を適切に切り替えてね、ガチで上限を設けるよ、というとても似た動きをしている点です。
これが『最先端の LLM を使う』という根っこが同一であるための当然の帰結なのか別の企業にもかかわらず同じ表現型に落ち着く収斂進化なのかは意見の分かれるところでしょうが、まだまだ続きそうな生成 AI の群雄割拠、ユーザーも巻き込み大荒れの予感がしますね。ではまた次の記事でお会いしましょう。
🐣 あれだけのモデルたちがほぼ無料だったことの方が不思議だったのかもしれませんね