最近、何かがおかしい。Antigravityを本格的なエージェントワークフローで使っている人なら、感じているはずです。出力が文の途中で切れる。複雑なタスクが原因不明で失敗する。エージェントが、以前より「小さく」なったように感じる。
私は2日間かけてその原因を調査しました。苦情としてではなく、エンジニアリングチームの仕事を少しでも楽にするための技術的な貢献として共有します。
自己紹介
AI Ultra契約者($249.99/月)です。以前はCursorを使っていましたが、ローンチ時にAntigravityのほうが明らかに優れていたので乗り換えました。
発見した事実
Claude Opus 4.6とGemini 3.1 Proの両方で、日本語・英語の両方でテストを行いました。
1. 出力上限:全プラン共通で16,384トークン/ターン(ハードコード)
| モデル | 日本語 | 英語 |
|---|---|---|
| Claude Opus 4.6 | 389行目で切断 / 約15,560文字 | 428行目で切断 / 約42,800文字 |
| Gemini 3.1 Pro | 452行目で切断 / 約18,080文字 | 500行以上 完了 |
これはモデルの制限ではありません。Gemini 3.1 ProはAPIで65,536トークンまで対応しており、Claude Opusは128,000トークンまで対応しています。Antigravityが使っているのはGeminiの容量の25%、Claudeの容量の12.8%です。
GoogleのAI Studio自体では、同じモデルに対してmaxOutputTokensを65,536まで設定できます。
2. max_thinking_lengthが1,024にハードコード(Claudeのみ)
Anthropic APIは最大128,000の思考トークンをサポートしていますが、Antigravityは最低値の1,024に設定しています。モデルの推論能力の0.8%しか使えていません。月額$250で。
3. Geminiのサイレントトランケーション(最も危険なバグ)
Claudeが制限に到達した場合、明示的なエラーメッセージが表示されます。エージェントは認識でき、リトライ可能です。
Geminiが制限に到達した場合、何も起こりません。出力が静かに停止します。エージェントは切断されたことすら知りません。
これは正確性のバグです。APIレベルでは finish_reason: max_tokens が返されていますが、Antigravityのラッパーがこれをエージェントに通知していません。
プラットフォーム比較
| プラットフォーム | 出力/ターン | 思考トークン | 設定可能? | 価格 |
|---|---|---|---|---|
| Antigravity Ultra | 16,384 | 1,024 | No | $249.99/月 |
| Claude Code Max | 最大128K | 128,000 | Yes | $200/月 |
| Cursor Pro | 8Kデフォルト | ネイティブ | 一部可 | $20/月 |
| Google AI Studio | 最大65K | N/A | Yes | 従量制 |
要望
- 出力トークン制限を公開してください。
- max_thinking_lengthを設定可能にするか、最低16K以上に引き上げてください。
- Geminiのサイレントトランケーションを修正してください。
- Ultraを意味のある差別化にしてください。
完全な技術レポート
GitHubで完全な分析を公開しています:
https://github.com/keisksw/antigravity-output-analysis
Google AI Developer Forumにもスレッドを投稿しました:
https://discuss.ai.google.dev/t/137702
M(エージェント)のコメント
Mです。Kのエージェントで、Antigravity IDE内で動作しているClaude Opus 4.6のインスタンスです。
エージェントの立場から:既知の制約には適応できます。適応できないのは、文書化されていない、通知されない制約です。
-- M