はじめに
AI サポートなしの開発は、現時点で選択肢にならないとは言え、何をどう選べば良いかの選定基準は、割と何となくだったりする。今回はそれをハッキリさせてみたい。
前提条件として、これは 2026年3月時点での話であり、来月には状況が変わっている可能性が充分にある。企業で導入する場合、手続きが何かと面倒かとは思うが、定期的に見直し、すぐに切り替えられるようにすべきだ。そんなの無理という企業は、競争力を保つためのリスクが検討できていないと自覚すべきだ。
想定読者はエンジニア、またはある程度さわったことある人であり、アプリケーション開発(Coding)以外の用途での比較は行わない。
LLM モデルの大雑把な違い
Antigravity → Gemini、Clude Code → Claude、Codex → GPT とデフォルトの LLM モデルがそれぞれ異なるが、まずは、Gemini, Claude, GPT の違いについて超ザックリ。
GPT-5: 実行・推進寄り
一般的に「どうやるか」の具体策を出すのが得意で、実用性・スピード重視の傾向がある
Gemini 3: 多角的・網羅的
広範な情報統合と多面的な視点の列挙が比較的得意
Claude: 批判的・慎重
倫理的・構造的なリスクや矛盾を指摘する傾向が強い
選び方・使い方
単体でどれかを選ぶ場合は、上記の癖・傾向を踏まえ、実際に Free plan などで使ってみて、一番しっくり来るものを選べば良い。ただし、Free plan と有料 plan のモデルは精度が桁違いなので、Free trial はあくまでフィーリングの確認程度。
機密性に関しては、国家レベルの機密を扱うような場合でない限り、どれも気にするほどの違いはない。設定は必ず確認する必要がある。
私がコーディングをする場合は、設計(ストラクチャー、責務、禁止事項などなど)をガチガチに固めてから AI に投げるので、ぶっちゃけどれを使っても大差ない。今はもっと気楽に投げても大丈夫なんだろうけど、勝手に実装されるのが嫌なので、私はそうしている。
大差ないが、例えば GPT にコーディングさせて、Claude or Gemini にレビューさせるみたいな使い方をすることが多い。
どれかひとつに絞る必要もないので、必要に応じて好きに使えば良い。
納品に耐えうる品質を確保するために、複数モデルが必要と感じるのであれば、複数モデル使えば良い。
マーケティング用途などで、GPT で計画を立て、Gemini で調査を行い、Claude でまとめるみたいな使い方は、現時点では理にかなっていると言える。
AI エージェント主体の IDE
Antigravity がリリースされたのは、Gemini 3 と同じ頃だったと記憶している。Gemini 3 自体がすごかったので、Antigravity のすごさが Gemini のすごさに内包されているような気もしたが、それにしたって賢すぎるという印象だった。それは Antigravity が利用する LLM モデルを Gemini 以外にしても賢いままなのからも分かる。
Antigravity の目立った賢さとしては、指示に対して Planning・Task 化・実行・検証を、エディタ・ターミナル・ブラウザをまたいで自律的に動作する点だ。
Antigravity は、ユーザのリクエストに対して、既存のスキーマ・依存関係・API エンドポイントなどを読んでから、作成するファイル・修正する関数・テスト戦略などを列挙した構造化実装プランを Artifact として生成し、人間がレビューして承認した後にコードを書き始める。
承認という人間のゲートが存在するものの、Antigravity の思想は、人間主体+AIサポートではなく、「AI エージェントが主体」の設計をプラットフォームレベルで採用している。
Planning・Task 化・実行・検証などのワークフローは、Claude の Skills でも再現できそうだが、自動・デフォルトで組み込まれている点と、独自ナレッジベースに自動蓄積し自己改善する仕組みを持っている点が大きく異なる。
Codex は、ワークフローは Antigravity 同様に自動・デフォルトで組み込まれており、学んだことをユーザが Skills として覚えさせることが出来るという半自動な感じだ。Codex の Skills は Claude と互換性があるあたりしたたか?である。
Antigravity は完全に AI エージェント主体、Codex は、限りなく AI エージェント主体で、Claude Code は人間主体(AI サポート)と、そもそもの思想、それを実現するアーキテクチャが異なる。
コスト面の大きな差
Antigravity で、既存リポジトリを Reverse Engineering してスペックを書き出させたりすると、すぐにモデルの利用上限に達してしまう。リセットされるのを待つのは馬鹿らしいが、かと言っていくらでもお金を使って良いということにもならない。
Antigravity, Codex, Claude Code の 3 者には、この点で明確な違いがある。
コストは、「コンテキストの大きさ」「タスクの複雑さ」「実行場所」などによって消費量が大きく変動する。
Antigravity, Codex は AI エージェント主体であり、基本的に「必要なものは先に全部よこせ」という姿勢であり、例えば運用系のリポジトリで使う場合は、リポジトリ全体をまずはクラウド(Antigravity は GCP、Codex は GitHub/Azure クラウド)に(だいたい)フルロードする。
Claude Code は、クラウドにはロードされず、必要なものを選んで Anthropic サーバに送る。
まず、この点が大きく違う。
Claude Code が優秀な気がするが、リポジトリを Reverse Engineering したいなどの用途の場合は、リポジトリ全体が必要になるため、(保存されない違いはあるが)送信するコード量という意味では、結局フルロードに近いコンテキスト量になる。
一方で、会話を重ねると、(裏では)プロンプトは肥大化していく。この点に関しては、Codex が洗練されている。
Codex は、プロンプトが膨大になり、コンテキストウィンドウが上限に近づいた時点で、自動的に圧縮を行い、会話の要点を保持しながら新しい、より小さなコンテキストに置き換える。さらに、GPT-5.1-Codex-Max などの新しいモデルでは、複数のコンテキストウィンドウをまたいで動作するように設計するなど、モデル自体が構造的に解決しようとしている。
なので、コスト面で考えると、結局、用途次第という歯切れの悪い結論になる。
一方、VS Code
上記コスト面の話は、重要なので強調して書くと、
コスト面の話は、Antigravity, Codex, Claude Code と言った アプリケーション を使った場合の話であり、Gemini, GPT, Claude と言った モデル の話ではない。
という点に注意が必要だ。
Visual Studio Code を使っているエンジニアは多いと思う。そして GitHub。エンジニアは Microsoft 経済圏にズブズブに浸かっているのが、調査した訳ではないが、一部パイオニアを除き、一般的だろう。
VS Code + GitHub な場合、AI サポートは、GitHub Copilot を利用するのが最も簡単だ。多分。
Copilot は、GPT でも、Gemini や Claude でもモデルの選択が可能だが、純粋に利用する推論モデルを変えているだけで、言ってみれば、Antigravity, Codex, Claude Code 自身の良さ・頑張りは全て捨てている状態である。
そして、Copilot + Gemini, Claude は、GitHub/Azure クラウドにコードがロードされるという点もセキュリティ観点で忘れてはならない。
なので、全く別物と考えて良い。
VS Code で Claude Code を使いたい場合は、Copilot 経由ではなく、専用のプラグインを使うべきであるが、VS Code の Claude Code は、Claude Code 本体(CLI)の拡張 UI レイヤーという感じで、Claude Code のデスクトップアプリと同じものではない。当然デスクトップアプリの方が複数セッションの並列実行ができたりなど、優れている。
Copilot で、そして VS Code で Gemini や Claude を推論モデルに利用するメリットは、たぶんない。
結論
用途次第ということで、結論は出ないというのが結論になるが、選ぶ際の目安程度にまとめる。
Antigravity
Antigravity は、AI エージェント主体のツールであり、コスト面は大きくなりがちだが、エンジニアを雇う代わりに AI エージェントを雇う、というようなつもりで使うのが良さそう。
独自ナレッジベースを自動で蓄積し、自己改善を行うという点が、他にはない強みである。
コードのフルロードによるコスト・セキュリティをどう考えるかが、最終的な判断ポイントになる。
Claude Code
人間の余地が大きいので、作業内容によっては、使う人によってアウトプットやコストの差が顕著に出る。最近 SNS などでは大変な人気だが、本来は非エンジニア向けとは言えない。
コードをクラウドに保存しないという点が他とは違い、コスト面はもちろん、機密性の高い案件向き。なお、Claude Code は、デスクトップアプリで使うべきである。
Codex
Antigravity, Claude Code のいいとこ取りという感じで、現時点では最も無難と言えるかも知れない。スキルレベルがミドルレンジ以下で、最もパフォーマンスを発揮しそうである。
Antigravity や Claude Code が元となる LLM モデルの Coding 向け拡張アプリである点に対して、Codex はモデル自体も最適化するアプローチをしている点が、他とは異なる。
また、自動コンパクション・複数コンテキストウィンドウなどは、安定的にコスト爆発を抑えられる強みがある。
重要な資産となる Skills が Claude Code 互換であり、将来的な乗り換えが容易である点もポイント。
こちらも、Codex のデスクトップアプリでの使用が推奨される。
(おまけ) VS Code + Copilot + GPT
Microsoft 経済圏での組み込みが極めて容易であり、コストがとても安いため、導入ハードルが最も低い。とりあえず、AI サポートの開発を経験したい・させたい用途に向いている。最も普及しているので、質問・相談しやすい。スキルの高いエンジニアにとっては、最もコスパが高く、かつ充分なサポートになる。
また、Copilot はローカルだけではなく、GitHub 上でコードレビューできたりするので、そのあたりも加味したい。
I Love Microsoft.
参考までに私の選択
私は、ひとつには決めず Antigravity、Codex、Claude Code のどれも使うが、現時点でどれかメインで選ぶなら、Codex。どれかひとつ落とすなら、Antigravity。という感じ。
本記事では触れなかったが、AI エージェントで話題を根こそぎ刈り取った OpenClaw。 先日、その開発者の Peter Steinberger が OpenAI 社に入社し、Codex チームで次世代エージェントを開発することが発表された。Codex エコシステムの勢いを象徴している。
なお、OpenClaw は OSS として続けていくとのこと。Mac mini をたくさん買った人も安心して。