現状
現在、Claude CodeとChatGPT Codexを両方とも$20プランで運用しています。
当初は、
- メイン:Claude Code
- サブ:ChatGPT Codex(問題発生時のみ使用)
という構成で開発していました。
しかし現在はこれが逆転し、
- メイン:ChatGPT Codex
- サブ:Claude Code
という運用に変更しています。
その理由を整理します。
各々の特徴(ざっくり)
詳細は過去記事にまとめています。
https://qiita.com/TryCheck/items/bfe6fc9993202732ff63
Claude Codeの強み
- 大規模コード把握による作業の安定性
- 更新前の逐次質問による安心感
- 保守的で堅実な進め方
ChatGPT Codexの強み
- 並列タスク実行による高速作業
- コンテキスト圧縮時の混乱が少ない
- 長時間作業での安定感
用途によってどちらも優秀です。
しかし、運用を逆転させた理由は性能ではありません。
なぜClaude CodeからChatGPT Codexに乗り換えたのか?
理由は「性能」ではありません
乗り換えの理由は、性能差ではなくコスト構造(可働時間)でした。
同じ$20プランであっても、実際に作業できる体感時間が大きく異なります。
双方の利用リミット
両者とも基本的な制限構造は同じです。
- 5時間リミット
- 1週間リミット
プランをアップグレードするとリミット量は増えますが、
仕組み自体は変わりません。
体感的な利用可能時間($20プラン)
| 項目 | Claude Code | ChatGPT Codex |
|---|---|---|
| 5時間リミット到達目安 | 約1時間で到達 | 約2〜4時間で到達 |
| 1週間リミット到達目安 | 3〜4日で到達 | 4〜5日で到達 |
特に差が大きいのが「5時間リミット」です。
※あくまで私の体感値です。利用頻度やプロジェクト規模、指示の出し方によって上下する可能性があります。
AIは賢い。しかし、止まる。
実務では常に5時間フル稼働させるわけではありません。
しかし、
- 大規模リファクタリング
- 横断的な影響範囲修正
- ディレクトリ再設計
- フロントエンド全体の構造変更
のような作業では、途中で止まることが致命的になります。
最悪のケース
- 作業途中でリミット到達
- 差分が中途半端な状態
- どこまで修正されたか不明
- ロールバック
- 再実行
このループが発生します。
性能差以前に、
途中で止まることの方が実務では深刻
でした。
AI開発エージェントの本当の評価軸
資金が潤沢で無制限にアップグレードできるなら問題ありません。
しかし現実には、
- コストを抑えたい
- 月額を一定に保ちたい
- チーム利用したい
という制約があります。
その場合、
AIをどれだけ長時間安定して使えるか
が重要な評価軸になります。
可働時間を伸ばす唯一の方法
それは、
AIの推論コストを下げること
です。
AIの推論コストとは?
AIは指示を受けると、
- コード探索
- 依存関係解析
- 影響範囲推論
- 修正候補比較
を内部で行っています。
指示が曖昧であればあるほど、探索範囲が広がります。
つまり、
- 曖昧な指示 = 無駄なトークン消費
- 情報不足 = 調査時間増加
- 調査時間増加 = リミット到達加速
という構造になります。
指示の質が可働時間を左右する(フロントエンド例)
❌ 悪い指示
ボタンが動かないので直して
この指示ではAIは、
- どのページ?
- どのボタン?
- React?Vanilla?
- consoleエラーは?
- イベントバインド?
などを推測する必要があります。
⭕ 良い指示
トップページの送信ボタンがクリックしても反応しません。
Chrome 144 / macOS 10.15.7 で再現。
console にCannot read properties of undefined (reading 'value')が出ています。
handleSubmit 内で useRef が undefined の可能性があります。
null安全に修正したいです。
この場合、
- 対象ファイルが明確
- 再現環境が明確
- エラーが明確
- 仮説まで共有済み
AIの探索範囲は極端に狭まります。
結果として、
- 推論コスト減少
- トークン消費減少
- 可働時間延長
につながります。
クライアントワークではどうする?
問題はここです。
クライアントからのフィードバックは、
- 抽象的
- 感覚的
- 状況説明不足
になりがちです。
例:
なんか動きがおかしいです
この状態でAIに投げても、
- 再現調査
- ログ探索
- 推測修正
という無駄な推論コストが発生します。
AI時代のフィードバック設計
AI開発時代において重要なのは、
情報量の多いフィードバックを最初から集めること
です。
- スクリーンショット
- page_url
- target_selector
- viewport
- browser
- OS
- scroll位置
- element情報
これらが揃っているだけで、AIは状況をかなり正確に再現できます。
実例
TryCheckを使えば、フィードバックをもとにAI推論のアシストができます。
https://trycheck.jp/
画像のように管理画面からコピーボタンをクリックすると・・・
以下のようなJson情報をコピーすることができます。
これをAIに渡すだけで、AIが状況を把握することが可能です。
{
"context": {
"type": "feedback",
"instruction": "クリックしても何も起きない。",
"details": {
"page_url": "https://classly.co.jp/",
"feedback_title": "クラスリー株式会社|東京 Web事業開発会社会社",
"target_selector": "header:nth-child(1) > ul:nth-child(2) > li > a",
"browser": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/144.0.0.0 Safari/537.36",
"platform": "MacIntel",
"os": "macOS",
"os_version": "10.15.7",
"viewport": {
"width": "1920",
"height": "992"
},
"device_type": "desktop",
"screen": {
"width": "1920",
"height": "1080"
},
"device_pixel_ratio": 1,
"touch_support": false,
"scroll": {
"x": "0",
"y": "0"
},
"element_tag": "a",
"inner_text": "クリックしても何も起きない。",
"timestamp": "2026-02-19T02:14:54.000000Z"
}
},
"notice": "実際の修正は行わず方針の提案を行なって、ユーザに同意を得て"
}
これをAIに渡すだけで、
- 対象要素
- 実行環境
- 再現条件
が明確になります。
※consoleや操作手順に関する情報も、今後のアップデートでJsonデータに加わる予定です。
まとめ
Claude CodeからChatGPT Codexに運用を逆転させた理由は、
性能差ではなく可働時間の差でした。
そして本質的な問題は、
AIがどれだけ長時間安定して動けるか
です。
そのためには、
- 明確な指示
- 情報密度の高いフィードバック
- 推論コストの削減
が不可欠です。
AI開発エージェント時代において、
「情報量」がそのまま「コスト」になります。
可働時間を最大化するための設計を、
これからの開発現場では真剣に考える必要があるのではないでしょうか。
TryCheckでは、フィードバックの情報量を高めて、
AI推論コストやコミュニケーションコストを削減する仕組みを提供しています。
まずはデモやサンプルを試して、どれだけ推論コストが下がるか体感してみてください。
