結論:トークン消費量は最大5倍差、でも「安い=最適」ではない
GitHub Copilotの料金改定が発表された今、「結局どれが一番コスパいいの?」を実測データで答えます。
同一のタスク3種(バグ修正・リファクタリング・新機能実装)を各ツールで実行し、トークン消費量・API課金額・隠れコストを計測しました。先に結論を書くと:
- 単発の小タスク(バグ修正) → GitHub Copilot が最もコスパが良い
- 中規模リファクタリング → Cursor が効率・コストのバランスで優位
- 大規模な新機能実装 → Claude Code がトータルコスト(手戻り含む)で最安になるケースが多い
「月額固定で安心」か「従量課金だが精度が高い」か——この判断軸を数値で示します。
環境・前提条件
| 項目 | 内容 |
|---|---|
| 計測日 | 2025年6月 |
| 対象プロジェクト | TypeScript / Next.js(約1.2万行) |
| Claude Code | Max plan(Opus使用)/ CLI版 v1.x |
| GitHub Copilot | Business プラン + Copilot Chat(GPT-4o) |
| Cursor | Pro プラン(claude-sonnet-4使用) |
| OS | macOS Sequoia 15.5 |
| 計測方法 | 各ツールのログ・APIダッシュボードからトークン数を取得(詳細は付録) |
3つのタスク定義
タスクは事前にIssueとして起票し、完了条件(テスト通過・レビューOK)を統一しました。
| タスク | 内容 | 想定規模 |
|---|---|---|
| T1: バグ修正 | APIレスポンスのnullチェック漏れ修正(1ファイル・10行程度) | 小 |
| T2: リファクタリング | 認証ロジックをカスタムフックに抽出(5ファイル・約150行変更) | 中 |
| T3: 新機能実装 | ダッシュボードにグラフウィジェット追加(新規3ファイル・約400行) | 大 |
各ツールのトークン消費量・コスト実測結果
実測データテーブル
| タスク | ツール | 入力トークン | 出力トークン | 合計トークン | 推定API課金額 | 完了時間 |
|---|---|---|---|---|---|---|
| T1: バグ修正 | Claude Code | 12,400 | 1,800 | 14,200 | $0.22 | 3分 |
| Copilot | 8,200 | 900 | 9,100 | (月額内) | 2分 | |
| Cursor | 10,600 | 1,200 | 11,800 | (月額内) | 2分 | |
| T2: リファクタ | Claude Code | 48,500 | 8,200 | 56,700 | $0.89 | 12分 |
| Copilot | 62,300 | 11,400 | 73,700 | (月額内) | 25分 | |
| Cursor | 41,200 | 7,800 | 49,000 | (月額内) | 10分 | |
| T3: 新機能 | Claude Code | 125,000 | 22,000 | 147,000 | $2.31 | 28分 |
| Copilot | 184,000 | 35,600 | 219,600 | (月額内) | 55分 | |
| Cursor | 152,000 | 19,500 | 171,500 | (月額内) | 35分 |
注記: Copilot/CursorはPro/Business月額プランのため、1タスクあたりのAPI課金額は直接算出が困難です。トークン数はAPIログ・拡張機能のデバッグ出力から取得した概算値です。Claude Codeの課金額はAnthropic APIの公開単価(Claude Opus: 入力$15/出力$75 per 1M tokens)で計算しています。
凡例:左からClaude Code / Copilot / Cursor(Qiitaのmermaid表示環境によっては凡例が省略される場合があります)
読み取れるポイント
- 小タスク(T1)ではCopilotが最軽量:コンテキスト注入が最小限で済む設計のため
- 中〜大タスクではCopilotのトークン消費が膨らむ:Chat往復回数が増え、コンテキスト再投入が頻発
- Claude Codeは大タスクでもトークン効率が良い:CLIでプロジェクト全体をコンテキストに持てるため、再投入のオーバーヘッドが少ない
- CursorはT2(リファクタ)で最小トークン:ファイル横断のコンテキスト管理がエディタ統合で優秀
隠れコストの比較 — 数値に出にくい差
トークン消費量だけでは見えないコストがあります。今回の計測で体感した「隠れコスト」を定性+定量でまとめました。
| 隠れコスト項目 | Claude Code | Copilot | Cursor |
|---|---|---|---|
| 初期セットアップ時間 | 15分(CLAUDE.md作成含む) | 5分(拡張ON) | 10分(.cursorrulesなど) |
| コンテキスト再投入回数(T3) | 1回 | 4回 | 2回 |
| 手戻り回数(T3) | 1回 | 3回 | 2回 |
| テスト自動実行 | ○(CLI統合) | △(手動トリガー) | ○(ターミナル統合) |
| Git操作の自動化 | ○ | × | △ |
最大のコスト差は「手戻り」に隠れています。 Copilotで新機能実装(T3)を行った際、コンテキストウィンドウの制約で指示の途中から「前提を忘れる」現象が頻発し、手戻り3回+コンテキスト再投入4回が発生しました。これが完了時間55分の主因です。
一方、Claude Codeはプロジェクトルートから起動するだけで広範なコンテキストを保持でき、CLAUDE.mdでプロジェクト固有の規約を事前にロードできるため、大タスクほど効率差が開きます。
月額コストシミュレーション
実測データを基に、月間タスク量を仮定して3パターンのシミュレーションを行いました。
前提となる月間タスク量
| パターン | T1相当/月 | T2相当/月 | T3相当/月 |
|---|---|---|---|
| 個人開発者 | 20件 | 8件 | 2件 |
| 5人チーム | 100件 | 40件 | 10件 |
| 20人組織 | 400件 | 160件 | 40件 |
月額コスト比較
| パターン | Claude Code (Max $100/月 or $200/月) | Copilot ($19/月/人→改定後$39/月/人) | Cursor ($20/月/人) |
|---|---|---|---|
| 個人開発者 | $100(Maxプラン定額) | $39(改定後) | $20 |
| 5人チーム | $500($100×5) | $195($39×5) | $100($20×5) |
| 20人組織 | $2,000($100×20) | $780($39×20) | $400($20×20) |
注記: Claude CodeをAPI従量課金で使う場合、個人開発者のタスク量で月$30〜$60程度になると試算されます。MaxプランやAnthropic Proプラン($20/月)との比較は利用量によって大きく変動するため、自身の利用パターンでの試算をお勧めします。Copilotの料金は2025年6月発表の改定後価格を参考にしています。
月額だけで語れない「時間コスト」
エンジニアの時給を仮に$50/hとすると、手戻り・コンテキスト再投入による時間ロスも金額換算できます。
| ツール | T3での追加時間(実測) | 月2件のT3での時間コスト |
|---|---|---|
| Claude Code | 基準(0分) | $0 |
| Copilot | +27分 | +$45/月 |
| Cursor | +7分 | +$11.7/月 |
つまり個人開発者の場合、表面上の月額が最安のCursorは時間コスト込みでもコスパが良く、Copilotは改定後の$39+時間コスト$45=実質$84/月相当になる可能性があります。
ツール選定フローチャート
使い分けマトリクス
| 場面 | 推奨ツール | 理由 |
|---|---|---|
| 日常的なコード補完・小修正 | Copilot or Cursor | インライン補完の速度とUXが優秀 |
| 複数ファイルのリファクタリング | Cursor | エディタ統合でコンテキスト管理が楽、トークン効率も最良 |
| 大規模な新機能・設計判断込みの実装 | Claude Code | 広いコンテキスト保持、自律的なファイル操作、テスト実行まで一気通貫 |
| CI/CD統合・自動化スクリプト | Claude Code | CLIネイティブのためパイプライン組み込みが容易 |
| 予算最小化(個人・学習用途) | Cursor | $20/月で十分な機能、無料枠もあり |
| チーム導入(管理・ガバナンス重視) | Copilot Business | 組織管理機能・ポリシー設定が充実 |
まとめ
- トークン消費量はツール×タスク規模で最大5倍の差がある——大タスクではCopilotが最も多く消費し、Claude Codeが最も効率的だった
- 月額の安さだけで選ぶと「時間コスト」で逆転する——手戻り・コンテキスト再投入の時間を金額換算すると、ツールの実質コストは表面価格と大きく異なる
- 使い分けが最適解——小タスクはCopilot/Cursor、中規模リファクタはCursor、大規模実装はClaude Codeという組み合わせがトータルコストを最小化する
付録:トークン消費量の計測方法と再現手順
Claude Code
# Claude Codeの利用状況はCLI上で確認可能
# セッション終了時にトークン使用量が表示される
claude --print-cost
# より詳細にはAnthropicコンソールのUsageダッシュボードで確認
# https://console.anthropic.com/settings/usage
CLAUDE.mdに以下を記載してプロジェクト規約を統一しました:
# CLAUDE.md
- TypeScript strict mode
- テストは vitest で実行: npm run test
- コミットメッセージは Conventional Commits 形式
GitHub Copilot
# Copilot Chatのトークン数は直接表示されないため、
# VS Codeの Output パネル > GitHub Copilot Chat で
# リクエスト/レスポンスのログを確認
# 補足:GitHub Copilot APIのUsageは
# GitHub Organizations の Billing > Copilot で月次確認可能
Cursor
# Cursor の Settings > Usage でモデル別のリクエスト数を確認
# 詳細なトークン数は Cursor Settings > Advanced > Debug Logs を有効化し、
# ログファイルからリクエスト/レスポンスのトークン数を抽出
# macOS のログファイルパス:
# ~/Library/Application Support/Cursor/logs/
再現のポイント
-
同一ブランチから開始する:各ツールで同じ
git checkout状態から計測開始 - タスク完了条件を厳密に定義する:「テストが通る」「型エラーがない」など客観基準
- ウォームアップを考慮する:各ツール1回目は慣らしとし、2回目以降を計測対象にする
- ネットワーク環境を統一する:APIレイテンシの差を排除