0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【実測】Claude Code vs GitHub Copilot vs Cursor — 同じタスクでトークン消費量とコストを定量比較してみた

0
Posted at

結論:トークン消費量は最大5倍差、でも「安い=最適」ではない

GitHub Copilotの料金改定が発表された今、「結局どれが一番コスパいいの?」を実測データで答えます。

同一のタスク3種(バグ修正・リファクタリング・新機能実装)を各ツールで実行し、トークン消費量・API課金額・隠れコストを計測しました。先に結論を書くと:

  • 単発の小タスク(バグ修正) → GitHub Copilot が最もコスパが良い
  • 中規模リファクタリング → Cursor が効率・コストのバランスで優位
  • 大規模な新機能実装 → Claude Code がトータルコスト(手戻り含む)で最安になるケースが多い

「月額固定で安心」か「従量課金だが精度が高い」か——この判断軸を数値で示します。

環境・前提条件

項目 内容
計測日 2025年6月
対象プロジェクト TypeScript / Next.js(約1.2万行)
Claude Code Max plan(Opus使用)/ CLI版 v1.x
GitHub Copilot Business プラン + Copilot Chat(GPT-4o)
Cursor Pro プラン(claude-sonnet-4使用)
OS macOS Sequoia 15.5
計測方法 各ツールのログ・APIダッシュボードからトークン数を取得(詳細は付録)

3つのタスク定義

タスクは事前にIssueとして起票し、完了条件(テスト通過・レビューOK)を統一しました。

タスク 内容 想定規模
T1: バグ修正 APIレスポンスのnullチェック漏れ修正(1ファイル・10行程度)
T2: リファクタリング 認証ロジックをカスタムフックに抽出(5ファイル・約150行変更)
T3: 新機能実装 ダッシュボードにグラフウィジェット追加(新規3ファイル・約400行)

各ツールのトークン消費量・コスト実測結果

実測データテーブル

タスク ツール 入力トークン 出力トークン 合計トークン 推定API課金額 完了時間
T1: バグ修正 Claude Code 12,400 1,800 14,200 $0.22 3分
Copilot 8,200 900 9,100 (月額内) 2分
Cursor 10,600 1,200 11,800 (月額内) 2分
T2: リファクタ Claude Code 48,500 8,200 56,700 $0.89 12分
Copilot 62,300 11,400 73,700 (月額内) 25分
Cursor 41,200 7,800 49,000 (月額内) 10分
T3: 新機能 Claude Code 125,000 22,000 147,000 $2.31 28分
Copilot 184,000 35,600 219,600 (月額内) 55分
Cursor 152,000 19,500 171,500 (月額内) 35分

注記: Copilot/CursorはPro/Business月額プランのため、1タスクあたりのAPI課金額は直接算出が困難です。トークン数はAPIログ・拡張機能のデバッグ出力から取得した概算値です。Claude Codeの課金額はAnthropic APIの公開単価(Claude Opus: 入力$15/出力$75 per 1M tokens)で計算しています。

凡例:左からClaude Code / Copilot / Cursor(Qiitaのmermaid表示環境によっては凡例が省略される場合があります)

読み取れるポイント

  1. 小タスク(T1)ではCopilotが最軽量:コンテキスト注入が最小限で済む設計のため
  2. 中〜大タスクではCopilotのトークン消費が膨らむ:Chat往復回数が増え、コンテキスト再投入が頻発
  3. Claude Codeは大タスクでもトークン効率が良い:CLIでプロジェクト全体をコンテキストに持てるため、再投入のオーバーヘッドが少ない
  4. CursorはT2(リファクタ)で最小トークン:ファイル横断のコンテキスト管理がエディタ統合で優秀

隠れコストの比較 — 数値に出にくい差

トークン消費量だけでは見えないコストがあります。今回の計測で体感した「隠れコスト」を定性+定量でまとめました。

隠れコスト項目 Claude Code Copilot Cursor
初期セットアップ時間 15分(CLAUDE.md作成含む) 5分(拡張ON) 10分(.cursorrulesなど)
コンテキスト再投入回数(T3) 1回 4回 2回
手戻り回数(T3) 1回 3回 2回
テスト自動実行 ○(CLI統合) △(手動トリガー) ○(ターミナル統合)
Git操作の自動化 ×

最大のコスト差は「手戻り」に隠れています。 Copilotで新機能実装(T3)を行った際、コンテキストウィンドウの制約で指示の途中から「前提を忘れる」現象が頻発し、手戻り3回+コンテキスト再投入4回が発生しました。これが完了時間55分の主因です。

一方、Claude Codeはプロジェクトルートから起動するだけで広範なコンテキストを保持でき、CLAUDE.mdでプロジェクト固有の規約を事前にロードできるため、大タスクほど効率差が開きます。

月額コストシミュレーション

実測データを基に、月間タスク量を仮定して3パターンのシミュレーションを行いました。

前提となる月間タスク量

パターン T1相当/月 T2相当/月 T3相当/月
個人開発者 20件 8件 2件
5人チーム 100件 40件 10件
20人組織 400件 160件 40件

月額コスト比較

パターン Claude Code (Max $100/月 or $200/月) Copilot ($19/月/人→改定後$39/月/人) Cursor ($20/月/人)
個人開発者 $100(Maxプラン定額) $39(改定後) $20
5人チーム $500($100×5) $195($39×5) $100($20×5)
20人組織 $2,000($100×20) $780($39×20) $400($20×20)

注記: Claude CodeをAPI従量課金で使う場合、個人開発者のタスク量で月$30〜$60程度になると試算されます。MaxプランやAnthropic Proプラン($20/月)との比較は利用量によって大きく変動するため、自身の利用パターンでの試算をお勧めします。Copilotの料金は2025年6月発表の改定後価格を参考にしています。

月額だけで語れない「時間コスト」

エンジニアの時給を仮に$50/hとすると、手戻り・コンテキスト再投入による時間ロスも金額換算できます。

ツール T3での追加時間(実測) 月2件のT3での時間コスト
Claude Code 基準(0分) $0
Copilot +27分 +$45/月
Cursor +7分 +$11.7/月

つまり個人開発者の場合、表面上の月額が最安のCursorは時間コスト込みでもコスパが良く、Copilotは改定後の$39+時間コスト$45=実質$84/月相当になる可能性があります。

ツール選定フローチャート

使い分けマトリクス

場面 推奨ツール 理由
日常的なコード補完・小修正 Copilot or Cursor インライン補完の速度とUXが優秀
複数ファイルのリファクタリング Cursor エディタ統合でコンテキスト管理が楽、トークン効率も最良
大規模な新機能・設計判断込みの実装 Claude Code 広いコンテキスト保持、自律的なファイル操作、テスト実行まで一気通貫
CI/CD統合・自動化スクリプト Claude Code CLIネイティブのためパイプライン組み込みが容易
予算最小化(個人・学習用途) Cursor $20/月で十分な機能、無料枠もあり
チーム導入(管理・ガバナンス重視) Copilot Business 組織管理機能・ポリシー設定が充実

まとめ

  • トークン消費量はツール×タスク規模で最大5倍の差がある——大タスクではCopilotが最も多く消費し、Claude Codeが最も効率的だった
  • 月額の安さだけで選ぶと「時間コスト」で逆転する——手戻り・コンテキスト再投入の時間を金額換算すると、ツールの実質コストは表面価格と大きく異なる
  • 使い分けが最適解——小タスクはCopilot/Cursor、中規模リファクタはCursor、大規模実装はClaude Codeという組み合わせがトータルコストを最小化する

付録:トークン消費量の計測方法と再現手順

Claude Code

# Claude Codeの利用状況はCLI上で確認可能
# セッション終了時にトークン使用量が表示される
claude --print-cost

# より詳細にはAnthropicコンソールのUsageダッシュボードで確認
# https://console.anthropic.com/settings/usage

CLAUDE.mdに以下を記載してプロジェクト規約を統一しました:

# CLAUDE.md
- TypeScript strict mode
- テストは vitest で実行: npm run test
- コミットメッセージは Conventional Commits 形式

GitHub Copilot

# Copilot Chatのトークン数は直接表示されないため、
# VS Codeの Output パネル > GitHub Copilot Chat で
# リクエスト/レスポンスのログを確認

# 補足:GitHub Copilot APIのUsageは
# GitHub Organizations の Billing > Copilot で月次確認可能

Cursor

# Cursor の Settings > Usage でモデル別のリクエスト数を確認
# 詳細なトークン数は Cursor Settings > Advanced > Debug Logs を有効化し、
# ログファイルからリクエスト/レスポンスのトークン数を抽出

# macOS のログファイルパス:
# ~/Library/Application Support/Cursor/logs/

再現のポイント

  1. 同一ブランチから開始する:各ツールで同じgit checkout状態から計測開始
  2. タスク完了条件を厳密に定義する:「テストが通る」「型エラーがない」など客観基準
  3. ウォームアップを考慮する:各ツール1回目は慣らしとし、2回目以降を計測対象にする
  4. ネットワーク環境を統一する:APIレイテンシの差を排除

参考リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?