目次
- 1. はじめに
- 2. 料金改定の概要
- 3. 大事なこと①:モデルの単価・用途を理解しておく
- 4. 大事なこと②:トークン使用量を把握する
- 5. 頑張ったら追加料金無しで月に2000リクエストできる
- 6. まとめ
- 7. 参考記事
1. はじめに
2025年9月15日をもって、Cursorの料金体系が固定料金制から従量課金制へと移行しました。この料金改定により、特に企業利用者はコスト管理の面において苦戦しているのではないでしょうか。弊社ではまさにその壁に直面しております。
本記事では、月40ドルのteamsプランにおいて、いかにしてCursorのパフォーマンスをキープしつつコストを削減するのかに焦点を当てて解説していきたいと思います。
2. 料金改定の概要
改定前も後も、Teamsプランの基本料金が1ユーザーあたり月額40ドルであることに変わりはありません。変更した内容は「基本料金の40ドルで何ができるか」という点にあります。
従来のTeamsプランでは、基本料金の中に月500回の高速プレミアムリクエストが含まれており、これを使い切った後も低速リクエストであれば無制限に利用可能でした。
一方で改定後のTeamsプランでは、基本料金で提供される内容が毎月20ドル分のクレジットになりました。このクレジットは、利用モデル価格 + Cursorトークン手数料(100万トークンあたり0.25ドル) で計算され、20ドル分のクレジットを使い切った場合には追加料金が必要となります。
まあ簡潔に言うとこんな感じです↓
- 月40ドルで使い放題じゃなくなった。使った分だけ払わないといけない。
- コスト予測が超難しい。従来はリクエスト回数がそのまま料金に反映されてたのに対し、今後は「どのモデルで、どの程度トークン量を使用したか」を考えて計算しないとダメ。
デフォルトの設定では20ドル分のクレジット利用超過後はオンデマンド利用が継続されるように設定されていますが、管理ダッシュボードから利用制限を設けることは可能です。ユーザー単位で超過可能クレジット数も設定できるようです。
3. 大事なこと①:モデルの単価・用途を理解しておく
コスト節約のためにも、Cursorを使いこなすためにも、どのモデルを利用するかは非常に大切です。最適なモデルを自動選択してくれるAutoモードもありますが、企業利用者には推奨できません。コストまで加味した選択とは限らないからです。
そのため、利用者自身がモデル単価・モデル用途を把握した上で適宜使い分けることを強く推奨します。まずはCursorで提供されている主要モデルの単価・用途を見ていきましょう。
※入力トークンの値段は100万トークンあたりの価格となります。
※実際には出力トークンも計算対象ですが、コスト影響を及ぼす大半の要素は入力トークンであるため、今回は出力トークン単価の記載は省略しています
モデル名 | 入力 | 用途 |
---|---|---|
claude-4.1-opus | $15 | 難易度高めの設計やバグ分析が得意。 |
claude-4.5-sonnet | $3 | 品質の高いコーディングを長時間できる。たまに余計なこともする。 |
claude-3.5-haiku | $0.80 | 文章を書くのに最適。日本語に強い。 |
GPT-5 pro | $15 | 現時点では最も精度が高い。最後の砦。 |
GPT-5 | $1.25 | 設計、コーディング、バグ分析、コードレビュー等にかなり強い。応答速度が少し遅い。 |
GPT-5-Codex | $1.25 | GPT-5との違いがあまりわからないが、よりコーディングに特化してるイメージ。 |
GPT-5 mini | $0.25 | GPT-5より少しだけ性能が劣る。応答速度はGPT-5よりも少し早い。 |
GPT-5 nano | $0.05 | GPT5系の中で応答速度は最速。難易度の低いコーディングに適している。 |
gpt-4.1 | $3 | 指示に忠実で無駄なことをしない。 |
gemini-2.5-pro | $1.25 | コード分析におすすめ。コーディングもできるけど余計なことをしがち。 |
gemini-2.5-flash | $0.3 | コーディング、ドキュメント生成を高速で実施。精度はバラツキありで、たまに余計なこともする。 |
Grok-code-fast-1 | $0.20 | とにかくコーディングが早い。品質も高いが、GPT-5には劣るかも。 |
Grok-4-0709 | $3.0 | 思考の整理に超おすすめ。 |
見ての通り、どのモデルを使用するかで100倍以上のコストの差が発生してしまうので、コスト意識を持ってモデルを選択することは必須事項であると言えるでしょう。
有効活用していきたいのはGPT-5系です。性能・コストともにパフォーマンスがかなり高いですし、中でもminiとnanoは段違いで安いので、積極的に使用してみていいと思います。
Grok-code-fast-1も早く、安く、品質の高いコーディングが可能なのでおすすめです。
簡単なターミナル操作やドキュメント生成はgemini-2.5-flashがオススメですね。安くて早いです。ドキュメントに関してはclaude3.5 haikuもいいかなと。
一方で、Claudeのopus系、sonnet系は性能こそ高いですが、GPT-5を上回るとは思い難く、何より高いです。モデルの特性を深く理解している上級者の方はもちろん使用していいかと思いますが、CursorやLLMに関して初心者である方はまず避けるべきモデルかと思います。
あくまで私の主観ですので、参考程度にご覧ください。コスト意識を持って、自分自身で用途を確認することが最重要事項です。
チームでモデルの用途について議論してみるのもいいかと思います!
4. 大事なこと②:トークン使用量を把握する
モデルの単価と用途を理解したので、次は実際の開発シーンにおけるトークン消費量の目安について考えていきます。まずトークン量の数え方としては、大体以下のようなイメージで考えてもらってOKです。
行数 | トークン数の目安 |
---|---|
10行 | 200 |
100行 | 2,000 |
1,000行 | 20,000 |
10,000行 | 200,000 |
50,000行 | 1,000,000 |
しかし、100行の変更をするために必要なトークン量が2000であるかというと、そんな簡単にはいきません。CursorでLLMモデルとやり取りをする以上、様々なコンテキストを与えることを前提としているからです。
そのため、どんなに軽量なタスクや会話であっても、1リクエストあたり10,000トークン〜30,000トークンが消費されていると想定する必要があります。
タスク別で消費トークン量を考えると、以下のようなイメージです(出力量はほぼ一定で3000トークン程度と仮定)。
タスク | 入力トークン | 出力トークン | 総計トークン |
---|---|---|---|
軽微な変更/コメント追加 | 7,000〜9,000 | 3,000 | 10,000〜12,000 |
中規模の機能追加・修正 | 12,000〜27,000 | 3,000 | 15,000〜30,000 |
大規模機能追加 リファクタ |
30,000〜57,000 | 3,000 | 33,000〜60,000 |
超大規模リファクタ | 60,000〜197,000 | 3,000 | 63,000〜200,000 |
トークンにもキャッシュがある
LLM APIを利用するにあたり、カウントされるトークンにもキャッシュが存在します。過去に使用された文脈を再利用するイメージです。これは通常の入力トークンコストよりも約80%ほど安くなります。
しかし、モデルを切り替えるとキャッシュされたトークンはそのモデルのキャッシュとしては認識されず、再度入力トークンとして扱われてしまいます。よって、チャット内でモデルを切り替えるとキャッシュトークンとしてのコストの恩恵を受けることができません。
同一モデルの継続使用に固執する必要はありませんが、覚えておいて損は無いと思います。
使用トークン量はダッシュボードから確認できる
どのモデルで、どれほどのトークン量を消費し、結果的なコストがいくらであるのか、全てダッシュボードから確認することができます。
このようにカーソルを当てれば、トークン量の内訳まで確認することもできます。
はじめのうちは、自分がどの程度トークン量を消費しているのか、ダッシュボードをこまめに確認することを推奨します。そうすれば、1リクエストあたりにかかるコストの把握も容易になるはずなので、是非チームで取り組んでみてください!
5. 頑張ったら追加料金無しで月に2000リクエストできる
使用モデルとトークン消費量さえ意識しておけば、月額40ドルのTeamsプランで提供される20ドル分のクレジット内で(追加料金無しで)、月2000リクエストが可能です。この理屈を説明していきます。
1リクエスト0.01ドルを目指す
月2000リクエスト実現のために逆算するとこうなります。
- 月20ドル分のクレジットで、2000リクエストしたい
- 1日あたり1ドルのコストで、100リクエストしたい(月の労働日数を20日と仮定)
- 1リクエストあたりのコストを0.01ドルにおさえたい
つまり、1リクエストを0.01ドル以内に抑えることが月2000リクエスト実現のための鍵となります。この数字は意外と現実的で、安価なモデルを適切に使い分けることで十分に達成可能です。
0.01ドル分のリクエストで消費できるトークン量を考えてみる
Cursorのコスト計算は「利用モデル価格 + Cursorトークン手数料(100万トークンあたり0.25ドル)」で行われるため、1リクエスト0.01ドルと仮定した際のトークン使用上限は以下のようになります。
- GPT-5 nano (0.05 + 0.25 = $0.30/100万トークン): 最大33,333トークンまで使用可能
- GPT-5 mini (0.25 + 0.25 = $0.50/100万トークン): 最大20,000トークンまで使用可能
- gemini-2.5-flash (0.30 + 0.25 = $0.55/100万トークン): 最大18,181トークンまで使用可能
- Grok-code-fast-1 (0.20 + 0.25 = $0.45/100万トークン): 最大22,222トークンまで使用可能
- GPT-5(Codex) (1.25 + 0.25 = $1.50/100万トークン): 最大6,666トークンまで使用可能
ご覧の通り、コストパフォーマンスの高いモデルを使用すれば、1リクエストを0.01ドル以内に収めることは十分に可能であると言えるでしょう。
タスク別モデル選択とトークン管理
軽微な変更であれば、GPT-5 nanoやGrok-code-fast-1などの安価なモデルを主体として活用します。中規模の機能修正・追加では、GPT-5 miniを主体としつつ、必要に応じてGPT-5またはGPT-5-Codexを使用することで、品質を確保しつつコストをコントロールします。
大規模な機能追加やリファクタリングの場合は、GPT-5またはGPT-5-Codexを主体にタスクを分割し、分割後の各タスクをGPT-5 nano、GPT-5 mini、Grok-code-fast-1で実装するというアプローチが効果的かなと思います。
その他Tips
-
無料モデルの活用
Cursorでは期間限定で無料で使えるモデルが提供されることがあります(20225年10月15日時点現ではGrok-code-fast-1やcode-supernova-1-millionが該当)。これらを積極的に使うことでコストをさらに削減できますが、Cursorトークン手数料(100万トークンあたり0.25ドル)は別途必要である点に注意してください。 -
インライン編集の活用
軽微な修正はチャット経由ではなくインライン編集機能を使うことで、提示するコンテキスト量を最小化でき、トークン使用量を抑制できます。インライン編集についてはこちらで解説してます。
-
チャットの粒度を小さく保つ
1つのチャットに多くのタスクを詰め込まないようにしましょう。出力品質を保つためにも、余計なトークン消費を避けるためにも、タスクごとにチャットを分け、必要十分なコンテキストだけを与えるのが有効です。
6. まとめ
CursorのTeamsプラン変更は、企業にとってコスト意識を高める良い機会です。開発者一人一人が、モデル単価とトークン量を意識してLLMを使い分けることで、開発コストを抑えつつ成果を最大化することができます。チーム全体でこの意識を共有し、より賢くAIを活用していきましょう。
7. 参考記事
本記事で紹介した各モデルの料金体系について、より詳細な情報や最新の価格を確認したい場合は、以下の公式ドキュメントをご参照ください。
API料金に関しては各プロバイダーの公式サイトから引用しています。
Cursorの料金体系に関しては、こちらの公式ドキュメントを参考にしています。