背景
がんがんモデルが増えるので、新しいやつ基本は新しいやつ使えばいいや、となんとなく使ってた。
が、 Premium Request の上限はあるわけで、 x 0 なんかを節約で使うことも多い。
Auto で 10% Discount が一番いいのかもしれないが・・とりあえず調べておいた記録
まとめ
-
用途ごとの推奨: マルチファイル解析・エージェント →
GPT-5.2。 -
低コスト大量バッチ: 0x であるうちは、
Grok Code FastorGPT-5 mini。Grok は VLM じゃないので、画像渡したいときは諦める -
大規模ドキュメント / 長コンテキスト:
Gemini 3 Proは 1M トークン級の強みがあり、1xの間は『お得』。公式 には 10x なので注意。 - Default 使いは 1x モデルの
Gemini 3 Pro,Claude Sonnet 4.5,GPT-5.1 Codex Max,GPT-5.2辺りを切り替えつつ - 月末近くで余りそうなら、
Claude Opus 4.5なんかで使い切りを目指す - 逆に圧迫してたら、
Claude Haiku 4や、 x0 モデルで節約
Multiplier グループ別の運用比較(簡易)
倍率は運用上ざっくり次のグループに分けて考える感じか
| グループ | 代表倍率 | 運用インパクト(1 行) |
|---|---|---|
| 含まれるモデル | 0 | 有料プランではプレミアム消費なし。日常使いのデフォルトに最適。 |
| 標準モデル | 1 | 1 回の操作で 1 プレミアム消費。汎用的に利用可能。 |
| 割引ミニ/ライト | 0.25〜0.33 | コストを抑えつつ性能を確保。大量処理やインライン補完で有効。 |
| 高倍率モデル | 3〜10 | 高精度だが消費が大きい。重要タスクに限定して使うのが安全。 |
使い分け例:
- 日常の IDE 内補完・軽いリライト:
GPT-5 mini(0)。 - PR の自動生成や長いリファクタ:
GPT-5.2(1)を基本に使用。 - セキュリティクリティカルな解析や高品質要約: Claude Opus 系(3〜10)を限定的に使用。
調査した公式ソース
- OpenAI Models: https://platform.openai.com/docs/models
- OpenAI GPT-5.2: https://platform.openai.com/docs/models/gpt-5.2
- OpenAI GPT-5.1: https://platform.openai.com/docs/models/gpt-5.1
- OpenAI GPT-5 mini: https://platform.openai.com/docs/models/gpt-5-mini
- GitHub Copilot — Model multipliers: https://docs.github.com/en/copilot/concepts/billing/copilot-requests#model-multipliers
- Microsoft Copilot Studio — Model selection: https://learn.microsoft.com/en-us/microsoft-copilot-studio/authoring-select-agent-model
- Google Gemini models: https://ai.google.dev/models
比較表(一部)
- 注: 単価は記事では省略しました。コンテキストと Copilot の
multiplierを重視しています。
| モデル | Multiplier (Copilot) | 表示値(UI) | レイテンシ目安 | 主な用途 |
|---|---|---|---|---|
| GPT-5.2 | 1 | 1x | 高 | マルチファイルリファクタ、エージェント、深いコード解析 |
| GPT-5 mini | 0 | 0x | 低 | インライン補完、短いスニペット、大量バッチ |
| Claude Opus 4.1 | 10 | 10x | 高 | 長文理解、分析 |
| Claude Opus 4.5 | 3 | 3x | 高 | 長文理解、分析 |
| Claude Sonnet 4.5 | 1 | 1x | 中 | 会話、タスク |
| Claude Haiku 4.5 | 0.33 | 0.33x | 低 | 軽量会話 |
| Gemini 3 Pro | 10 | 1x (Preview) | 高 | 大規模ドキュメント解析 |
| Gemini 2.5 Pro | 3 | 1x | 中 | 高品質生成 |
| Gemini 2.5 Flash | 1 | 1x | 低 | 高速応答 |
| Grok Code Fast | 0.25 | 0x | 低 | コード補完・解析 |
あとがき
営業日が 20 日として、5%/day を意識して 100% を調整しないと、すぐに従量課金に行ってしまうので意識用に調査してみた。
ただ、節約を意識しすぎて品質落ちてももったいないので、従量課金も視野に使った方が良いとは思う。