はじめに
2026年6月30日、Anthropicから Claude Sonnet 5 が一般提供開始されました。2026年2月にリリースされた Sonnet 4.6 から約4ヶ月ぶりのメジャーアップデートで、「これまでより大きく高価なモデルが必要だった水準のエージェント性能を、ミドルサイズモデルで実現した」(Anthropic公式)と位置づけられるリリースです。
特筆すべきは以下の3点です。
- 導入価格は入力 $2 / 出力 $10 per 1M tokens(2026年8月31日まで。以降は標準価格 $3 / $15 に移行)と、価格据え置きでOpus級に迫る性能向上
-
Free / Pro プランのデフォルトモデルに昇格。Claude Code / API 経由でも
claude-sonnet-5として即利用可能 - 自律的な計画立案・ツール利用(ブラウザ、ターミナル)の水準が、数ヶ月前まで大型モデルでなければ不可能だったレベルに到達
本記事はClaude API・Claude Code・Amazon Bedrock経由でSonnetを利用している開発者向けに、Sonnet 4.6 → 5 移行判断に必要な情報をまとめます。
モデルスペック
| 項目 | Claude Sonnet 5 |
|---|---|
| モデルID | claude-sonnet-5 |
| リリース日 | 2026年6月30日 |
| 入力価格(標準) | $3 / 1M tokens(導入価格 $2、2026年8月31日まで) |
| 出力価格(標準) | $15 / 1M tokens(導入価格 $10、2026年8月31日まで) |
| コンテキストウィンドウ | 1M tokens |
| 最大出力 | 128K tokens |
| ビジョン最大解像度 | 長辺2,576px(Sonnet系列で初の高解像度対応) |
| 提供形態 | Anthropic API / Amazon Bedrock / Google Vertex AI / Microsoft Foundry / Claude Code |
| 提供プラン | Free(デフォルト)/ Pro(デフォルト)/ Max / Team / Enterprise |
Free・Proプランのデフォルトモデルとして提供される点が今回の大きな特徴です。Opus 4.8 は引き続きより高精度が求められるタスクの選択肢として残りますが、Sonnet 5 は「価格を抑えつつ大幅に品質が上がった」実務向けの主力モデルという位置づけです。
主要な新機能・変更点
1. エージェント性能の大幅向上
Sonnet 4.6比で、推論・ツール利用・ソフトウェアコーディング・ナレッジワーク全般にわたり大きな改善が見られます。自律的にプランを立て、ブラウザやターミナルなどのツールを使いこなして作業を進める能力が、「数ヶ月前なら大型・高価なモデルでなければ届かなかった水準」に到達したとAnthropicは説明しています。
2. アダプティブシンキングがデフォルトで有効に
Sonnet 4.6では thinking パラメータを省略すると思考なしで動作していましたが、Sonnet 5では省略時にアダプティブシンキングが有効になります。
import anthropic
client = anthropic.Anthropic()
# thinkingを省略してもアダプティブシンキングが有効になる
response = client.messages.create(
model="claude-sonnet-5",
max_tokens=16000,
messages=[
{"role": "user", "content": "このコードのバグを調査してください"}
],
)
明示的に無効化したい場合は thinking={"type": "disabled"} を指定します。逆に、思考内容をUIに表示したい場合は display: "summarized" を明示しないと、デフォルトの "omitted" により中身が空文字列で返る点に注意してください。
response = client.messages.create(
model="claude-sonnet-5",
max_tokens=16000,
thinking={"type": "adaptive", "display": "summarized"},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)
3. effort パラメータが xhigh まで対応
Sonnet系列として初めて、low / medium / high / xhigh / max の全レベルに対応しました。デフォルトは high(Sonnet 4.6と同じ)で、コーディング・エージェント用途の最難関タスクでは xhigh を推奨しています。
output_config={"effort": "xhigh"} # 最難関のコーディング・エージェントタスク向け
目安として、Sonnet 5の medium はSonnet 4.6の high 相当、Sonnet 5の high はSonnet 4.6の max 相当の知的水準に達するとされています。
4. 新トークナイザー導入(実質トークン数 約1.3倍)
Opus 4.7/4.8と同じ新トークナイザーを採用しており、同一テキストでもSonnet 4.6比で約30%多いトークン数になります。価格は据え置き(むしろ導入価格で下がっている)ですが、コンテキストウィンドウの実質的な使用効率やコスト試算には影響するため、count_tokens での再計測を推奨します。
5. サンプリングパラメータの非対応
Opus 4.7/4.8と同様、temperature / top_p / top_k にデフォルト値以外を設定すると400エラーになります。
6. 高解像度ビジョン対応(Sonnet系列で初)
画像入力の最大解像度が長辺2,576px(約3.75メガピクセル)まで拡大。Sonnet系列としては初の高解像度対応で、密集したドキュメントやUIスクリーンショットの認識精度が向上します。ただし、フル解像度画像は従来比で最大約3倍のトークンを消費する点に注意してください。
7. 安全性の改善
エージェント運用における不正利用への協力や欺瞞行為の発生率がSonnet 4.6より低下。プロンプトインジェクション攻撃への耐性、悪意あるリクエストへの拒否精度も向上しています。
移行時の注意点(Breaking Changes)
⚠️ thinking の指定方法が変更
Sonnet 4.6で機能していた thinking: {"type": "enabled", "budget_tokens": N}(過渡的な救済措置)は、Sonnet 5では完全に廃止され400エラーになります。アダプティブシンキングへの切り替えが必須です。
# Before(Sonnet 4.6、非推奨の過渡的措置)
thinking={"type": "enabled", "budget_tokens": 10000}
# After(Sonnet 5)
thinking={"type": "adaptive"}
output_config={"effort": "high"}
⚠️ thinking 省略時の挙動がサイレントに変化
前述の通り、Sonnet 4.6では thinking 省略時に思考なしで動作していましたが、Sonnet 5ではアダプティブシンキングが有効になります。エラーは出ないため、max_tokens を思考なし前提でギリギリに設定していた場合、出力が途中で切れる可能性があります。
⚠️ 新トークナイザーで実質トークン数が増加
同一テキストで約30%多いトークン数になるため、max_tokens やコンテキスト圧縮のトリガー、コスト試算を再計測してください。
✅ 価格据え置き・モデルID差し替えのみで基本動作
# Before(Sonnet 4.6)
response = client.messages.create(
model="claude-sonnet-4-6",
thinking={"type": "adaptive"},
...
)
# After(Sonnet 5)
response = client.messages.create(
model="claude-sonnet-5", # IDを差し替えるだけ
thinking={"type": "adaptive"},
output_config={"effort": "xhigh"}, # コーディング・エージェント用途で推奨
...
)
✅ Claude Code / Bedrock / Vertex AI / Foundry で同時GA
Anthropic API だけでなく Amazon Bedrock・Google Cloud Vertex AI・Microsoft Foundry・Claude Code の全チャネルで即日GA。マルチクラウド構成でも移行タイミングの差は発生しません。
ベンチマークと料金の位置づけ
Anthropic公式・報道によると、Sonnet 5はSonnet 4.6比でエージェント系タスク(推論・ツール利用・コーディング・ナレッジワーク)全般で大きな改善を示しています。Opus 4.8は引き続き最高精度を求めるタスクの選択肢として残りますが、Sonnet 5は「より低価格でOpus級に迫る品質」を提供する開発者向けの中核モデルという立ち位置です。
導入価格(入力$2 / 出力$10 per 1Mトークン、2026年8月31日まで)は標準価格からさらに引き下げられており、コスト効率を重視するワークロードでの採用ハードルが低くなっています。
まとめ
Sonnet 5は、Opus級のエージェント性能をミドルサイズモデルのコストで手に入れられるリリースです。Sonnet 4.6を本番運用しているチームは、以下の観点で移行検討すべきタイミングに来ています。
-
thinking設定の見直し:budget_tokensは完全廃止。アダプティブシンキングへの切り替えが必須 -
thinking省略時の挙動変化に注意:デフォルトでアダプティブシンキングが有効になるため、max_tokensに余裕を持たせる -
トークン数の再計測:新トークナイザーで実質トークン数が約30%増加。
count_tokensで再計測し、コスト試算とコンテキスト管理を更新 -
effortの再チューニング:コーディング・エージェント用途ではxhighの活用を検討 - 導入価格の活用:2026年8月31日までの割引価格でコスト効率を最大化
特にコスト効率を重視しつつOpus級の品質を求めるエージェント運用・コーディング支援のワークロードでは、即検討価値ありです。