【2026年2月】Claude Sonnet 4.6がリリース！新機能・ベンチマーク・API変更点まとめ

Posted at 2026-02-18

はじめに

2026年2月17日、AnthropicがClaude 4ファミリーの中位モデル Claude Sonnet 4.6 を発表しました。前モデルのSonnet 4.5（2025年9月リリース）から約5ヶ月ぶりのアップデートで、Opus 4.6のリリース（2月5日）からわずか12日後という驚くべき速さです。

最大のポイントは「Opus級の性能をSonnet価格で」という点。コーディング・コンピューター操作・業務タスクで旧フラッグシップのOpus 4.5を超える場面も見られ、コスト重視の開発者・エンタープライズにとって極めて注目度の高いリリースです。

本記事では、開発者・エンジニア向けに新機能とAPI変更点を整理します。

モデルスペック

項目	Sonnet 4.6
モデルID	`claude-sonnet-4-6`
コンテキストウィンドウ	200Kトークン（1Mトークンがベータ提供）
最大出力トークン	64K
価格（入力/出力）	$3 / $15 per 1Mトークン（据え置き）
デフォルトプラン	Free・Pro・Teamプランの標準モデルに昇格

同価格でパフォーマンスが大幅に向上しているため、Sonnet 4.5を使っているユーザーは迷わず移行できます。

主要な新機能

1. Adaptive Thinking（適応的思考）

Opus 4.6に続いてSonnet 4.6でも利用可能になりました。タスクの複雑さに応じてモデルが思考の深さを自動調整します。

response = client.messages.create(
    model="claude-sonnet-4-6",
    thinking={"type": "adaptive"},
    effort="high",  # low / medium / high / max の4段階
    max_tokens=1000,
    messages=[{"role": "user", "content": "..."}]
)

effort パラメータはベータヘッダー不要でGA（一般提供）済みです。ほとんどのユースケースでは "high"（デフォルト）で十分な精度が得られます。

⚠️ thinking: {type: "enabled", budget_tokens: N} は**非推奨（deprecated）**です。早めに移行しましょう。

2. 1Mトークンコンテキストウィンドウ（ベータ）

Sonnetクラスとして初めて、100万トークンのコンテキストウィンドウがベータ提供されます。「コードベース全体・長大な契約書・数十本の論文を1リクエストで処理できる」とAnthropicは説明しています。

従来のSonnet 4.5における最大ウィンドウ（500K）の2倍にあたります。

# ベータヘッダーで有効化
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    extra_headers={"anthropic-beta": "long-context-window-2025-11-05"},
    messages=[{"role": "user", "content": "..."}]
)

3. Compaction（コンテキスト圧縮）の全ユーザー開放

コンテキスト上限に近づくと古い会話部分を自動的にサマリーに変換し、事実上の無限会話を実現するCompaction機能が、無料プランを含む全ユーザーに開放されました。

長時間動作するエージェントや会話型アプリケーションにとって大きなアップデートです。

4. 無料プランの大幅強化

これまで有料プランのみで利用できた以下の機能が、Freeプランでも利用可能になりました。

ファイル作成（docx / xlsx / pptx 等）
コネクター（Google Drive・Gmail 等との連携）
スキル
コンテキスト Compaction

5. ツール群のGA（一般提供化）

ベータヘッダーが不要になったツールが増えました。

コード実行ツール: サーバーサイドでPythonコードを直接実行
メモリツール: 会話を跨いだ情報の記憶・参照
Fine-grained Tool Streaming: ストリーミングのツール呼び出し

ベンチマーク結果

主要ベンチマークでのスコアをまとめます（2026年2月時点）。

ベンチマーク	Sonnet 4.6	Sonnet 4.5	Opus 4.6
SWE-bench Verified	79.6%	77.2%	80.8%
OSWorld-Verified	72.5%	61.4%	72.7%
ARC-AGI-2	60.4%	13.6%	68.8%
Terminal-Bench 2.0	59.1%	51.0%	65.4%
GDPval-AA（Elo）	1633	-	1606
Finance Agent v1.1	63.3%	-	60.1%
GPQA Diamond	89.9%	83.4%	91.3%
BrowseComp	74.7%	-	84.0%

注目ポイントが2つあります。

① コーディング・コンピューター操作でOpus 4.6と僅差：SWE-bench（79.6% vs 80.8%）・OSWorld（72.5% vs 72.7%）ともに1〜2ポイント以内の差に収まっており、コスト効率を考えればSonnet 4.6が多くの場面で最適解になります。

② オフィス業務・金融タスクではOpus 4.6を上回る：GDPval-AA（1633 vs 1606 Elo）・Finance Agent（63.3% vs 60.1%）ではSonnet 4.6がOpus 4.6を逆転しており、スプレッドシート操作や財務分析の精度は実は上位モデルを超えています。

ARC-AGI-2では13.6% → 60.4%と約4.3倍の改善を記録。抽象的な推論力の飛躍的な向上が確認されています。

開発者の選好率

Claude Codeを使った内部評価では、以下の選好率が報告されています。

Sonnet 4.6 vs Sonnet 4.5：**70%**がSonnet 4.6を選択
Sonnet 4.6 vs Opus 4.5（旧フラッグシップ）：**59%**がSonnet 4.6を選択

Sonnetクラスのモデルが前世代フラッグシップを上回る選好率を記録したのは初めてのことです。

API移行時の注意点（Breaking Changes）

Opus 4.6と共通する変更点です。Sonnet 4.5からの移行前に確認してください。

❌ アシスタントメッセージのプリフィルが廃止

Sonnet 4.6でもプリフィルを行うと 400エラー が返ります。構造化出力（Structured Outputs）やシステムプロンプトでの指示に移行してください。

# NG: Sonnet 4.6ではエラーになる
messages = [
    {"role": "user", "content": "JSONを返して"},
    {"role": "assistant", "content": "{"}  # ← 400エラー
]

# OK: output_configで構造化出力を指定
response = client.messages.create(
    model="claude-sonnet-4-6",
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    messages=[{"role": "user", "content": "JSONを返して"}]
)

✅ Sonnet 4.5からの移行難易度は低い

AnthropicはSonnet 4.5からSonnet 4.6への移行は「軽微なプロンプト調整のみで対応可能」と説明しています。プリフィル廃止に対応済みであれば、モデルIDを変更するだけでほぼそのまま動作します。

安全性

Sonnet 4.6の安全性評価では以下の結果が報告されています。

温かく、誠実で、社会的な性格 と評価され、高い安全性動作が確認
コンピューター操作時のプロンプトインジェクション耐性：Sonnet 4.5と比較して大幅に改善
全体的に他の最新Claudeモデルと同等以上の安全性を達成

まとめ

Claude Sonnet 4.6は「中位モデルがフラッグシップを追い抜く」という業界トレンドを象徴するリリースです。特にエンジニアにとって重要なポイントは以下です。

Opus 4.6と僅差のコーディング・コンピューター操作性能をSonnet価格（1/5以下）で利用可能
ARC-AGI-2が約4.3倍に向上し、抽象的推論力が別次元に
オフィス業務・金融タスクはOpus 4.6を逆転しており、企業ユースケースに最適
1Mコンテキスト（ベータ） でコードベース全体の一括処理が現実的に
無料プランでもCompaction・ファイル作成などが利用可能に
プリフィル廃止の破壊的変更に注意（Opus 4.6と共通）

価格据え置きで性能が大幅に向上しており、Sonnet 4.5ユーザーは積極的に移行する価値があります。コスト最適化を考えると、Opus 4.6が真に必要なのは深い科学的推論や最高難度のマルチステップエージェントに限られてきています。

参考リンク

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up