【2026年2月】Claude Opus 4.6がリリース！新機能・ベンチマーク・API変更点まとめ

Posted at 2026-02-06

はじめに

2026年2月5日、AnthropicがClaude 4.5ファミリーの最新フラグシップモデル Claude Opus 4.6 を発表しました。前モデルのOpus 4.5（2025年11月リリース）からわずか3ヶ月弱でのアップデートですが、その進化幅は大きく、エンタープライズAI活用における転換点とも言える内容です。

本記事では、開発者・エンジニア向けに新機能とAPI変更点を整理します。

モデルスペック

項目	Opus 4.6
モデルID	`claude-opus-4-6`
コンテキストウィンドウ	200Kトークン（1Mトークンがベータ提供）
最大出力トークン	128K（従来の64Kから倍増）
価格（入力/出力）	$5 / $25 per 1Mトークン（据え置き）
推論ジオ指定	`us` 指定可（+10%の料金）

Opus 4.5と同価格でスペックが大幅に向上しているため、既存ユーザーは移行しない理由がほぼありません。

主要な新機能

1. Adaptive Thinking（適応的思考）

Opus 4.6の目玉機能です。従来の thinking: {type: "enabled", budget_tokens: N} に代わり、モデルが タスクの複雑さに応じて思考の深さを自動的に調整 する仕組みが導入されました。

# 推奨される新しい書き方
response = client.messages.create(
    model="claude-opus-4-6",
    thinking={"type": "adaptive"},
    effort="high",  # low / medium / high / max の4段階
    max_tokens=1000,
    messages=[{"role": "user", "content": "..."}]
)

effort パラメータはベータヘッダー不要でGA（一般提供）になりました。新たに追加された max レベルでは最高精度の推論が得られます。デフォルトは high で、ほぼ常にthinkingが実行されます。

⚠️ thinking: {type: "enabled", budget_tokens: N} と interleaved-thinking-2025-05-14 ベータヘッダーは 非推奨（deprecated） です。動作はしますが、将来のリリースで削除予定なので早めに移行しましょう。

2. Compaction（コンテキスト圧縮）

サーバーサイドで自動的にコンテキストを要約・圧縮してくれる機能です。コンテキストウィンドウの上限に近づくと、古い会話部分が自動的にサマリーに変換され、事実上の無限会話 が可能になります。

長時間動作するエージェントやチャットボットにとっては非常に大きなアップデートです。

3. Agent Teams（Claude Code）

Claude Codeで利用可能な新機能で、複数のAIエージェントがチームとして並列で作業 できるようになりました。

従来は1つのエージェントが逐次的にタスクを処理していましたが、Agent Teamsでは大きなタスクをサブタスクに分割し、各エージェントが担当部分を並行して進めます。人間の開発チームのような協調動作をAIが再現する形です。

現在はAPI向けにリサーチプレビューとして提供されています。

4. 1Mトークンコンテキストウィンドウ（ベータ）

Opusファミリーとしては初めて、100万トークンのコンテキストウィンドウが利用可能になりました。ロングコンテキストの精度を測るMRCR v2ベンチマーク（8-needle, 1Mコンテキスト）では 76% を記録しており、Sonnet 4.5の18.5%から劇的に向上しています。

大規模コードベース全体の把握や、長大なドキュメント処理が現実的になります。

5. Claude in PowerPoint（リサーチプレビュー）

PowerPoint内でClaude をサイドパネルとして利用可能に。既存のスライドのカラー・フォント・レイアウトを読み取り、企業テンプレートに沿ったスライドを生成できます。Claude in Excelも大幅にアップグレードされ、乱雑なスプレッドシートの自動解釈が改善されました。

6. データレジデンシー制御

inference_geo パラメータにより、APIリクエスト単位で推論の実行リージョンを指定できるようになりました。

response = client.messages.create(
    model="claude-opus-4-6",
    inference_geo="us",  # US内のみで処理を保証（料金1.1倍）
    # ...
)

コンプライアンス要件の厳しい業界にとって重要な機能です。

ベンチマーク結果

主要ベンチマークでのスコアをまとめます（2026年2月時点）。

ベンチマーク	Opus 4.6	備考
Terminal-Bench 2.0	65.4%	業界最高スコア（Opus 4.5: 59.8%）
GDPval-AA	1606 Elo	GPT-5.2を144 Elo上回る
BrowseComp	業界最高	マルチステップのエージェント検索
OSWorld	72.7%	Opus 4.5: 66.3%
BigLaw Bench	90.2%	法務タスクでの高い精度
MRCR v2 (1M)	76%	Sonnet 4.5: 18.5%
Humanity's Last Exam	業界最高	多分野横断の高難易度推論

コーディング、知識ワーク、長文コンテキスト処理のいずれにおいてもフロンティアモデルの中でトップクラスの性能です。

API移行時の注意点（Breaking Changes）

既存のClaude APIユーザーは、以下の変更点に注意が必要です。

❌ アシスタントメッセージのプリフィルが廃止

Opus 4.6では、アシスタントメッセージのプリフィル（事前入力）を行うと 400エラー が返ります。構造化出力（Structured Outputs）やシステムプロンプトでの指示に移行してください。

❌ `output_format` パラメータの移動

output_format は output_config.format に移動しました。旧パラメータも動作しますが非推奨です。

# Before
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# After
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

✅ Fine-grained tool streaming がGA

全モデル・全プラットフォームでベータヘッダー不要で利用可能になりました。

安全性

Opus 4.6は安全性評価でも業界最高水準を記録しています。

ミスアラインメントスコア: 約1.8/10（業界で最も低い）
過剰拒否率: Claudeモデル中で最も低い
サイバーセキュリティ分野で新たに6つの評価プローブが開発され、40件中38件でトップの結果

まとめ

Claude Opus 4.6は「バージョン番号は小さいが中身は大きい」アップデートです。特に以下の点がエンジニアにとって重要です。

Adaptive Thinking でコスト・速度・品質のトレードオフを柔軟に制御
Compaction で長時間エージェントタスクが現実的に
1Mコンテキスト（ベータ） で大規模コードベースの丸ごと処理が可能に
Agent Teams による並列エージェント協調
プリフィル廃止 など破壊的変更があるため、移行前にコードの確認を

料金据え置きで性能が大幅に向上しているため、Opus 4.5からの移行は積極的に検討する価値があります。

参考リンク

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up