はじめに
2026年2月5日、Anthropicが最新フラグシップモデル Claude Opus 4.6 を発表しました。
前モデル Opus 4.5 から大幅に強化され、1Mトークンのコンテキストウィンドウ、Agent Teams(マルチエージェント協調)、Adaptive Thinking(適応的思考)など注目の新機能が多数搭載されています。
本記事では、公開直後の情報をもとにOpus 4.6の新機能・ベンチマーク・開発者向けの変更点を速報としてまとめます。
背景:Opus 4.5からの進化
Claude Opus 4.5は2025年に登場し、コーディング能力の高さで評価されていました。今回のOpus 4.6では、その強みをさらに伸ばしつつ、以下の方向で大きく進化しています。
- コンテキストウィンドウの大幅拡大(200K → 1M)
- 出力トークン数の増加(最大128Kトークン)
- マルチエージェント協調の導入
- 推論品質の向上(ベンチマーク全般で大幅スコアアップ)
- 開発者ツールの強化(effort parameter、context compaction等)
主要な新機能
1. 1Mトークン コンテキストウィンドウ(ベータ)
コンテキストウィンドウが 100万トークンに拡大。これにより、巨大なコードベース全体をコンテキストに含めたり、数百ページのドキュメントを一度に処理したりすることが可能になります。
| 項目 | Opus 4.5 | Opus 4.6 |
|---|---|---|
| コンテキスト | 200K | 1M(ベータ) |
| 最大出力 | 32K | 128K |
補足: 200Kトークンを超えるプロンプトにはプレミアム価格(入力 $10/出力 $37.50 per Mトークン)が適用されます。
2. Agent Teams(リサーチプレビュー)
Claude Codeに導入された新機能。複数のAIエージェントが並列で作業し、自律的に協調します。
- 大規模タスクをセグメント化し、各エージェントが担当
- コードベースレビューなどのread-heavyな作業に特に有効
- エージェント間で直接コミュニケーションして調整
-
Shift+Up/Downまたはtmuxでサブエージェントを操作可能
例:大規模リファクタリングの場合
├── Agent A: フロントエンドのコンポーネント修正
├── Agent B: APIエンドポイントの更新
├── Agent C: テストコードの修正
└── メインAgent: 全体の調整・マージ
3. Adaptive Thinking(適応的思考)
Anthropicモデルとして初搭載。プロンプトの文脈からどの程度深く考えるべきかを自動判断します。
- 簡単な質問には即座に回答
- 複雑な推論が必要な場合は深い思考を実行
- API側では effort parameter で明示的に制御も可能
effortレベル:
- low : 高速・低コスト(簡単なタスク向け)
- medium: バランス型
- high : デフォルト(通常利用)
- max : 最大品質(難問・重要タスク向け)
4. Context Compaction(ベータ)
長時間のセッションで古いコンテキストを自動的に要約・圧縮する機能。Claude Codeでの長時間作業時に、コンテキスト切れを防ぎつつパフォーマンスを維持します。
5. Office統合の強化
- Claude in PowerPoint(リサーチプレビュー): 既存のレイアウト・フォント・テンプレートを読み取り、ブランド一貫性を保ったスライド生成・編集が可能
- Claude in Excel: 複数ステップの処理やプランニング能力が大幅向上
ベンチマーク結果
主要ベンチマークでのスコアを整理します。多くの項目で過去最高スコアを記録しています。
コーディング
| ベンチマーク | Opus 4.5 | Opus 4.6 | 備考 |
|---|---|---|---|
| Terminal-Bench 2.0 | 59.8% | 65.4% | 全AIモデル中最高スコア |
推論・知識
| ベンチマーク | Opus 4.5 | Opus 4.6 | 競合比較 |
|---|---|---|---|
| ARC AGI 2 | 37.6% | 68.8% | GPT-5.2 Pro: 54.2%, Gemini 3 Pro: 45.1% |
| Humanity's Last Exam | - | 首位 | 複合的な多分野推論テスト |
| GDPval-AA | - | 首位 | GPT-5.2より約144 Eloポイント上回る |
長文コンテキスト
| ベンチマーク | Sonnet 4.5 | Opus 4.6 | 備考 |
|---|---|---|---|
| MRCR v2 | 18.5% | 76% | 長文コンテキスト検索精度(大幅改善) |
エージェント能力
| ベンチマーク | Opus 4.5 | Opus 4.6 | 備考 |
|---|---|---|---|
| OSWorld | 66.3% | 72.7% | コンピュータ操作ベンチマーク |
開発者向け情報
API仕様
| 項目 | 値 |
|---|---|
| モデルID | claude-opus-4-6 |
| コンテキスト | 1M tokens(ベータ) |
| 最大出力 | 128K tokens |
| 入力価格 | $5 / 1M tokens |
| 出力価格 | $25 / 1M tokens |
| 200K超プレミアム | 入力 $10 / 出力 $37.50 per 1M tokens |
| US-only推論 | 1.1× のトークン価格 |
effort parameterの使い方
APIリクエストにeffortレベルを指定することで、速度・コストと品質のトレードオフを制御できます。
import anthropic
client = anthropic.Anthropic()
# 高速・低コストで応答(簡単なタスク向け)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
thinking={
"type": "enabled",
"budget_tokens": 5000,
"effort": "low"
},
messages=[
{"role": "user", "content": "Pythonでリストの重複を除去するには?"}
]
)
# 最大品質で応答(難問向け)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=8192,
thinking={
"type": "enabled",
"budget_tokens": 50000,
"effort": "max"
},
messages=[
{"role": "user", "content": "分散システムのCAP定理の限界と回避策を論じてください"}
]
)
Claude Codeでの利用
Claude Code CLIでは、Opus 4.6がデフォルトモデルとして利用可能です。Agent Teams機能を使う場合はリサーチプレビューとして有効化できます。
# Claude Codeの更新
npm install -g @anthropic-ai/claude-code@latest
# Opus 4.6を指定して起動(デフォルトで選択される)
claude --model claude-opus-4-6
注意点
- 1Mコンテキストはベータ: 200Kを超える入力にはプレミアム価格が適用されます。安定性も本番環境では検証が必要です
- Agent Teamsはリサーチプレビュー: 実験的機能のため、本番ワークフローへの組み込みは慎重に
-
effort parameterの選択:
lowを使いすぎると品質低下の可能性があります。タスクの重要度に応じて使い分けましょう - 価格体系の変化: 基本価格は据え置き($5/$25)ですが、200K超コンテキストは2倍近い価格になる点に注意
まとめ
Claude Opus 4.6は、以下の点で大きな進化を遂げています。
- 1Mトークンコンテキストにより、大規模コードベースやドキュメントの一括処理が可能に
- Agent Teamsで複数エージェントによる並列作業が実現
- Adaptive Thinkingで無駄な推論コストを削減しつつ、必要な場面では深い思考を実行
- ベンチマーク全般で大幅改善、特にARC AGI 2(37.6% → 68.8%)やMRCR v2(18.5% → 76%)の伸びが顕著
- 価格据え置きで、コストパフォーマンスが大幅に向上
特にClaude Codeユーザーにとっては、Agent TeamsとContext Compactionの組み合わせにより、長時間の大規模開発タスクでの生産性が大きく向上することが期待されます。
参考リンク
- Anthropic公式発表 - Introducing Claude Opus 4.6
- CNBC - Anthropic launches Claude Opus 4.6
- TechCrunch - Anthropic releases Opus 4.6 with new 'agent teams'
- VentureBeat - Claude Opus 4.6 brings 1M token context and agent teams
- DataCamp - Claude Opus 4.6: Features, Benchmarks, Tests, and More
- The New Stack - Opus 4.6 is a step change for the enterprise
Claude Codeをさらに活用したい方へ
Opus 4.6の新機能を最大限活用するClaude Code Skillsを公開しています。