1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【速報】Claude Opus 4.6が公開!Agent Teams・1Mトークン・Adaptive Thinkingなど新機能まとめ

1
Last updated at Posted at 2026-02-06

はじめに

2026年2月5日、Anthropicが最新フラグシップモデル Claude Opus 4.6 を発表しました。

前モデル Opus 4.5 から大幅に強化され、1MトークンのコンテキストウィンドウAgent Teams(マルチエージェント協調)、Adaptive Thinking(適応的思考)など注目の新機能が多数搭載されています。

本記事では、公開直後の情報をもとにOpus 4.6の新機能・ベンチマーク・開発者向けの変更点を速報としてまとめます。

背景:Opus 4.5からの進化

Claude Opus 4.5は2025年に登場し、コーディング能力の高さで評価されていました。今回のOpus 4.6では、その強みをさらに伸ばしつつ、以下の方向で大きく進化しています。

  • コンテキストウィンドウの大幅拡大(200K → 1M)
  • 出力トークン数の増加(最大128Kトークン)
  • マルチエージェント協調の導入
  • 推論品質の向上(ベンチマーク全般で大幅スコアアップ)
  • 開発者ツールの強化(effort parameter、context compaction等)

主要な新機能

1. 1Mトークン コンテキストウィンドウ(ベータ)

コンテキストウィンドウが 100万トークンに拡大。これにより、巨大なコードベース全体をコンテキストに含めたり、数百ページのドキュメントを一度に処理したりすることが可能になります。

項目 Opus 4.5 Opus 4.6
コンテキスト 200K 1M(ベータ)
最大出力 32K 128K

補足: 200Kトークンを超えるプロンプトにはプレミアム価格(入力 $10/出力 $37.50 per Mトークン)が適用されます。

2. Agent Teams(リサーチプレビュー)

Claude Codeに導入された新機能。複数のAIエージェントが並列で作業し、自律的に協調します。

  • 大規模タスクをセグメント化し、各エージェントが担当
  • コードベースレビューなどのread-heavyな作業に特に有効
  • エージェント間で直接コミュニケーションして調整
  • Shift+Up/Down またはtmuxでサブエージェントを操作可能
例:大規模リファクタリングの場合
├── Agent A: フロントエンドのコンポーネント修正
├── Agent B: APIエンドポイントの更新
├── Agent C: テストコードの修正
└── メインAgent: 全体の調整・マージ

3. Adaptive Thinking(適応的思考)

Anthropicモデルとして初搭載。プロンプトの文脈からどの程度深く考えるべきかを自動判断します。

  • 簡単な質問には即座に回答
  • 複雑な推論が必要な場合は深い思考を実行
  • API側では effort parameter で明示的に制御も可能
effortレベル:
- low   : 高速・低コスト(簡単なタスク向け)
- medium: バランス型
- high  : デフォルト(通常利用)
- max   : 最大品質(難問・重要タスク向け)

4. Context Compaction(ベータ)

長時間のセッションで古いコンテキストを自動的に要約・圧縮する機能。Claude Codeでの長時間作業時に、コンテキスト切れを防ぎつつパフォーマンスを維持します。

5. Office統合の強化

  • Claude in PowerPoint(リサーチプレビュー): 既存のレイアウト・フォント・テンプレートを読み取り、ブランド一貫性を保ったスライド生成・編集が可能
  • Claude in Excel: 複数ステップの処理やプランニング能力が大幅向上

ベンチマーク結果

主要ベンチマークでのスコアを整理します。多くの項目で過去最高スコアを記録しています。

コーディング

ベンチマーク Opus 4.5 Opus 4.6 備考
Terminal-Bench 2.0 59.8% 65.4% 全AIモデル中最高スコア

推論・知識

ベンチマーク Opus 4.5 Opus 4.6 競合比較
ARC AGI 2 37.6% 68.8% GPT-5.2 Pro: 54.2%, Gemini 3 Pro: 45.1%
Humanity's Last Exam - 首位 複合的な多分野推論テスト
GDPval-AA - 首位 GPT-5.2より約144 Eloポイント上回る

長文コンテキスト

ベンチマーク Sonnet 4.5 Opus 4.6 備考
MRCR v2 18.5% 76% 長文コンテキスト検索精度(大幅改善)

エージェント能力

ベンチマーク Opus 4.5 Opus 4.6 備考
OSWorld 66.3% 72.7% コンピュータ操作ベンチマーク

開発者向け情報

API仕様

項目
モデルID claude-opus-4-6
コンテキスト 1M tokens(ベータ)
最大出力 128K tokens
入力価格 $5 / 1M tokens
出力価格 $25 / 1M tokens
200K超プレミアム 入力 $10 / 出力 $37.50 per 1M tokens
US-only推論 1.1× のトークン価格

effort parameterの使い方

APIリクエストにeffortレベルを指定することで、速度・コストと品質のトレードオフを制御できます。

import anthropic

client = anthropic.Anthropic()

# 高速・低コストで応答(簡単なタスク向け)
response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=1024,
    thinking={
        "type": "enabled",
        "budget_tokens": 5000,
        "effort": "low"
    },
    messages=[
        {"role": "user", "content": "Pythonでリストの重複を除去するには?"}
    ]
)

# 最大品質で応答(難問向け)
response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=8192,
    thinking={
        "type": "enabled",
        "budget_tokens": 50000,
        "effort": "max"
    },
    messages=[
        {"role": "user", "content": "分散システムのCAP定理の限界と回避策を論じてください"}
    ]
)

Claude Codeでの利用

Claude Code CLIでは、Opus 4.6がデフォルトモデルとして利用可能です。Agent Teams機能を使う場合はリサーチプレビューとして有効化できます。

# Claude Codeの更新
npm install -g @anthropic-ai/claude-code@latest

# Opus 4.6を指定して起動(デフォルトで選択される)
claude --model claude-opus-4-6

注意点

  1. 1Mコンテキストはベータ: 200Kを超える入力にはプレミアム価格が適用されます。安定性も本番環境では検証が必要です
  2. Agent Teamsはリサーチプレビュー: 実験的機能のため、本番ワークフローへの組み込みは慎重に
  3. effort parameterの選択: lowを使いすぎると品質低下の可能性があります。タスクの重要度に応じて使い分けましょう
  4. 価格体系の変化: 基本価格は据え置き($5/$25)ですが、200K超コンテキストは2倍近い価格になる点に注意

まとめ

Claude Opus 4.6は、以下の点で大きな進化を遂げています。

  • 1Mトークンコンテキストにより、大規模コードベースやドキュメントの一括処理が可能に
  • Agent Teamsで複数エージェントによる並列作業が実現
  • Adaptive Thinkingで無駄な推論コストを削減しつつ、必要な場面では深い思考を実行
  • ベンチマーク全般で大幅改善、特にARC AGI 2(37.6% → 68.8%)やMRCR v2(18.5% → 76%)の伸びが顕著
  • 価格据え置きで、コストパフォーマンスが大幅に向上

特にClaude Codeユーザーにとっては、Agent TeamsとContext Compactionの組み合わせにより、長時間の大規模開発タスクでの生産性が大きく向上することが期待されます。

参考リンク


Claude Codeをさらに活用したい方へ

Opus 4.6の新機能を最大限活用するClaude Code Skillsを公開しています。

  • Starter Pack(無料): TDD・デバッグ・コードレビューの基本ワークフロー → 無料ダウンロード
  • Pro Pack(¥4,980): 21エージェント + CI/CD自動設計 + 3スキル統合パック → 詳細を見る
1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?