前世代からわずか6週間でOpus 4.8が登場
2026年5月28日、AnthropicがClaude Opus 4.8をリリースしました。
前バージョンのOpus 4.7から約6週間でのアップデートです。さすがに速すぎる...
私自身の備忘録としての意味もありつつ、今回はClaude Opus 4.8の主要スペックや新機能をなるべくわかりやすくまとめました。
情報源としては、Anthropic公式ページ、Anthropicが公開しているSystem Card (244枚のPDF資料) をベースとしています。
Claude Opus 4.8の基本スペック
まず、数字でわかるスペックを整理しておきましょう。
| 項目 | 内容 |
|---|---|
| モデルID | claude-opus-4-8 |
| リリース日 | 2026年5月28日 |
| コンテキストウィンドウ | 100万トークン |
| 最大出力トークン | 128,000トークン |
| 入力料金(API) | 100万トークンあたり5ドル |
| 出力料金(API) | 100万トークンあたり25ドル |
| ファストモード料金 | 入力10ドル / 出力50ドル(100万トークンあたり) |
| マルチモーダル | テキスト・画像の入力に対応 |
料金はOpus 4.7と変わっていません。既存のOpusユーザーにとっては、追加コストなしで改良版モデルを利用できるアップデートとなっています。
7つの主要な新機能・改善点
1. コーディング能力の向上
Opus 4.8の最も注目すべき点の一つがコーディング性能の向上です。
Cursor社の独自ベンチマーク「CursorBench」では、Opus 4.7の各努力レベルを上回る結果が報告されています。
また、大規模コードベースへの対応も強化されており、後述する「Dynamic Workflows」と組み合わせることで、より大規模なリファクタリングや移行作業に対応しやすくなっています。
2. エージェントタスクの信頼性向上
「AIエージェント」とは、AIが複数のツールを利用しながら長いタスクを自律的に実行する仕組みです。
Anthropicが紹介している「Super-Agent」ベンチマークでは、Opus 4.8が非常に高い完遂率を示しており、長時間のタスク処理や複雑なワークフロー実行能力が向上しています。
ただし、ベンチマークごとに評価軸は異なるため、あらゆる用途で他モデルを上回ることを意味するわけではありません。
3. 正直さと自己修正能力の強化
Anthropicが今回特に強調しているのが「Honesty(誠実さ)」の改善です。
公式発表によると、Opus 4.8は自分のコードや出力に問題がある場合、前モデルより高い確率で問題を検出し報告できるようになっています。
ただし、System Cardでは依然として、
- 誤った推測を事実として述べる
- ユーザーに修正された後も同じ誤りを繰り返す
- 十分な検証を行わず結論を出す
といった失敗例も多数公開されています。
そのため、「自己修正能力は改善されたが、依然として人間による確認は重要」という理解が適切でしょう。
4. Dynamic Workflowsの追加
Claude Codeに「Dynamic Workflows」が研究プレビューとして追加されました。
これはClaude自身がタスクを分解し、複数のサブエージェントを並列実行して結果を統合する仕組みです。
Anthropicは大規模コードベースの移行やリファクタリングなどへの活用例を紹介していますが、現時点では研究プレビュー段階であり、重要な作業については人間によるレビューが推奨されます。
なお、この機能はClaude Code for Enterprise・Team・Maxプラン向けに提供されています。
5. Effort Controlのユーザー操作に対応
claude.ai上で、モデルが回答にどれだけ推論リソースを使うかをユーザーが選択できるようになりました。
設定可能なレベルは以下です。
- Low
- Medium
- High
- Extra
- Max
Claude Codeでは「High」の代わりに「xhigh」という表記が使われています。
高いレベルほど回答品質の向上が期待できますが、その分レスポンス時間やトークン消費量も増加します。
6. ファストモードが3倍安く
Opus 4.8には「Fast Mode」が用意されています。
Anthropicによると、前世代と比較して料金が約3分の1に引き下げられました。
料金は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルです。
高速応答が必要な用途では、コスト効率の改善が期待できます。
7. コンピューター操作(Computer Use)の精度向上
Computer Use関連の性能も改善されています。
Anthropicが公開したOnline-Mind2Webベンチマークでは84%という高いスコアを達成しており、ブラウザ操作やGUI操作タスクにおいて進歩が見られます。
一部ベンチマークではGPT-5.5やOpus 4.7を上回る結果も報告されています。
前モデルとの比較
Opus 4.7(2026年4月16日リリース)との主な違いをまとめます。
非公開情報もあるため、Opus 4.8の方にはOpus 4.7をベースラインとした公称値を記載しています。
| 比較項目 | Opus 4.7 | Opus 4.8 |
|---|---|---|
| リリース日 | 2026年4月16日 | 2026年5月28日 |
| 通常料金 | 入力5ドル / 出力25ドル | 入力5ドル / 出力25ドル |
| Fast Mode料金 | 入力30ドル / 出力150ドル | 入力10ドル / 出力50ドル |
| Online-Mind2Web | 非公開(4.8未満) | 84.0% |
| 自己エラー検出 | 非公開 | 約4倍向上 |
| Dynamic Workflows | なし | 研究プレビューとして追加 |
| Effort Control(UI) | なし | claude.aiで利用可能 |
なお、AnthropicのSystem Cardでは、Opus 4.8はOpus 4.7より高性能である一方、内部評価用モデルである「Claude Mythos Preview」と比較すると同等またはやや劣る能力水準と評価されています。
どのプランで使えるのか
Claude Opus 4.8は以下の方法で利用できます。
一般ユーザー向け
以下のプランで利用可能です。
- Pro
- Max
- Team
- Enterprise
Freeプランでは利用できません。
開発者・企業向け
以下のプラットフォーム経由でも利用できます。
- Anthropic API
- Amazon Bedrock
- Google Vertex AI
- Microsoft Foundry
APIでは claude-opus-4-8 を指定します。
まとめ
Claude Opus 4.8の主なポイントをおさらいします。
- 2026年5月28日にリリース
- API料金はOpus 4.7から据え置き(入力100万トークンあたり5ドル、出力100万トークンあたり25ドル)
- コーディング性能とエージェント性能が向上
- 自己エラー検出や誠実性に関する改善が実施
- Dynamic Workflowsが研究プレビューとして追加
- Fast Modeの価格が大幅に引き下げ
- Computer Use性能も向上
位置付けとしては、Opus 4.7を改善した一般公開向け最上位モデルという位置付け。
一方で、一部評価ではMythos Previewの方が高い能力を示しており、このモデルと同等レベルのAIが数週間以内にリリースされるとのことです。
