はじめに
Anthropicは2026年5月28日、最新の汎用モデル Claude Opus 4.8 をリリースしました。Claude Opus 4.7 からの継続的な改善として、コードレビュー精度の大幅向上と複数の新API機能が追加されています。
この記事では以下について解説します。
この記事で学べること
- Claude Opus 4.8 の性能改善内容とベンチマーク結果
- Mid-conversation system messages の仕組みと実装例
- Refusal stop_details の活用方法
- Fast mode(Research Preview)の概要と使い方
- プロンプトキャッシュ最小サイズの変更点
- Claude Opus 4.7 からの移行チェックリスト
対象読者
- Claude API を使用しているエンジニア
- Claude Opus 4.7 を本番環境で運用中の方
- AIエージェント開発者
前提条件
- Claude API の基本的な使い方の理解
- Python または任意のプログラミング言語での API 呼び出し経験
TL;DR
-
Model ID:
claude-opus-4-8 - コードレビュー精度: Opus 4.7 比 約4倍向上(フロー見落とし率 3.7%)
- 新機能: Mid-conversation system messages(Claude API専用)、Refusal stop_details 公式ドキュメント化、Fast mode(Claude API専用 Research Preview)
- プロンプトキャッシュ最小: 1,024 トークンに引き下げ
- 料金: 標準 $5/$25(Opus 4.7 と同額)、Fast mode $10/$50
- 利用可能: Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry(Foundry のみ 200k コンテキスト)
パフォーマンス改善の全貌
ベンチマーク比較
Claude Opus 4.8 は Claude Opus 4.7 に対して複数のベンチマークで改善を示しています。
| ベンチマーク | Opus 4.7 | Opus 4.8 | 改善率 |
|---|---|---|---|
| SWE-bench Pro | 64.3% | 69.2% | +4.9pt |
| SWE-bench Verified | 87.6% | 88.6% | +1.0pt |
| USAMO 2026(数学) | 69.3% | 96.7% | +27.4pt |
| GraphWalks F1(1M tokens) | 40.3% | 68.1% | +27.8pt |
| Online-Mind2Web(ブラウザエージェント) | — | 84% | — |
出典: Claude Opus 4.8 Release Notes(2026-05-28)
コードレビュー精度の改善
Claude Opus 4.8 の最も注目すべき改善の一つが、コード審査品質の大幅向上です。
公式発表によると、Opus 4.8 は Opus 4.7 と比較して コード内のフローを見落とす確率が約4倍低下 しています。具体的には以下の指標が改善されています。
- 重要なイベントの見落とし率: 3.7%(Opus 4.7 から大幅改善)
- 欠陥のある結果を無批判に報告する割合: 0%
これはエージェント型コーディングワークフローにおいて特に重要な改善です。長時間の自律的なコーディングセッションでコードの品質を維持しやすくなります。
ロングコンテキストの改善
GraphWalks ベンチマーク(1M トークン条件)での F1 スコアが 40.3% → 68.1% に向上しており、1M トークン全域での長文脈理解が実用的な水準に達しました。
また、エージェントの長時間稼働における以下の改善が報告されています。
- コンテキスト圧縮(Compaction)後の脱線が減少
- 長いタスクにおけるツール呼び出しの失敗率低下
新API機能
1. Mid-conversation system messages
Claude Opus 4.8 から、会話の途中でシステムメッセージを挿入できるようになりました。messages 配列内の user ターンの直後に role: "system" を含めることで、追加の指示を付与できます。
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
system="あなたはPythonの専門家です。", # 最初のシステムプロンプト
messages=[
{
"role": "user",
"content": "このコードをレビューしてください。\n\ndef add(a, b):\n return a + b"
},
{
"role": "assistant",
"content": "このコードは正しく動作します。ただし型ヒントを追加すると..."
},
{
# 中間でシステムメッセージを挿入
"role": "system",
"content": "以降の回答は日本語のみで返答してください。"
},
{
"role": "user",
"content": "型ヒントの具体的な書き方を教えてください。"
}
]
)
なぜこれが重要か: エージェントループ中に最初のシステムプロンプトを再送信せずに指示を追加できます。これにより プロンプトキャッシュのヒット率を維持しながらコストを削減 できます。ベータヘッダーは不要です。
Mid-conversation system messages の利用制限:
- Claude API 専用: Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry では利用不可
- 配置ルールあり(詳細は公式ドキュメントを参照)
2. Refusal stop_details
拒否レスポンスに含まれる stop_details オブジェクトが公式ドキュメント化されました。Claude がリクエストを断った場合、stop_details には拒否のカテゴリ情報が含まれており、アプリケーション側で異なる種類の拒否を判別できます。
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[{"role": "user", "content": "..."}]
)
if response.stop_reason == "refusal" and response.stop_details:
# stop_details.category でカテゴリを判別
# 公式カテゴリ: "cyber"(サイバーセキュリティ関連)/ "bio"(生物兵器関連)/ None
category = response.stop_details.category
if category == "cyber":
print("サイバーセキュリティ関連として拒否されました")
elif category == "bio":
print("バイオ関連として拒否されました")
else:
print(f"拒否されました(カテゴリ: {category})")
# ユーザーを適切なフローに誘導
ベータヘッダーは不要です。カテゴリ一覧はHandling stop reasonsを参照してください。
3. Fast mode(Research Preview)
Claude Opus 4.8 では Fast mode が Research Preview として利用可能になりました。speed: "fast" を指定することで、最大 2.5倍の出力トークン速度 を得られます。
# Fast mode は client.beta.messages.create() を使用
response = client.beta.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
speed="fast",
betas=["fast-mode-2026-02-01"],
messages=[{"role": "user", "content": "コードを素早く生成してください。"}]
)
料金: Fast mode は $10/M 入力トークン、$50/M 出力トークン(標準の2倍)。Opus 4.7 の Fast mode($30/$150)と比較して 3倍安価 な設計になっています。
| モード | 入力 | 出力 | 速度 |
|---|---|---|---|
| 標準 | $5/M | $25/M | 標準 |
| Fast mode | $10/M | $50/M | 最大2.5倍 |
出典: Claude Opus 4.8 Release Notes(2026-05-28)
Fast mode が適しているユースケース:
- リアルタイムのコード補完や提案
- チャットボットのレスポンス速度改善
- 待ち時間に敏感なエンドユーザー向けアプリケーション
Fast mode の利用制限:
- Claude API 専用: Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry では利用不可
- Research Preview: 利用にはウェイトリスト登録が必要(claude.com/fast-mode)
- Batch API 非対応: バッチ処理と組み合わせて使用不可
4. プロンプトキャッシュ最小サイズの引き下げ
Claude Opus 4.8 では、プロンプトキャッシュの対象となる最小トークン数が 1,024 トークン に引き下げられました(Claude Opus 4.7 では 4,096 トークン以上が必要でした)。
コードの変更なしで、今まではキャッシュ対象外だった短めのシステムプロンプトも自動的にキャッシュされます。
Claude Opus 4.7 からの移行ガイド
model ID の更新
# 変更前
model = "claude-opus-4-7"
# 変更後
model = "claude-opus-4-8"
APIの互換性チェックリスト
Claude Opus 4.7 用に書かれたコードは基本的にそのまま動作しますが、以下の点を確認してください。
| 項目 | 状態 | 備考 |
|---|---|---|
temperature/top_p/top_k
|
引き続き非対応 | 設定すると 400 エラー |
| Extended thinking budget | 引き続き非対応 | adaptive thinking + effort を使用 |
thinking: {type: "adaptive"} |
対応 | 4.7 と同様 |
effort パラメータ |
デフォルトが high に変更 |
明示指定している場合は変更なし |
| サンプリングパラメータ | 非対応のまま | プロンプトで動作を制御 |
Thinking の設定(4.6 以前からの移行)
# Claude Opus 4.6 以前の書き方(Opus 4.7/4.8 では非対応)
# thinking = {"type": "enabled", "budget_tokens": 32000} # ← 400エラー
# Claude Opus 4.7/4.8 の正しい書き方
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
thinking={"type": "adaptive"}, # Adaptive thinking を有効化
output_config={"effort": "high"}, # effort は output_config で指定
messages=[{"role": "user", "content": "..."}]
)
# effort レベル: "low" | "medium" | "high"(デフォルト) | "xhigh" | "max"
Effort デフォルト変更の影響
Opus 4.8 では effort のデフォルトが high になりました。Opus 4.7 でデフォルト値のまま利用していた場合、Opus 4.8 では思考トークンがやや増加する可能性があります。コスト管理が重要な場合は effort: "medium" を明示的に指定してください。
# コストを抑えたい場合
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
output_config={"effort": "medium"}, # output_config で effort を指定
messages=[{"role": "user", "content": "..."}]
)
注意事項
プラットフォームごとのコンテキストウィンドウ差異
| プラットフォーム | コンテキストウィンドウ |
|---|---|
| Claude API | 1M トークン |
| Amazon Bedrock | 1M トークン |
| Google Cloud Vertex AI | 1M トークン |
| Microsoft Foundry | 200k トークン |
Microsoft Foundry 経由でのみ利用している場合、1M トークン前提のコードは動作しません。プラットフォームに合わせてコンテキスト長を調整してください。
Dynamic Workflows と Effort Control
Claude Opus 4.8 と同時にリリースされた Dynamic Workflows(Claude Code の Research Preview)と Effort Control については、記事 Claude Opus 4.8入門 — Dynamic Workflowsとエフォート制御APIの全貌 で詳しく解説しています。
まとめ
Claude Opus 4.8 の主なアップデートは以下のとおりです。
- コードレビュー精度向上: フロー見落とし率が Opus 4.7 比 約4倍改善。長時間の自律コーディングで品質が安定しやすくなった
- Mid-conversation system messages: エージェントループ中に追加指示を挿入できる。プロンプトキャッシュと組み合わせるとコスト効率が向上する
- Refusal stop_details の公式化: 拒否理由のカテゴリ判別が可能になり、ユーザーへの適切なフィードバック設計がしやすくなった
- Fast mode(Research Preview): レスポンス速度が最大2.5倍。リアルタイム用途に適している
- プロンプトキャッシュ最小1,024トークンに: 短いプロンプトでもキャッシュが効くようになった
Claude Opus 4.7 用のコードは基本的にそのまま動作します。まずはモデルIDを claude-opus-4-8 に変更して動作を確認し、必要に応じて新機能を段階的に導入するアプローチが推奨されます。
参考リンク
- Introducing Claude Opus 4.8 — Anthropic(2026-05-28)
- What's new in Claude Opus 4.8 — Anthropic Platform Docs
- Mid-conversation system messages — Anthropic Platform Docs
- Handling stop reasons — Anthropic Platform Docs
- Fast mode — Anthropic Platform Docs
- Prompt caching — Anthropic Platform Docs
- Effort parameter — Anthropic Platform Docs