🚨【速報】Claude Opus 4.8 が降臨。しかも"値段そのまま"で全部強くなったんだが?
2026年5月28日、Anthropic がしれっと最強モデルを更新してきた。「マイナーアップデートです」みたいな顔をしているが、中身を開けたらコーディング・エージェント・正直さ・実務性能、ぜんぶ底上げ。しかも価格は Opus 4.7 と完全に同じ。…これ、黙って使ってるやつが勝つやつだ。
公式発表 → https://www.anthropic.com/news/claude-opus-4-8
📊 30秒で分かる "Opus 4.8" 早見表
| 観点 | 何が起きた? |
|---|---|
| 💴 価格 | 通常 入力 $5 / 出力 $25(per M tokens)、4.7 から据え置き |
| ⚡ Fast モード | 速度 2.5×、価格は旧モデル比 3倍安(入力 $10 / 出力 $50 per M) |
| 🤥 正直さ | コード欠陥の見逃しにくさ 約4倍、不確実性を自己申告 |
| 🖱️ ブラウザ操作 | Online-Mind2Web 84% |
| ⚖️ 法務 | Legal Agent Benchmark 最高スコア & all-pass 初の10%超 |
| 🖼️ マルチモーダル | PDF/図表処理トークン −61%(Genie) |
| 🧠 effort | デフォルト high、extra/max で更に踏める |
| 🆔 モデル名 | claude-opus-4-8 |
💡 そもそも何が変わったの? → 「全方位で地味に強い」が一番こわい
Opus 4.8 は Opus 4.7 をベースに、コーディング / エージェント / 推論 / 実務ナレッジの各ベンチで上積みしてきたモデル。Anthropic 自身は「modest but tangible(控えめだけど確実)」と表現しているが、現場テスターの評価はもっと熱い。判断が鋭くなり、自分のミスに自分で気づき、ダメな計画には押し返してくる——要するに「一緒に仕事ができる相棒」に進化した、という話。
そして全部入れてくる悪い癖(褒めてる)。Opus 4.8 のローンチには、新機能が3つ同時に乗っている:
- claude.ai に「努力レベル(effort)」コントロールが追加(全プラン)
- Claude Code に "Dynamic Workflows"(リサーチプレビュー)が登場
- Fast モードが旧モデル比で3倍安くなった(しかも速度は2.5倍)
詳細データはシステムカードに全部ある → https://www.anthropic.com/claude-opus-4-8-system-card
🤥→🫡 一番デカい進化は「正直さ」かもしれない
AIの最大の地雷、それは**「できてないのに『できました!』と言い切る」**問題。証拠が薄いのに勝手に結論へジャンプするアレ。
Opus 4.8 はここに本気で手を入れてきた。
- 不確実なことは「不確実だ」と自分から旗を立てる
- 裏付けのない主張をしなくなった
- そして極めつけ —— 自分が書いたコードの欠陥を見逃す確率が、前世代の約1/4(=見逃しにくさ 約4倍)
「とりあえず動きました!」で爆死させられた経験のある全人類、ここは普通に効く改善点。
🛡️ おまけに"性格"も良くなってる
リリース前のアライメント評価では、ユーザーの自律性を尊重し、ユーザーの最善の利益に沿って動くという向社会的な指標が過去最高に。逆に、欺瞞や悪用への加担といったミスアライメント挙動は 4.7 より大幅に低下し、Anthropic 最良アライメントモデル "Claude Mythos Preview" 並みの水準に達したとのこと。
👨💻 で、肝心のコーディングは? → 「手数が減って、最後までやり切る」
ここが本命。各社のレポートが具体的で生々しい。
- Cursor(CursorBench):あらゆる effort レベルで旧 Opus を超え、ツール呼び出しがより効率的=同じ知性をより少ないステップで実現。タスクをエンドツーエンドで完走する。
- Devin(Cognition):指示の一貫性が高く、自律エンジニアリングを放置運転でも回せる。さらに 4.7 で気になっていたコメント過多 & ツール呼び出しの問題を修正。
- 現場のスタッフエンジニア談:Claude Code 上で正しい問いを投げ、自分のミスを捕まえ、筋の悪い計画には押し返し、複雑なマルチサービス探索でも自信を固めてから大きな変更に踏み込む。
「少ない手数 × 自己検証 × 完走力」。エージェント運用で一番うれしいところが全部きてる。
⚙️ 新機能①:Dynamic Workflows ——「数十万行のリポジトリ移行を、キックオフからマージまで」
Claude Code の新機能(リサーチプレビュー)。Claude が作業を計画 → 1セッション内で数百の並列サブエージェントを起動 → 出力を自分で検証してから報告してくる。Opus 4.8 ではエージェントがより長く走れるようになった。
ハイライトはこれ:既存のテストスイートを合格ラインに据えて、数十万行規模のコードベース移行を端から端まで自走。Enterprise / Team / Max プランで利用可。
詳細 → https://claude.com/blog/introducing-dynamic-workflows-in-claude-code
⚙️ 新機能②:努力レベル(effort)コントロール ——「深く考えさせる / 速く返させる」を手元で
claude.ai と Cowork で、モデルセレクタの隣に effort スイッチが出現(全プラン)。
- 高 effort:より頻繁に・より深く考えて回答品質UP
- 低 effort:高速応答&レート上限の消費がゆっくり
Opus 4.8 のデフォルトは high。さらに難所には "extra"(Claude Code では xhigh) や "max" を選べば、トークンを多めに使って結果を取りに行く。うれしいのは、コーディングの high はトークン消費が 4.7 デフォルトとほぼ同じなのに性能は上という燃費の良さ。Claude Code 側のレート上限も引き上げ済み。
⚙️ 新機能③:Messages API が "途中での system 注入" に対応
地味に開発者へ刺さるやつ。Messages API が messages 配列の中に system エントリを受け付けるようになった。これでプロンプトキャッシュを壊さず、ユーザーターンを経由せずに、タスクの途中で Claude の指示を更新できる。エージェント稼働中の権限・トークン予算・環境コンテキストの差し替えにそのまま使える設計。
モデル文字列は claude-opus-4-8 → https://platform.claude.com/docs/en/about-claude/models/overview
⚖️ 法務・分析・知識労働 ——「実務でハンドオフできる量」が増える
ベンチの数字より、現場の人間が何を任せられるようになったかが本質。
- Legal Agent Benchmark で過去最高スコアを記録し、全項目パス基準で初の10%超え。「弁護士の実務をどれだけ安心して任せられるか」が直接効いてくるレベルの精度向上。
- CoCounsel(Thomson Reuters系):一貫性と推論品質が旧 Opus 比で明確に改善。高ステークスのプロ業務で効くのは"信頼性"。
- 投資アナリスト現場:分析が高品質・高密度・低ノイズで、しかも速い。極めつけは 入出力の問題点を自分から指摘してくること——他モデルが見落としてユーザーに尻拭いさせてた部分を拾う。
法務文書・契約レビュー・引用付きリサーチを回す人ほど恩恵がデカい。引用精度とトークン効率も上がっている(Hebbia 談)。
🖱️ ブラウザ操作・マルチモーダルも進化
- コンピュータ操作 / ブラウザエージェント:Online-Mind2Web で 84%。Opus 4.7 と GPT-5.5 の両方に対して意味のあるジャンプ。長時間タスクでも"内省しながらオンタスク"を維持。
- マルチモーダル:Databricks の Genie では、PDF・図表など非構造データを直接読んで推論。しかもトークンコストは 4.7 比で 61% 安い。
🔮 で、この先は? ——「Opus の上」が、もう見えてる
Anthropic の予告がエグい。
- Opus級の能力をより安く提供するモデルを開発中。
- そして Opus を超える"新クラス"のモデルを投入予定。すでに Project Glasswing の一環で、ごく一部の組織が Claude Mythos Preview をサイバーセキュリティ用途で使用中。
- この水準のモデルはより強力なサイバー安全策が前提だが、その整備は急ピッチで進行中。数週間以内に Mythos クラスを全顧客へ届ける見込み、とのこと。
Glasswing の続報 → https://www.anthropic.com/research/glasswing-initial-update
✅ 結論:「同じ値段で相棒がアップグレードされた」。使わない理由、ある?
Opus 4.8 は派手な新発明というより、現場で効く"効きどころ"を全部1段ずつ底上げしてきたアップデート。
- 価格据え置き、なのに速い・賢い・正直
- コードは手数が減って完走力UP、しかも自分のミスを自分で捕まえる
- Dynamic Workflows / effort 制御 / mid-task system 注入で、エージェント運用の天井が上がった
- 法務・分析・マルチモーダルまで実務でハンドオフできる量が増える
結局のところ、AIに任せて怖いのは「自信満々の嘘」だった。そこを正面から殴りにきたのが Opus 4.8。まずは effort を
high〜extraにして、いつもの面倒なタスクを1個投げてみる——それが一番早い体感ルート。
🔗 公式発表:https://www.anthropic.com/news/claude-opus-4-8
🔗 システムカード:https://www.anthropic.com/claude-opus-4-8-system-card
※本記事は2026年5月28日付の Anthropic 公式発表に基づく要約・解説です。数値・仕様は予告なく変更される可能性があります。





