1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Opus4.8 爆誕! 早速全部入れ替えたら人生が2.5倍捗りそうなので30秒でまとめた件

1
Posted at

01_hero.png

🚨【速報】Claude Opus 4.8 が降臨。しかも"値段そのまま"で全部強くなったんだが?

2026年5月28日、Anthropic がしれっと最強モデルを更新してきた。「マイナーアップデートです」みたいな顔をしているが、中身を開けたらコーディング・エージェント・正直さ・実務性能、ぜんぶ底上げ。しかも価格は Opus 4.7 と完全に同じ。…これ、黙って使ってるやつが勝つやつだ。

公式発表 → https://www.anthropic.com/news/claude-opus-4-8


📊 30秒で分かる "Opus 4.8" 早見表

観点 何が起きた?
💴 価格 通常 入力 $5 / 出力 $25(per M tokens)、4.7 から据え置き
⚡ Fast モード 速度 2.5×、価格は旧モデル比 3倍安(入力 $10 / 出力 $50 per M)
🤥 正直さ コード欠陥の見逃しにくさ 約4倍、不確実性を自己申告
🖱️ ブラウザ操作 Online-Mind2Web 84%
⚖️ 法務 Legal Agent Benchmark 最高スコア & all-pass 初の10%超
🖼️ マルチモーダル PDF/図表処理トークン −61%(Genie)
🧠 effort デフォルト high、extra/max で更に踏める
🆔 モデル名 claude-opus-4-8

💡 そもそも何が変わったの? → 「全方位で地味に強い」が一番こわい

Opus 4.8 は Opus 4.7 をベースに、コーディング / エージェント / 推論 / 実務ナレッジの各ベンチで上積みしてきたモデル。Anthropic 自身は「modest but tangible(控えめだけど確実)」と表現しているが、現場テスターの評価はもっと熱い。判断が鋭くなり、自分のミスに自分で気づき、ダメな計画には押し返してくる——要するに「一緒に仕事ができる相棒」に進化した、という話。

そして全部入れてくる悪い癖(褒めてる)。Opus 4.8 のローンチには、新機能が3つ同時に乗っている:

  • claude.ai に「努力レベル(effort)」コントロールが追加(全プラン)
  • Claude Code に "Dynamic Workflows"(リサーチプレビュー)が登場
  • Fast モードが旧モデル比で3倍安くなった(しかも速度は2.5倍)

詳細データはシステムカードに全部ある → https://www.anthropic.com/claude-opus-4-8-system-card


02_honesty.png

🤥→🫡 一番デカい進化は「正直さ」かもしれない

AIの最大の地雷、それは**「できてないのに『できました!』と言い切る」**問題。証拠が薄いのに勝手に結論へジャンプするアレ。

Opus 4.8 はここに本気で手を入れてきた。

  • 不確実なことは「不確実だ」と自分から旗を立てる
  • 裏付けのない主張をしなくなった
  • そして極めつけ —— 自分が書いたコードの欠陥を見逃す確率が、前世代の約1/4(=見逃しにくさ 約4倍)

「とりあえず動きました!」で爆死させられた経験のある全人類、ここは普通に効く改善点。

🛡️ おまけに"性格"も良くなってる

リリース前のアライメント評価では、ユーザーの自律性を尊重し、ユーザーの最善の利益に沿って動くという向社会的な指標が過去最高に。逆に、欺瞞や悪用への加担といったミスアライメント挙動は 4.7 より大幅に低下し、Anthropic 最良アライメントモデル "Claude Mythos Preview" 並みの水準に達したとのこと。


03_coding.png

👨‍💻 で、肝心のコーディングは? → 「手数が減って、最後までやり切る」

ここが本命。各社のレポートが具体的で生々しい。

  • Cursor(CursorBench):あらゆる effort レベルで旧 Opus を超え、ツール呼び出しがより効率的=同じ知性をより少ないステップで実現。タスクをエンドツーエンドで完走する。
  • Devin(Cognition):指示の一貫性が高く、自律エンジニアリングを放置運転でも回せる。さらに 4.7 で気になっていたコメント過多 & ツール呼び出しの問題を修正
  • 現場のスタッフエンジニア談:Claude Code 上で正しい問いを投げ、自分のミスを捕まえ、筋の悪い計画には押し返し、複雑なマルチサービス探索でも自信を固めてから大きな変更に踏み込む。

「少ない手数 × 自己検証 × 完走力」。エージェント運用で一番うれしいところが全部きてる。


⚙️ 新機能①:Dynamic Workflows ——「数十万行のリポジトリ移行を、キックオフからマージまで」

Claude Code の新機能(リサーチプレビュー)。Claude が作業を計画 → 1セッション内で数百の並列サブエージェントを起動 → 出力を自分で検証してから報告してくる。Opus 4.8 ではエージェントがより長く走れるようになった。

ハイライトはこれ:既存のテストスイートを合格ラインに据えて、数十万行規模のコードベース移行を端から端まで自走。Enterprise / Team / Max プランで利用可。

詳細 → https://claude.com/blog/introducing-dynamic-workflows-in-claude-code

⚙️ 新機能②:努力レベル(effort)コントロール ——「深く考えさせる / 速く返させる」を手元で

claude.ai と Cowork で、モデルセレクタの隣に effort スイッチが出現(全プラン)。

  • 高 effort:より頻繁に・より深く考えて回答品質UP
  • 低 effort:高速応答&レート上限の消費がゆっくり

Opus 4.8 のデフォルトは high。さらに難所には "extra"(Claude Code では xhigh"max" を選べば、トークンを多めに使って結果を取りに行く。うれしいのは、コーディングの high はトークン消費が 4.7 デフォルトとほぼ同じなのに性能は上という燃費の良さ。Claude Code 側のレート上限も引き上げ済み。

⚙️ 新機能③:Messages API が "途中での system 注入" に対応

地味に開発者へ刺さるやつ。Messages API が messages 配列の中に system エントリを受け付けるようになった。これでプロンプトキャッシュを壊さず、ユーザーターンを経由せずに、タスクの途中で Claude の指示を更新できる。エージェント稼働中の権限・トークン予算・環境コンテキストの差し替えにそのまま使える設計。

モデル文字列は claude-opus-4-8https://platform.claude.com/docs/en/about-claude/models/overview


05_legal.png

⚖️ 法務・分析・知識労働 ——「実務でハンドオフできる量」が増える

ベンチの数字より、現場の人間が何を任せられるようになったかが本質。

  • Legal Agent Benchmark で過去最高スコアを記録し、全項目パス基準で初の10%超え。「弁護士の実務をどれだけ安心して任せられるか」が直接効いてくるレベルの精度向上。
  • CoCounsel(Thomson Reuters系):一貫性と推論品質が旧 Opus 比で明確に改善。高ステークスのプロ業務で効くのは"信頼性"。
  • 投資アナリスト現場:分析が高品質・高密度・低ノイズで、しかも速い。極めつけは 入出力の問題点を自分から指摘してくること——他モデルが見落としてユーザーに尻拭いさせてた部分を拾う。

法務文書・契約レビュー・引用付きリサーチを回す人ほど恩恵がデカい。引用精度とトークン効率も上がっている(Hebbia 談)。


04_features.png

🖱️ ブラウザ操作・マルチモーダルも進化

  • コンピュータ操作 / ブラウザエージェントOnline-Mind2Web で 84%。Opus 4.7 と GPT-5.5 の両方に対して意味のあるジャンプ。長時間タスクでも"内省しながらオンタスク"を維持。
  • マルチモーダル:Databricks の Genie では、PDF・図表など非構造データを直接読んで推論。しかもトークンコストは 4.7 比で 61% 安い

06_stats.png

🔮 で、この先は? ——「Opus の上」が、もう見えてる

Anthropic の予告がエグい。

  1. Opus級の能力をより安く提供するモデルを開発中。
  2. そして Opus を超える"新クラス"のモデルを投入予定。すでに Project Glasswing の一環で、ごく一部の組織が Claude Mythos Preview をサイバーセキュリティ用途で使用中。
  3. この水準のモデルはより強力なサイバー安全策が前提だが、その整備は急ピッチで進行中。数週間以内に Mythos クラスを全顧客へ届ける見込み、とのこと。

Glasswing の続報 → https://www.anthropic.com/research/glasswing-initial-update


✅ 結論:「同じ値段で相棒がアップグレードされた」。使わない理由、ある?

Opus 4.8 は派手な新発明というより、現場で効く"効きどころ"を全部1段ずつ底上げしてきたアップデート。

  • 価格据え置き、なのに速い・賢い・正直
  • コードは手数が減って完走力UP、しかも自分のミスを自分で捕まえる
  • Dynamic Workflows / effort 制御 / mid-task system 注入で、エージェント運用の天井が上がった
  • 法務・分析・マルチモーダルまで実務でハンドオフできる量が増える

結局のところ、AIに任せて怖いのは「自信満々の嘘」だった。そこを正面から殴りにきたのが Opus 4.8。まずは effort を highextra にして、いつもの面倒なタスクを1個投げてみる——それが一番早い体感ルート。

🔗 公式発表:https://www.anthropic.com/news/claude-opus-4-8
🔗 システムカード:https://www.anthropic.com/claude-opus-4-8-system-card

※本記事は2026年5月28日付の Anthropic 公式発表に基づく要約・解説です。数値・仕様は予告なく変更される可能性があります。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?