0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

2026/7 本当にSonnetはOpusに実力が肉薄したのか?

0
Posted at

Sonnetがついに「Opusでいいじゃん」って言われ始めた件、実際どうなのか集めてみた

2026年6月末にSonnet 5が出て以来、あちこちで「もうOpusいらないんじゃないか」という声を見るようになった。正直、この手の「新型は前世代を食う」論は毎回出てくるので話半分に聞いてたんだけど、今回は言ってる人の顔ぶれが違う。エンタープライズの導入事例から個人ブロガーの生々しい愚痴まで、実際にClaude Codeで両方回した人たちの声を拾ってみたら、思ったより解像度の高い話が出てきたので整理する。

ベンチマークだけ見ると「肉薄」は言い過ぎ

まず数字。SWE-bench Proのエージェント型コーディングでSonnet 5は63.2%、Opus 4.8は69.2%。これだけ見ると6ポイント差はまだ結構ある。一方でHumanity's Last Examにツールを持たせた条件だとSonnet 5が57.4%、Opus 4.8が57.9%とほぼ同着。知識労働系のGDPval-AA v2に至ってはSonnet 5の1,618に対してOpus 4.8が1,615で、数字上はSonnet が上回っている場面すらある。

つまり「全部の指標で肉薄した」んじゃなくて、タスクの種類によって差の出方がバラバラというのが実態に近い。深いマルチファイル改修や高難度の推論ではOpusがまだ確実に強く、逆にツール操作・知識作業寄りのタスクではほぼ差がない。ここを「Sonnetで十分」と「Opusはまだ必要」のどちらか一方に丸めて語ると、たぶんどっちも嘘になる。

Claude Codeを実際に回した人たちの声(世界中)を集めてみたら、「これが噂の“言われなくても○○○○○○する”ってやつか」が響いてた

海外の生の声を集めてみました。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?