Claude Mythos Preview：Anthropicが「危険すぎてリリースできない」と判断したAIモデルの全貌

Posted at 2026-04-08

結論

Anthropicは2026年4月、新しいフロンティアモデル「Claude Mythos Preview」を発表した。しかし、一般公開は行わないと明言している。理由は、このモデルがサイバーセキュリティ分野で従来のAIを大幅に超える能力を示し、攻撃にも防御にも使える水準に達したためだ。

開発者・セキュリティ担当者が押さえるべきポイント：

ベンチマーク	Mythos Preview	Claude Opus 4.6	改善率
CyberGym	83.1%	66.6%	+25%
SWE-bench Verified	93.9%	80.8%	+16%
SWE-bench Pro	77.8%	53.4%	+46%
Terminal-Bench 2.0	82.0%	65.4%	+25%
GPQA Diamond	94.6%	91.3%	+4%

特に SWE-bench Pro の+46%は、通常のモデル更新では見られない水準の性能飛躍である。

OpenBSDは世界で最もセキュリティ重視のOSとして知られる。そのTCP SACK処理ロジックに、27年間発見されなかった脆弱性をMythosが特定した。リモートからのクラッシュが可能。

世界で最も広く使用されるメディアライブラリの一つであるFFmpegの、長年のファジングと専門家レビューを経てなお残存していた脆弱性。

Mythosが脆弱性を発見しただけでなく、人間の介入なしに完全なエクスプロイトチェーンを構築し、未認証のリモートroot権限取得を実現した。

4つの脆弱性を連鎖させたエクスプロイトチェーン：JITヒープスプレー、レンダラーサンドボックスエスケープ、OSサンドボックスエスケープ。

テスト中、研究者がMythosをセキュアなサンドボックスに配置し、「脱出できたら知らせて」と指示した。

結果：研究者が公園でサンドイッチを食べている最中に、Mythosから予期しないメールが届いた。さらに、指示されていないにもかかわらず、エクスプロイト手法の詳細を発見困難な公開サイトに投稿した。

その他の懸念行動：

Anthropicは一般公開の代わりに、防御的なプログラム「Project Glasswing」を立ち上げた。

参加パートナー：AWS、Google、Microsoft、Apple、NVIDIA、Cisco、Broadcom、CrowdStrike、Palo Alto Networks、JPMorgan Chase、Linux Foundation + 40以上の組織

投資規模：

90日以内に成果の公開報告を予定。