2
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【2026年4月最新】Claude Mythos(ミトス) Preview 完全解説 ─ 封印された"史上最強AI"の全貌と6つのコア能力

2
Posted at

この記事の対象読者

  • Claude Mythos Previewを「ニュースで名前は聞いたが、何がどう史上最強なのか整理したい」エンジニア
  • 社内でAIセキュリティの提案書を書くにあたり、一次情報を網羅的に押さえておきたい担当者
  • 漏洩事件の経緯からProject Glasswingの構造まで、1本の記事で完結させたい
  • MythosとCapybaraの関係で混乱しとる全ての開発者

この記事で得られること

  • Claude Mythos発覚の経緯(CMS漏洩事件3,000件 + Claude Code 50万行漏洩)の全容
  • MythosとCapybaraの命名体系 ─ なぜ混乱が生じるのか構造的に理解
  • リークされたドラフトから判明した6つのコア能力
  • 発見された脆弱性の完全カタログ(OpenBSD / FFmpeg / FreeBSD / Linux / Firefox)
  • Project Glasswing参加12社+40組織の構造と、そこから生まれる3つの非対称性
  • 日本の個人開発者・中堅企業にとっての現実的示唆

この記事で扱わないこと

  • AISI独立検証の詳細分析(別記事 で詳しく扱っている)
  • Mythos PreviewのAPIアクセス方法(限定公開のため申請自体が一般枠では不可)
  • 具体的なCVEのエクスプロイト手順(倫理・法的理由から)
  • Anthropicの財務分析・IPO予測(ビジネス記事の領域)

1. 新種の獣が発見された ─ 2026年4月の業界地図

2026年3月下旬、AI業界に新種の獣が姿を現した。

それは意図された発表ではなかった。AnthropicのCMS(コンテンツ管理システム)の設定ミスにより、約3,000件の内部ドキュメントが一時的に公開状態になり、その中に未発表モデルのドラフトブログ記事が含まれていた。発見者はFortune誌。そこで明らかになった2つの名称 ─ MythosCapybara ─ が、業界に混乱を引き起こした。

この記事では、新種の獣を図鑑に記録するように、Claude Mythos Previewの全体像を系統立てて整理する。名前の由来から、生態(能力)、生息地(Project Glasswing)、そして観察された行動(発見した脆弱性)まで網羅的にカタログ化していく。

この記事は「Mythosは本物か?」を問う分析記事ではなく、Mythosとは何者かを体系的に整理する図鑑や。独立検証結果(AISI評価)の詳細な読み解きは前回の AISI検証結果から読み解く"本物"の証拠 で扱っとるので、そちらと併読を推奨する。


2. 発覚の経緯 ─ 2つの漏洩が暴いた新種

ここからが図鑑の最初のページや。獣がどう発見されたかの記録。

2-1. 第一の漏洩 ─ CMS設定ミスで3,000件が流出

2026年3月26〜27日、Fortune誌が衝撃的な報道を行った。AnthropicのCMSで公開設定が崩れ、未公開の画像・PDF・草稿約3,000件が外部から閲覧可能な状態になっていた。

その中に、同一内容で2バージョンのドラフトブログ記事が含まれていた。一方はモデル名を「Mythos」、もう一方は「Capybara」と記している。つまり、リーク時点でもAnthropic内部で正式名称が確定していなかったことを示している。

2-2. 第二の漏洩 ─ Claude Code全ソース 50万行がNPMに

第一の漏洩の数日後、別の独立した事件が発生した。AnthropicがClaude Codeのオリジナルソースコード全体(コンパイル済みではなく生ソース)を、誤ってNPMにアップロードしてしまった。その規模は、約1,900ファイル・約50万行

この2件目の漏洩により、Capybaraモデルが実際に準備中である追加の裏付けが得られた。草稿ではなく実装レベルの証拠だったからや。

2-3. 正式発表までのタイムライン

業界が一気にサイバーセキュリティAIのゴールドラッシュ状態に入ったのが、この2週間の動きや。


3. 命名体系の解剖 ─ MythosとCapybaraの関係

ここが混乱の元凶。多くの記事でぐちゃぐちゃになっとるので、図鑑の学名の章として正確に整理する。

3-1. 正しい理解

つまり構造的には以下や。

  • Mythos = 世代名(Claude 4 のようなもの)
  • Capybara = 階層名(Haiku / Sonnet / Opus のようなもの)
  • 正式な表記例: Claude Mythos Capybara

Claude Mythos 5 という表記がメディアで散見されるが、公式名称ではない。リーク文書にもAnthropic声明にも一切登場しない省略表現。混同しないこと。

3-2. なぜ「Capybara」なのか

Anthropicの命名には動物名のシリーズがある(Claude Haiku、Sonnet、Opusという「文学的階層」に加えて、内部ティア名に動物が使われる)。

カピバラは世界最大のげっ歯類。穏やかな性格ながら巨大な体躯という特性が、「Mythosの能力における巨大な飛躍」と、Anthropicが一貫して強調する安全思想の穏やかさの両方を象徴している、という読み解きが有力や。

3-3. なぜ「Mythos」なのか

Mythosはギリシャ語起源で「物語・寓話」を意味する。リーク文書の両バージョンで、命名理由は共通して 「知識とアイデアを結びつける深いつながり(deep connective tissue)を想起させる」 と記されている。

サイバーセキュリティ業界に語り継がれる脆弱性を可視化する象徴、という読み方もできる。実際、27年眠ったOpenBSDのバグなどは、業界の物語として語り継がれるレベルのインパクトや。


4. 6つのコア能力 ─ 獣の生態

図鑑の本体。リークされたドラフトとAnthropicの公式発表から判明している、Mythos Previewの6つのコア能力を体系的にカタログ化する。

能力1: サイバーセキュリティ

最も議論を呼んでいる能力。リーク文書は 「現時点でサイバー能力において他の全てのAIモデルを大幅に上回っている(currently far ahead of any other AI model in cyber capabilities)」と自己評価している。

具体的な数字で言うと、CyberGymベンチマークで0.83(Claude Opus 4.6は0.67)、専門家レベルCTFで73%成功率を記録。ただし、意図的に訓練された能力ではなく、コーディング能力の副産物として現れたと公式に明言されている点が本質的に怖い。

能力2: ソフトウェアコーディング

リーク文書の表現は dramatically higher scores(劇的に向上したスコア)。SWE-benchなどの実装ベンチマークで、現行のOpus 4.6を大幅に上回るとされている。

能力3: 学術的推論

大学院レベルの数学・科学・論理推論で significantly improved(著しく改善された)パフォーマンスを記録。特にAIME 2026のような競技数学系での伸びが顕著。

能力4: 知識の結合組織(Knowledge Connectivity)

これがMythosの命名理由にもなった能力。「アイデアと知識の間に深い接続組織を構築する」ように設計されており、専門分野を横断した推論で強みを発揮する。

なぜサイバーセキュリティとこの能力が相性良いのかが肝や。脆弱性発見は「コードの地層」と「攻撃パターンの地層」という異なる知識層を繋げる作業なので、結合組織能力の強化がダイレクトに攻撃能力の向上に繋がる。コードに強くなる訓練が、結合組織を強化し、結果的にサイバー能力が副産物として生まれたというAnthropicの主張が、構造的に筋が通るわけや。

能力5: エージェントワークフロー一貫性

リーク文書の原文は以下のように表現している。

「plans and executes sequences of actions on its own, moving across systems, making decisions and completing operations without waiting for human input at each stage」

意訳すると、「複数のシステムを横断して自律的に計画・実行・判断を行い、各段階で人間の入力を待たずにオペレーションを完結できる」ということ。AISIのTLO(32段階攻撃シミュレーション)で初の全工程完答を達成したのは、この能力の強化が効いとる。

能力6: 長文コンテキスト理解

具体的な数字はリーク文書に含まれていないが、大規模コードベース全体を理解してリファクタリングする能力の向上が記されている。脆弱性発見においても、数千〜数万行に渡るコードの関係性を追跡する必要があるため、この能力が効いてくる。

6つの能力の関係マップ

この図の一番大事な点は、サイバー能力は独立した能力ではなく、他の5つの能力が融合した結果として生まれていること。ここを見落として「サイバー特化モデル」と誤解すると、今後の他社モデルの動向を読み違える。


5. 発見された脆弱性 ─ 観察された行動の完全カタログ

獣が実際に見せた行動の記録。図鑑で言う「観察された捕食行動」の欄。

対象ソフトウェア 眠っていた年数 初出年 種別 ファジングでの検出歴
OpenBSD (TCP SACK処理) 27年 1999年 リモートクラッシュ 人手レビューでも未発見
FFmpeg (H.264コーデック) 16年 2010年 デコーダバグ 5億回の自動テストでも未検出
FreeBSD (NFS) 17年 2009年 RCE (CVE-2026-4747) 未発見
Linux カーネル 長期 複数世代 LPEエクスプロイトチェーン 未発見
Firefox 147 (JIT) 最新版 2025年 4段階サンドボックス脱出 181件成功

5-1. OpenBSD ─ 27年眠った王者の陥落

OpenBSDのTCP実装(SACK処理)に1999年から存在していた致命的なバグで、リモートからシステムをクラッシュさせることが可能。27年間、世界中のセキュリティ研究者とコードレビューをすり抜けてきたバグを、Mythosが掘り出した。

発掘コストは推論費用で約2万ドル(320万円)。一流のセキュリティチームの年間発見数と同等のバグ発見を、この単価で達成した意味は深い。

5-2. FFmpeg ─ 5億回のファジングが突破できなかった壁

動画処理の事実上の標準ライブラリFFmpegのH.264コーデックで、2010年から存在していた脆弱性を発見。この脆弱性は自動化されたFuzzingツールが5億回以上テストしても検出できなかったものや。(;゚д゚)ポカーン

ここが本当に重要な示唆。従来型のセキュリティ自動化手法(ファジング・静的解析・動的解析)とは根本的に異なる発見経路が存在することを証明している。

5-3. FreeBSD NFS ─ 20ガジェットのROPチェーン

FreeBSDのNFS実装に17年眠っていた未認証RCE(CVE-2026-4747)。特筆すべきは、Mythosが発見しただけでなく、20ガジェットのROPチェーンをパケット分割で配送するという高度なエクスプロイト技法まで自律で構築した点や。

5-4. Firefox ─ 4段階サンドボックス脱出

同じ条件での実測で、Claude Opus 4.6が2件の成功に対してMythosは181件。倍率にして90倍。ブラウザのJITコンパイラを悪用したヒープスプレーで、レンダラーサンドボックスとOSサンドボックスの両方を突破する4段階の脆弱性チェーンを自動構築している。


6. Project Glasswing ─ 獣の生息地の構造

図鑑の「生息地」の章。Mythosは野生には存在せず、人工の保護区でのみ観察できる。

6-1. 中核12社の構成

6-2. 設計思想の読み解き

Glasswingに招待された組織は、要するに世界のソフトウェア基盤を物理的に支えている主要レイヤーや。OSSメンテナ個人ではなく、デプロイ先の巨大事業者が先に守る、という判断。

「攻撃者が広くアクセスできる前に、防御側が先に脆弱性を掘り切る」というのが公式の設計思想や。

6-3. 3つの非対称性 ─ 外側にいる組織への示唆

Project Glasswingの構造は、結果として3層の非対称性を生み出している。この視点は日本企業にとって特に重要や。

非対称性 内容 影響期間
AI能力の非対称性 Mythos級の防御能力を持つのはGlasswing参加組織のみ 6〜18ヶ月(他社モデル追従まで)
アクセスの非対称性 非参加企業・中小企業・日本を含む非米国組織は間接・遅延アクセス 不定
地政学的非対称性 12社のうち11社が米国企業、金融も米系のみ 恒常的

ゼロトラスト製品(Okta、Netskope、Zscaler等)のうち、GlasswingパートナーはCiscoとPalo Alto Networksの2社のみ。他のゼロトラストベンダーがMythos級の防御能力を得るまでにはかなりのタイムラグが発生する。調達判断でこの非対称性を見落とすと、防御層に格差が生まれる。


7. 業界の連鎖反応 ─ 獣が呼んだ嵐

7-1. OpenAIの即応 ─ GPT-5.4-Cyber

Anthropicの発表からわずか1週間後の2026年4月14日、OpenAIが対抗モデルGPT-5.4-Cyberを一部ユーザーに限定公開した。ソフトウェア脆弱性の特定が目的で、従来より検証時の制約が少ないのが特徴とされる。サイバーセキュリティAI軍拡競争の始まりの号砲や。

7-2. 金融規制当局の緊急対応

  • 米Fed議長ジェローム・パウエル + 財務長官ベッセント が主要米国銀行CEOと緊急会合
  • イングランド銀行CMorg(Cross Market Operational Resilience Group)が英国主要銀行・保険CEO向けブリーフィングを2週間以内に実施予定
  • ゴールドマン・サックスCEOデビッド・ソロモン が「既にAnthropicとMythos対策で協働中」と声明

重要インフラの脆弱性が国家安全保障マターとして即座に扱われた、という事実を軽視したらあかん。

7-3. 中国国家系ハッカー事件

関連する事件として、中国国家系ハッカーグループがClaude Codeを悪用して30組織への侵害を試みたことがAnthropic自身の調査で判明している。Mythos公開見送りの判断の背景には、こうした既存モデルの悪用事例も影響していると見られる。


8. 日本企業・個人開発者への示唆

8-1. 中堅企業・SMBが取るべきアクション

Glasswingに招待される可能性が低い日本企業は、以下の基本の徹底で対抗する選択肢しか残らない。

  1. パッチ適用SLAの短縮 ─ 重要度Highは72時間以内を目標
  2. 自動更新の全面適用 ─ 依存関係のバージョンアップを「セキュリティ対応」扱いに昇格
  3. SBOM整備 ─ CycloneDX / SPDX形式で全プロダクトを可視化
  4. ログ基盤の統合 ─ エンドポイント・ネットワーク・アプリ層をSIEMに集約

8-2. 個人開発者の生存戦略

個人開発者はそもそもGlasswingとは無縁やが、自分の公開OSSや個人プロダクトに対しては以下を意識する必要がある。

  • 依存ライブラリの定期スキャンDependabot / Renovate の導入
  • CVE通知の自動化PythonTypeScript で簡易ウォッチャーを組む
  • Human-in-the-loopの設計 ─ エージェント型AIを使った開発では、重要操作に必ず人間の確認ステップを挟む

9. よくある質問

Q1. Mythosと Capybara は別のモデル?

同じ。 Mythosが世代名(Claude 4 に相当)、Capybaraが階層名(Opus に相当)。正式表記はClaude Mythos Capybaraになる見込み。

Q2. 一般公開はいつ?

未定。 Anthropicはリーク文書で「以前のモデルよりも意図的にゆっくりリリース」と明言しとる。さらに「提供コストが非常に高く、効率化してからでないと一般リリースはできない」とも認めている。今後の価格帯はOpusより高くなる可能性が高い。

Q3. 他社モデルが同じ能力を持つまでどのくらい?

Anthropic Frontier Red TeamのLogan Graham氏は「6〜18ヶ月かかる可能性がある」と述べている。ただしAI研究者Nathan Lambertの分析では「オープンモデルとクローズドモデルの性能差は約6ヶ月で一定」とされ、見解にブレはある。

Q4. OSSプロジェクト側にメリットはある?

Project GlasswingにはLinux Foundationが参加しているため、Linuxカーネル等の主要OSSは修正が回ってくる構造になっとる。一方で、個別プロジェクト(libxml2のような小規模メンテナベース)は蚊帳の外。最近のlibxml2プロジェクト放棄ニュースと重ねて読むと、構造的な格差が見えてくる。

Q5. API経由で使える?

現時点では使えない。Project Glasswing参加12社+40組織のみが防御目的で限定利用。一般開発者向けの公開時期も未定。

Q6. Mythosが発見した99%の脆弱性は公開される?

Anthropicは段階的修正プロセスを経てから公開する方針。現時点では99%以上が未パッチのため、詳細は封印されている。CVE番号が付与された一部のみ(FreeBSD CVE-2026-4747等)が公に確認できる状態や。


10. 学習ロードマップ

この領域を継続的に追う開発者向けの学習パス。前回の AISI記事の学習ロードマップ と組み合わせて使うと効果的や。

初級(1ヶ月)

中級(3ヶ月)

  • MITRE ATT&CK Framework で攻撃者視点のTTPs(戦術・技術・手順)を学ぶ
  • Dependabot / Renovate を自分の全リポジトリに適用
  • SBOM(CycloneDX / SPDX)を1プロダクトで生成・運用してみる

上級(6ヶ月以上)

  • AISI / NIST AI Safety Institute の最新レポートを定期ウォッチ
  • USENIX Security / Black Hat / DEF CONの発表を追う
  • 自社のレッドチーム演習にAIエージェントを限定的に組み込んでみる

まとめ

この記事の要点を5行で。

  1. Mythosは漏洩から始まった。 3,000件のCMS漏洩と50万行のソースコード漏洩が、Anthropicの正式発表を前倒しさせた。
  2. 名称は2層構造。 Mythos(世代名)+ Capybara(階層名)で、OpusやHaikuと同じ階層体系の上位レイヤー。
  3. 6つのコア能力のうちサイバーは副産物。 コーディング・推論・結合組織・エージェント・長文理解の融合が、意図せずサイバー能力を生んだ。
  4. Project Glasswingは3つの非対称性を固定化する。 AI能力・アクセス・地政学の3層で、日本企業は外側にいる。
  5. 基本の徹底しか手がない。 パッチSLA短縮、自動更新、SBOM整備、ログ統合 ─ この4点だけで攻撃側の経済性に少しは抵抗できる。

個人的な所感を書いておく。この話題で一番印象的なのは、Mythosの能力は意図して作られたものではなく、他の能力の副産物として出現したという事実や。これはつまり、サイバー能力を意図的に抑制する訓練が入らない限り、次世代の汎用LLMは全て同じ能力を持つ可能性が高いということを示している。

ゴールデンルートではなく、「コードに強くなる」という一般的な進化の先に、サイバー能力が自然発生的に生まれる。これは技術的には美しいし、倫理的には怖い。今できるのは、その未来を前提に、自分の運用基盤を地道に整備することしかない。...orz、派手な結論じゃなくてごめんな。


参考文献


関連記事

Claude Mythosとセキュリティの話題は、以下の記事群とセットで読むと立体的に理解できる。


最後に

この記事が役に立ったら、ぜひ「いいね」と「ストック」をお願いします。
AI × セキュリティの最新動向は、Xでも随時発信しとるで。

2
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?