0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【速報】Anthropicが「Claude Fable 5」をリリース — Mythos級モデルがついに一般公開

0
Posted at

2026年6月9日(現地時間)、Anthropicが新モデル Claude Fable 5Claude Mythos 5 を発表・提供開始しました。リリース直後の速報として、公式発表(Claude Fable 5 and Claude Mythos 5)をベースに要点をまとめます。

本記事は公式ブログおよび各種報道の一次情報に基づいています。ベンチマークの詳細や安全性評価はAnthropicのシステムカードを参照してください。

Claude Fable 5とは何か

Fable 5は、Anthropicが新設した最上位ティア 「Mythos級(Mythos-class)」 に属する、初の一般提供モデルです。

経緯を簡単に振り返ると、Anthropicは今年4月にフロンティアモデル「Claude Mythos Preview」を発表しましたが、サイバー攻撃への悪用リスク(脆弱性の発見・悪用能力が極めて高い)を理由に一般公開は見送り、米政府と連携した「Project Glasswing」を通じて、サイバー防衛組織や重要インフラ企業など限られたパートナーにのみ提供していました。

今回の発表のポイントは以下の通りです。

  • Claude Fable 5: Mythos級の能力に強力なセーフガードを組み込み、一般利用を可能にしたモデル
  • Claude Mythos 5: Fable 5と同一の基盤モデルで、一部領域のセーフガードを解除したもの。引き続きProject Glasswing経由の承認済み組織限定

つまり「モデル自体は同じで、安全制限の有無と提供対象が違う」という構成です。

性能: ほぼ全ベンチマークでSOTA

公式発表によると、Fable 5はこれまで一般提供されたどのモデルよりも高い能力を持ち、テストされたほぼすべてのベンチマークで最先端(state-of-the-art)を達成。ソフトウェアエンジニアリング、ナレッジワーク、ビジョン、科学研究などで高い性能を示し、タスクが長く複雑になるほど他モデルとの差が広がるとされています。自律稼働できる時間も過去のClaudeモデルで最長とのこと。

公式に挙げられている実例をいくつか紹介します。

  • ソフトウェアエンジニアリング: 早期テストでStripeが、5,000万行規模のRubyコードベース全体のマイグレーションをFable 5が1日で完了したと報告。人手ならチームで2か月以上かかる作業とのこと
  • ビジョン: スクリーンショットのみからWebアプリのソースコードを再構築するようなタスクが可能。従来モデルが補助ツール付きでも苦戦していたポケモンFireRedを、画面情報のみの最小ハーネスでクリア
  • 長文コンテキスト・メモリ: 数百万トークン規模の長時間タスクでも集中を維持し、自分のメモを活用して出力を改善

エンジニア的に一番面白いのは「フォールバック型セーフガード」

今回のリリースで技術的に最も興味深いのは、安全対策のアーキテクチャです。

Fable 5には、メインモデルとは別のAIシステムである 分類器(classifier) が組み込まれており、以下の領域に関するリクエストを検知します。

  1. サイバーセキュリティ(脆弱性の発見・悪用、エージェント的なハッキング行為など)
  2. 生物学・化学
  3. 蒸留(モデル能力の無断抽出)

分類器が反応した場合、リクエストは拒否されるのではなく、次点の高性能モデルであるClaude Opus 4.8に自動的にフォールバックして応答が生成されます。切り替えが発生した際はユーザーに通知される仕組みです。

「拒否ではなくフォールバック」という設計は、UX的にかなり合理的だと感じます。公式によると、初期データではフォールバックが発生するのはセッションの5%未満。分類器は意図的に保守的にチューニングされており、無害なリクエストが誤検知されるケースもあることをAnthropic自身が認めていて、今後False Positiveを減らしていくとしています。

また、外部のバグバウンティプログラムで1,000時間以上のテストを実施し、ユニバーサルジェイルブレイク(あらゆる制限を突破する手法)は発見されなかったと報じられています。

料金と利用方法

  • API価格: 入力 $10 / 1Mトークン、出力 $50 / 1Mトークン(Mythos Previewの半額以下)
  • コンテキストウィンドウ: 100万トークン、最大出力128Kトークン
  • 提供経路: Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry
  • サブスクリプション: Pro / Max / Team / Enterprise(シートベース)プランに6月22日まで含まれる。6月23日以降はプランから外れ、利用にはクレジットが必要になる(キャパシティが確保でき次第、プランに再追加予定とのこと)

Opus 4.8比で約2倍の価格設定ですが、Mythos Preview時代(Opusの5倍)からは大幅に下がっています。

おわりに: 22日までが勝負

サブスクで追加コストなしに使えるのは6月22日までなので、これから施策を22日まで作っていこうと思います。

個人的にまず試したいのは、過去の自分のプロジェクトをFable 5に渡して、セキュリティ問題や見つけにくいバグを洗い出させることです。Mythos級モデルの脆弱性発見能力がどこまで一般開発者の手元で使えるのか、非常に気になっています。

ただし上で書いた通り、セキュリティレビューはまさにサイバー分類器が反応しうる領域です。自分のコードの防御的なレビューがFable 5本体で処理されるのか、それともOpus 4.8へのフォールバックが発生するのか——この挙動の観察自体も含めて検証し、結果は続報として記事にする予定です。

参考リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?