この記事の対象読者
- Claude Fable 5の発表を見て「Mythosクラスってそもそも何だ?」となった人
- API/Claude Codeで実際に使うために、料金・コンテキスト長・モデルIDを知りたい開発者
-
claude-fable-5の「セーフガードでOpus 4.8に切り替わる」挙動が業務に与える影響を見積もりたいエンジニア - 大型タスク(数日がかりのリファクタ、長期エージェント)にAIを使う計画がある人
この記事で得られること
- Fable 5とMythos 5が「同じモデル」である理由と、その線引き
- セーフガード(分類器)が発火したときに何が起きるかの正確な挙動
- API実装で踏みやすい罠(refusal時のステータスコード、課金の扱い、fallback)
- サブスク/APIでの提供スケジュールと、6/23の「無料期間終了」という落とし穴
この記事で扱わないこと
- ベンチマークスコアの逐一比較(公式システムカードに譲る)
- Mythos 5そのものの使い方(一般提供されていないため検証不能)
- 生物・化学・サイバー分野での具体的な利用方法(後述するが、そもそも応答が遮断される)
1. 何が起きたのか ── 「鍵のかかった部屋」が開いた
まず結論から。2026年6月9日、Anthropicは Claude Fable 5 を一般公開した。これは Opusクラスの上に位置する「Mythosクラス」を、初めて誰でも使える形で出してきたという意味で、節目になる出来事だ。
この記事では一貫して「鍵のかかった部屋」という比喩で話を進める。理解の地図として置いておいてほしい。
- Mythosクラス = 部屋そのもの。中には極めて強力な能力が置いてある
- Claude Mythos Preview(4月公開) = 部屋に入れるのは選ばれた一握りだけ。鍵を持つのはProject Glasswingのサイバー防衛パートナーのみ
- Claude Fable 5(今回) = 同じ部屋に、誰でも入れるようになった。ただし「危険な棚」の前には自動シャッターが下りる
- Claude Mythos 5(今回) = シャッターのない部屋。引き続き鍵を持つ者だけが入れる
Anthropicの公式発表の原文はこうだ。
Today we’re launching Claude Fable 5: a Mythos-class model that we’ve made safe for general use.
(和訳: 本日、Claude Fable 5をローンチします。これは、私たちが一般利用向けに安全化したMythosクラスのモデルです)
出典:
https://www.anthropic.com/news/claude-fable-5-mythos-5
つまりFableとMythosは、能力としては同じ部屋=同じ基盤モデルにいる。違いはシャッター(セーフガード)があるかないか、ただそれだけだ。公式の脚注がこの命名の理由を明かしている。
Fable is from the Latin fabula, “that which is told,” akin to the Greek mythos. The safeguards are what distinguish the two models (Fable and Mythos) and are why we’ve given them different names.
(和訳: Fableはラテン語の fabula「語られるもの」に由来し、ギリシャ語の mythos に通じる。両モデルを区別しているのはセーフガードであり、それゆえ別の名前を与えている)
Mythosクラスとは、Anthropicのモデル階層でOpusクラスの上に新設されたティア。これまでHaiku / Sonnet / Opusの3層だったところに、4層目が乗った格好だ。
ここまでで「FableとMythosの関係」という地図が手に入った。次は、その地図の上で最も重要な「シャッターの仕組み」を見ていく。
2. セーフガードの正体 ── シャッターが下りると、誰が応答するのか
Fable 5を語るうえで避けて通れないのが、このセーフガードの挙動だ。ここを誤解したまま業務に組み込むと、後で「なぜか挙動が変わる」と混乱する。
2.1 「拒否」ではなく「降格」する
普通、AIモデルが危険な要求を断るときは「お答えできません」と拒否(refusal)する。Fable 5はここが違う。危険と判定された要求は、自動的にOpus 4.8が代わりに応答する。比喩で言えば、危険な棚の前にシャッターが下りると、その場に控えていた次席のスタッフ=Opus 4.8が代わりに接客に出てくる、というイメージだ。
When Fable’s classifiers detect a request related to cybersecurity, biology and chemistry, or distillation, the response is automatically handled by Claude Opus 4.8 instead. Users will be informed whenever this occurs.
(和訳: Fableの分類器がサイバーセキュリティ、生物・化学、または蒸留に関連する要求を検出すると、応答は自動的にClaude Opus 4.8によって処理される。これが発生した場合、ユーザーには必ず通知される)
公式は、これを「門前払いより遥かにマシな体験」だと位置づけている。
Opus 4.8 is a highly capable model in its own right: a response that falls back to Opus is a far better experience than an outright refusal from Fable.
(和訳: Opus 4.8はそれ自体が非常に高性能なモデルだ。Opusへのフォールバックは、Fableからの完全な拒否よりも遥かに良い体験である)
2.2 シャッターが下りる3つの領域
分類器がカバーするのは次の3領域だ。
| 領域 | なぜ遮断するのか | 挙動 |
|---|---|---|
| サイバーセキュリティ | 脆弱性の発見・悪用、エージェント型ハッキングへの「底上げ」を防ぐため | Opus 4.8へフォールバック |
| 生物・化学 | バイオ兵器関連や高リスクな生物研究への悪用懸念 | Opus 4.8へフォールバック |
| 蒸留(Distillation) | 能力を抜き取って無認可の競合モデルを訓練する試みを防ぐため | Opus 4.8へフォールバック |
2.3 「保守的に倒した」ことの実務的インパクト
ここが一番大事なので強調しておく。Anthropicは「安全側に倒すため、セーフガードを意図的に厳しめにチューニングした」と明言している。つまり、無害な要求でもシャッターが下りることがある。
they’ll sometimes catch harmless requests, though they trigger, on average, in less than 5% of sessions.
(和訳: それらは時に無害な要求も捕捉してしまうが、発火するのは平均してセッションの5%未満である)
あなたが書いたコードに、たまたまセキュリティっぽいキーワードや暗号処理が含まれていると、Fable 5ではなくOpus 4.8が応答する可能性がある。「FableのつもりがOpusだった」という事象は、確率5%未満とはいえ確実に起こる。再現性が要る業務では、この前提でテスト設計をすること。
逆に言えば、95%以上のセッションではフォールバックが一切起きず、その間はMythos 5と実質同じ性能が手に入る。
Our early data shows that more than 95% of Fable sessions involve no fallback at all—for those sessions, Fable 5’s performance is effectively the same as that of Mythos 5.
(和訳: 初期データでは、Fableセッションの95%以上はフォールバックを一切伴わない。それらのセッションでは、Fable 5の性能は実質的にMythos 5と同じである)
セーフガードという「シャッター」の仕組みが分かったところで、次はこれを実際にAPIから叩くと何が返ってくるのかを見る。ここを知らないと、本番でハマる。
3. API実装で踏む地雷 ── refusalは「エラー」じゃない
ここからはAPIを実際に使う開発者向けの実務情報だ。公式ドキュメントから、踏みやすい罠を順に潰していく。
3.1 拒否されてもHTTP 200が返る
最初の罠がこれ。Fable 5が要求を拒否したとき、Messages APIはエラーではなく、成功扱いのHTTP 200を返す。
When Claude Fable 5 declines a request, the Messages API returns
stop_reason: "refusal"as a successful HTTP 200 response, not an error.
(和訳: Claude Fable 5が要求を拒否するとき、Messages APIはエラーではなく、成功したHTTP 200レスポンスとして stop_reason: "refusal" を返す)
try/except でHTTPエラーだけ拾う実装だと、拒否を取りこぼす。stop_reason の値を必ずチェックすること。 どの分類器が拒否したかもレスポンスに含まれる。
3.2 フォールバックは手動で組む
「Opus 4.8に自動で降格する」と書いたが、これはClaude.aiやClaude Codeのようなアプリ表面での話。生のAPIでは、フォールバックは自分で組む必要がある(fallbacks パラメータ、またはSDKミドルウェア経由)。
3.3 課金 ── 拒否されたら課金されない
地味だが重要。出力が生成される前に拒否された要求は課金されない。別モデルへリトライした場合、プロンプトキャッシュの切り替えコストは「フォールバッククレジット」で還付される。
You are not billed for a request that is refused before any output is generated.
(和訳: 出力が生成される前に拒否された要求については、課金されない)
出典(API挙動全般):
3.4 最小実装イメージ
refusal判定とフォールバックの骨格を、責務を分けて書くとこうなる。実際のSDK仕様は公式に従ってほしいが、設計の勘所はこの分離にある。
クリックでサンプルコード(Python・擬似実装)を展開
"""
Fable 5のrefusal/fallbackを扱う最小構成。
- 「判定」と「フォールバック実行」の責務を分離(関心の分離)
- HTTP例外ではなくstop_reasonで分岐する点が肝
"""
from dataclasses import dataclass
FABLE = "claude-fable-5"
FALLBACK = "claude-opus-4-8"
@dataclass
class ClaudeResult:
stop_reason: str
text: str
declined_by: str | None # どの分類器が拒否したか
def is_refusal(result: ClaudeResult) -> bool:
"""拒否判定だけに責任を持つ純粋関数。"""
return result.stop_reason == "refusal"
def call_with_fallback(client, messages) -> ClaudeResult:
"""
Fableで叩き、拒否ならOpusへ降格する。
HTTP 200でも refusal が返り得る点に注意。
"""
primary = client.create(model=FABLE, messages=messages)
if not is_refusal(primary):
return primary
# 出力前拒否なら課金されない。安心してリトライしてよい。
return client.create(model=FALLBACK, messages=messages)
ここまでで「実装する側」の準備は整った。次は、その実装をいつ・どのプランで動かせるのかという提供条件を確認する。スペックとスケジュールを取り違えると、稟議も見積もりも崩れる。
4. スペックと料金 ── 数字で押さえる
4.1 モデル仕様
| 項目 | Claude Fable 5 | Claude Mythos 5 |
|---|---|---|
| APIモデルID | claude-fable-5 |
claude-mythos-5 |
| 位置づけ | 一般提供される最上位モデル | Fableからセーフガードを外した同一基盤モデル |
| コンテキスト長 | 100万トークン(デフォルト) | 100万トークン(デフォルト) |
| 最大出力 | 1リクエストあたり12.8万トークン | 同左 |
| 入力料金 | $10 / 100万トークン | $10 / 100万トークン |
| 出力料金 | $50 / 100万トークン | $50 / 100万トークン |
| 提供範囲 | 一般提供 | Project Glasswing承認済みのみ |
| データ保持 | 30日保持必須(ゼロデータ保持は不可) | 同左 |
料金の $10 / $50(100万トークンあたり入力/出力)は、Claude Mythos Previewの半額未満だと公式が述べている。プロンプトキャッシュには既存の入力トークン90%割引が引き続き効く。
4.2 思考モードの違いに注意
Fable 5 / Mythos 5では「適応的思考(adaptive thinking)」が常時ONで、これが唯一の思考モードだ。thinking: {"type": "disabled"} はサポートされない。思考の深さは effort パラメータで制御する。さらに、生の思考過程(raw chain of thought)は返ってこない(デフォルトで omitted、summarized を指定すると要約版が得られる)。
旧モデルから移植する際、ここを前提にしていたコードは確実に動作が変わる。
4.3 データ保持ポリシーの変更
これは法務・コンプラ観点で見落とせない。Fable 5・Mythos 5は「Covered Models」に指定され、全トラフィックで30日間のデータ保持が必須になった。ゼロデータ保持(ZDR)契約では使えない。
We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose.
(和訳: Mythosクラスのモデルでは、第一者・第三者いずれの表面でも、全トラフィックで30日間の保持を必須とする。このデータを新しいClaudeモデルの訓練や、安全性以外の目的に使うことはない)
数字とスペックを押さえたところで、最後に「いつ使えるのか」という時間軸の話をする。ここに今回最大の落とし穴がある。
5. 提供スケジュール ── 6/23という落とし穴
APIと従量課金のEnterpriseでは本日から完全に使える。問題はサブスクプランだ。Anthropicは需要予測の難しさから、段階的なロールアウトを選んだ。
6月23日に、Pro/Max/Team/seat型EnterpriseプランからFable 5が一旦外される。それ以降の利用にはusage creditsが必要になる。「無料で使えていたから本番に組み込んだ」が6/23に突然崩れる可能性がある。サブスク前提で運用設計している場合は要注意。容量に余裕ができ次第、標準機能として戻す方針とのこと。
From today through June 22, Fable 5 is included on Pro, Max, Team, and seat-based Enterprise plans at no extra cost. On June 23, we’ll remove Fable 5 from those plans.
(和訳: 本日から6月22日まで、Fable 5はPro、Max、Team、シート型Enterpriseプランに追加費用なしで含まれる。6月23日に、これらのプランからFable 5を削除する)
なお、この記事を書いているのは公開当日(日本時間6/10)であり、上記スケジュールは今後変更されうる。最新情報は必ず一次情報を確認してほしい。
6. よくある疑問と回答(トラブルシューティング)
| 疑問・症状 | 回答・対処 |
|---|---|
| Fableを指定したのにOpusっぽい応答が返る | セーフガードのフォールバックが発火した可能性。レスポンスの通知とどの分類器が反応したかを確認 |
stop_reason: "refusal" が来たがエラーにならない |
仕様通り。拒否は成功扱いのHTTP 200。stop_reason で分岐する実装にする |
| 拒否された分の料金が気になる | 出力生成前の拒否は課金されない。リトライ時のキャッシュ切替分はフォールバッククレジットで還付 |
thinking: disabled を指定したらエラー |
Fable/Mythosでは無効化不可。適応的思考が常時ON。深さは effort で調整 |
| 生の思考過程が空で返る | 仕様。デフォルトが omitted。要約が欲しければ display: "summarized"
|
| ZDR(ゼロデータ保持)契約で使えない | Covered Model指定のため30日保持が必須。ZDRでは利用不可 |
| サブスクで使えていたのに6/23以降使えない | スケジュール通りの撤去。usage creditsが必要 |
| Mythos 5を使いたい | 一般提供なし。Project Glasswing承認が必要。一般ユーザーはFable 5を使う |
7. 結局、何に使うべきか ── 適性の見極め
公式が繰り返し強調しているのは「タスクが長く複雑になるほど、Fable 5の優位が大きくなる」という点だ。早期テスターの声から、向いている用途を整理する。
Stripeの早期テストでは、5000万行のRubyコードベースの全体移行を1日で完了させた。手作業ならチームで2か月超かかる規模だ。
In a 50-million-line Ruby codebase, the model performed a codebase-wide migration in a day that would otherwise have taken a whole team over two months by hand.
(和訳: 5000万行のRubyコードベースで、このモデルは、手作業ならチームで2か月以上かかったであろうコードベース全体の移行を1日で実行した)
逆に、短い単発のタスクや、セーフガードに引っかかる領域では、Fable 5を選ぶ旨味は薄い。前者はOpus 4.8やSonnetで十分だし、後者はそもそもOpus 4.8に降格される。「最強だから何にでも使う」は、$50/100万出力トークンという価格を考えると賢くない。
8. 学習ロードマップ
Fable 5を起点に、AnthropicのモデルとAI基盤への理解を広げるなら、次の順序がおすすめだ。
Tier 1: まず足場を固める
- LLMの基礎 ── そもそも大規模言語モデルとは何か
- Transformer / Self-Attention ── Fableの土台にある仕組み
- APIの基本 ── Messages APIを叩く前提知識
Tier 2: エージェント文脈を理解する
- MCP ── 長期エージェントが外部ツールと話す仕組み
- ClaudeMythos ── 今回のFableの「シャッターなし版」の前身
Tier 3: 安全性とガバナンス
- セーフガード/分類器の考え方 ── なぜ降格方式を採るのか
- 30日データ保持とCovered Modelの法務インパクト
まとめ
- Claude Fable 5は、Opusの上のMythosクラスを初めて一般公開したモデル。FableとMythos 5は同じ基盤モデルで、違いはセーフガードの有無だけ
- 危険領域(サイバー/生物・化学/蒸留)の要求は拒否ではなくOpus 4.8へ降格する。発火は平均5%未満だが、無害な要求も巻き込まれうる
- API実装では、拒否はHTTP 200で返る・出力前拒否は無課金・思考は常時ON&生の思考は非返却という3点を押さえる
- 料金は$10/$50(入力/出力・100万トークン)、コンテキスト100万トークン、出力12.8万トークン、30日データ保持必須
- サブスクは6/23に一旦撤去→usage creditsへという段階ロールアウト。無料前提の本番組み込みは要注意
個人的な所感を最後に。Mythosが4月に「鍵のかかった部屋」として出てきたとき、正直「一般人には縁のない話だな」と思っていた。それがわずか2か月で、シャッター付きとはいえ一般公開まで来た。「降格」というアイデアは地味だが上手いと思う。拒否されると体験が途切れるが、Opus 4.8という極めて優秀な次席が控えていれば、ユーザーはほとんど不便を感じない。安全と利便のトレードオフを、二者択一ではなく「段差」で解いてきたわけだ。とはいえ5%未満とはいえ無害な要求も巻き込む現状は、使う側として正直に頭に入れておきたい。草を生やしている場合じゃない、これは実務で確実に踏む(;゚д゚)ポカーン案件だ。
参考文献
公式発表:
https://www.anthropic.com/news/claude-fable-5-mythos-5
APIドキュメント(モデルID・料金・refusal挙動):
Project Glasswing:
https://www.anthropic.com/glasswing
筆者のXもよかったらどうぞ。最新のAI・GPU・ローカルLLMネタを発信しています。