今朝、Claude Fable 5 が公開されました。数日がかりのタスクを自分で動かし続ける、というモデルです。新機能を網羅する記事ではなく、WordPress プラグインを一人で作っている立場から、Fable 5 と Opus をいつ使い分けるか、をコスト目線で整理します。
この記事の立ち位置です。Fable 5 は公開当日で、まだ実機で数日動かしてはいません。発表(Anthropic)と報道(2026年6月9日〜10日時点)をもとにした整理+個人開発者の見立てで、実体験レポートではありません。能力の話は「発表では」「ベンチマークでは」として読み、数字・仕様は公式の料金/モデルページで最新を確認してください。出典は末尾です。
Fable 5 の要点
発表をもとに、要点だけ先に押さえます。
- 一般公開される初の Mythos クラス。Anthropic の第5世代。モデル群は Haiku・Sonnet・Opus・Mythos の4クラスで、Mythos は Opus の上
- 売りは長時間・非同期。数日がかりの複雑なタスクを、計画・サブエージェントへの委譲・自己修正をしながら自走する(Claude Code のようなエージェント環境で)
- ベンチマークはほぼ全項目で最先端、タスクが長く複雑なほどリードが広がる、とされる
- 視覚が強化。ファイル/PDF内の図表を読み、コーディングでは自分の出力を目標と照らして点検する
- 料金は入力100万トークンあたり$10、出力$50、プロンプトキャッシュの入力90%割引つき。API名は
claude-fable-5
「数日動く」の手触りとしては、報道で、ある研究者が19ページの仕様書を渡したら9時間半ほど動き続けてツールを作り上げた、という例が紹介されています。一回の指示で半日以上、というのが想定スケールのようです。
Mythos と Fable の関係も押さえておくと位置づけが分かりやすいです。Mythos は4月公開時、高いサイバーセキュリティ能力ゆえに一般提供されず、重要インフラ系の組織に限定提供されていました(Project Glasswing)。その能力を持ちつつ一般に出せる形にしたのが Fable 5 で、無制限版の Mythos 5 は引き続き限定提供のままです。同じ土台のモデルを、安全策の有無で二つに分けて出している、と捉えると分かりやすい。個人開発者が手にできるのは「公開されたほう」の Fable です。
使い分けの早見
Anthropic 自身が住み分けを言っています。Fable は、分解・調査・作成・検証まで長時間こなす野心的・非同期タスク向き。Opus は、より速い同期的な共同作業向き。これを個人開発に当てると、こうなります。
Fable を当てたい場面。
- 一人では一気に終わらない大物(大きな移行、仕様から一式を作り切る)
- 週末に放っておいて、月曜に受け取りたい非同期の塊
- 自走させる価値がはっきりある作業
Opus(など同期型)で足りる場面。
- 一機能の実装、バグ修正、レビュー、リファクタ
- 隣で一緒に手を動かす、日々の大半の作業
- すぐ結果を見て、その場で方向を直したい作業
コスト注意です。長時間自走するモデルは、その間ずっとトークンを焼きます。しかも出力単価は入力の5倍($50 対 $10)。自走中は計画・コード・テスト・修正を「書く」ので、出力比率が積み上がりやすく、プロンプトキャッシュの割引は入力側だけです。「数日動く」は「数日ぶんの出力代が積む」でもあります。一人で数日かかる大物を片づけてくれるなら自走代は安いですが、隣でこなせる作業に自走モデルを当てるのは、いちばん高い蛇口を全開にするのと同じでした。
要は、強いから常用、ではなく、自走させたい大物のときだけ。用件の重さに、モデルの重さを合わせる、という整理です。
フォールバックという安全設計
設計として面白い点です。Fable 5 は、サイバーセキュリティや生物・化学などの高リスク領域では応答をブロックし、代わりに Claude Opus 4.8 が答える、とされています。強いモデルを一般公開するために、危ない領域だけ一段下へ落とす線引きです。外部バグバウンティを千時間以上回してユニバーサルなジェイルブレイクは出なかった、とも。
能力を全開にせず、領域ごとに別モデルへ落とす。これは「エージェントにどこまで実行を許すか」という線引きと発想が近いと感じました。強い道具ほど、何をさせないかの設計が効きます。
視覚で自分の出力を点検する、という点は期待しつつ、用心も残しています。AIの出力をAIが扱うのは二重の信頼で、点検する側とされる側が同じモデルだと、同じ思い込みを見落としうるからです。ここは実機で確かめたい部分です。
自分の現在地
正直なところ、すぐ常用するモデルではないと思っています。日々の作業は同期型で足りるし、財布の都合もある。週末に放っておける大物が出たときの選択肢として、頭の隅に置く距離感です。
確かめたいのは、数日動くが現実のプラグイン開発でどれだけ効くか、自走時の財布の重さ、視覚の自己点検が管理画面のスクショ修正のような使い方で効くか。ここは実機で動かしてから別記事にします。
次の自分に渡すメモ
新しくて強いモデルが出ると、つい常用したくなる。けれど、強さと、自分の用件に合うことは別でした。Fable は放っておいて任せる大物の道具、日々の同期作業は Opus のような相手で足りて財布にも優しい。用件の重さに、モデルの重さを合わせる。実機で動かしたら、この見立てが当たったか外れたかも含めて、また書きます。
参考
公開当日の発表・報道です。数字や仕様は最新を公式で確認してください。