Claude Fable 5・使用一日目の見立て——道具は能力の最高値ではなく、作業との「重なり」で測る

Posted at 2026-06-10

本記事はFable 5公開翌日、実使用一日目に書いた記録である。 観察が貯まる前の、推論段階の見立てをそのまま残す。当たっても外れても、後の検証の基準点になる。

2026年6月9日、AnthropicがClaude Fable 5を公開した。Mythosと同じ基盤モデルに安全弁を組み込み、一般に開放した最初のMythosクラスのモデルである。「これまで一般提供したどのモデルをも上回る能力」と謳われ、ベンチマークによってはOpus 4.8を10%以上上回るという。

新しい道具が出れば、性能を見たくなる。だが問うべきは「この道具はどれだけ高性能か」ではない。**「この道具の高性能な部分は、私が実際にやる作業と重なっているか」**である。性能の最高値は、自分の作業に重ならなければ意味を持たない。

この記事は、Fable 5を私自身のワークフローという物差しで測った記録である。

1. まず、Fable 5は何が強いのか

報道と公式発表を突き合わせると、Fable 5の能力増分は明確に一点へ集中している。長時間・自律的なエージェント作業である。

AWSの説明では「エージェント環境の中で数日単位で動き続け、計画を立て、目標に対して進捗を点検し、作業を練り直す」とされる。
Stripeは数か月分のエンジニアリング作業を数日に圧縮したと報告。Fable 5は2か月以上かかる大規模Rubyコードベースの移行を完遂したという。
ソフトウェアエンジニアリング、知識労働、ビジョン、科学研究で「卓越した性能」、特に長く複雑なタスクでOpusモデルを上回る。

つまりFable 5の真価は、**「人間が何度も口を挟まずに、長い作業を一気に最後まで走らせる」**ところにある。

一方で制約もある。サイバーセキュリティ、生物、化学、蒸留（モデル蒸留）に関わる高リスクな質問は、Fable 5ではなくOpus 4.8に自動的に振り分けられる。安全弁が発動するのは平均で全セッションの5%未満とされる。私の用途には無縁の領域だが、構造として知っておく価値はある。

2. 私のワークフローは、どういう形をしているか

ここで自分の作業を正直に分解する。私がAIに対してやっていることは、ほぼ三種類に収まる。

的を絞ったQ&A——一問一答。事実確認、計算の検証、概念の壁打ち。
単発のスクリプト生成——gear_analyzer.pyのような測定ツールを、一つずつ作る・直す。
記事の下書き——Qiita記事を、議論を詰めながら書き上げる。

この三つに共通するのは、どれも「短い往復」で完結するということだ。一回の作業が数日にわたって自律的に走り続ける、という形をしていない。私が問い、AIが答え、私が判断する。その繰り返しである。

3. 増分とワークフローを重ねると

ここで二つの図形を重ねてみる。Fable 5の能力増分は「長時間・自律エージェント作業」に集中している。私のワークフローは「短い往復」でできている。

重なりが小さい。

これは性能を疑っているのではない。Fable 5が強いのは事実だ。だが、その強さが最も発揮される場面——数時間から数日、人間の介入なしに走り続ける作業——を、私はそもそも作業として持っていない。

gear_analyzer.pyの改修を例にとる。あれは私が構造を熟知し、何度も手を入れてきたコードだ。一回あたりの改修は「ここをこう直す」という短い往復で済む。これをFable 5に任せても、出てくるのは「往復が少し減った」程度の差でしかない。前のモデルでもv3.7まで作れていた事実が、それを裏づけている。

記事執筆も同じだ。長い文脈を保つ力は確かに上がっている。⑭まで積み上げた議論と矛盾しないように⑳を書く、という縛りには効く。だが私の書き方は、一気に全部書かせるのではなく、段落ごとに詰めて確かめる方式だ。ここでも「短い往復」が基本である。

4. では、私には無意味なのか

そうとは限らない。重なりが小さいのは「今の」ワークフローとの話だ。

もし私が、これまで手を出してこなかった種類の作業に踏み込むなら、話は変わる。たとえば——

構造の見通しが要る、新規のソフト。慣らし中の電流増加とモーターのブラシ劣化を切り分けて記録するArduino計測側のソフトなど、ゼロから設計の筋を通す作業。
長い理論的検証。低レイノルズ数まわりのBEM計算のように、何手も先まで整合を保ったまま進める作業。

こうした「新規性があり、見通しの長い」対象でこそ、Fable 5の「何手も先まで筋を通す」力が活きる。逆にいえば、Fable 5は私のワークフローを変える誘因にはなるが、今のワークフローを速くする道具ではない、というのが正確な評価だ。

5. コストという最後の物差し

評価には費用が要る。Fable 5は入力100万トークンあたり10ドル、出力50ドル。Mythos Previewの半額以下とはいえ、安くはない。

提供条件も特殊だ。Pro/Max/Team/Enterpriseの各プランに6月22日まで含まれるが、6月23日以降はプランから外れ、利用にはクレジットが必要になる。容量が確保され次第プランに再追加する予定、とされている。

つまり**「無料で試せるのは実質6月22日まで」**である。これは判断材料として大きい。AIメモリの高騰でDDR5の増設を見送ったときと同じ、コストと効果を天秤にかける場面だ。

6. 結論——道具は、得意な範囲で使い切る

整理する。

Fable 5の強みは長時間・自律エージェント作業に集中している。
私のワークフローは短い往復でできており、重なりは小さい。
ゆえに「今の作業を速くする道具」としての価値は限定的。
ただし「新しい種類の作業に踏み込む誘因」としては価値がある。
無料で確かめられるのは6月22日まで。

新しい道具が出たとき、最も愚かなのは「高性能だから使う」でも「自分には関係ないから無視する」でもない。自分の作業の形を正確に把握し、道具の強みと重ね合わせて、重なった部分だけを使い切ることだ。

性能の最高値に目を奪われず、自分の現場との重なりで測る。地図が正確であれば、道具は迷わず選べる。

7. 断っておく——本記事は仮説である

正直に書いておく。本記事の核心である「短い往復では差が出にくい」は、現時点では検証前の推論である。私はFable 5を今日初めて使った。観察はまだ無い。

6月22日までの無料期間に、実作業——スクリプトの相談、記事の協働、一問一答——の中で確かめる。往復は減ったか。見落としは減ったか。前のモデルと何が違ったか。結果は続編に書く。この見立てが外れていたなら、外れた理由ごと書く。

本記事は2026年6月10日時点の公開情報に基づく。Fable 5の提供条件・価格は変更される可能性がある。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up