0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Claude Fable 5・使用一日目の見立て——道具は能力の最高値ではなく、作業との「重なり」で測る

0
Posted at

本記事はFable 5公開翌日、実使用一日目に書いた記録である。 観察が貯まる前の、推論段階の見立てをそのまま残す。当たっても外れても、後の検証の基準点になる。

2026年6月9日、AnthropicがClaude Fable 5を公開した。Mythosと同じ基盤モデルに安全弁を組み込み、一般に開放した最初のMythosクラスのモデルである。「これまで一般提供したどのモデルをも上回る能力」と謳われ、ベンチマークによってはOpus 4.8を10%以上上回るという。

新しい道具が出れば、性能を見たくなる。だが問うべきは「この道具はどれだけ高性能か」ではない。**「この道具の高性能な部分は、私が実際にやる作業と重なっているか」**である。性能の最高値は、自分の作業に重ならなければ意味を持たない。

この記事は、Fable 5を私自身のワークフローという物差しで測った記録である。


1. まず、Fable 5は何が強いのか

報道と公式発表を突き合わせると、Fable 5の能力増分は明確に一点へ集中している。長時間・自律的なエージェント作業である。

  • AWSの説明では「エージェント環境の中で数日単位で動き続け、計画を立て、目標に対して進捗を点検し、作業を練り直す」とされる。
  • Stripeは数か月分のエンジニアリング作業を数日に圧縮したと報告。Fable 5は2か月以上かかる大規模Rubyコードベースの移行を完遂したという。
  • ソフトウェアエンジニアリング、知識労働、ビジョン、科学研究で「卓越した性能」、特に長く複雑なタスクでOpusモデルを上回る。

つまりFable 5の真価は、**「人間が何度も口を挟まずに、長い作業を一気に最後まで走らせる」**ところにある。

一方で制約もある。サイバーセキュリティ、生物、化学、蒸留(モデル蒸留)に関わる高リスクな質問は、Fable 5ではなくOpus 4.8に自動的に振り分けられる。安全弁が発動するのは平均で全セッションの5%未満とされる。私の用途には無縁の領域だが、構造として知っておく価値はある。


2. 私のワークフローは、どういう形をしているか

ここで自分の作業を正直に分解する。私がAIに対してやっていることは、ほぼ三種類に収まる。

  1. 的を絞ったQ&A——一問一答。事実確認、計算の検証、概念の壁打ち。
  2. 単発のスクリプト生成——gear_analyzer.pyのような測定ツールを、一つずつ作る・直す。
  3. 記事の下書き——Qiita記事を、議論を詰めながら書き上げる。

この三つに共通するのは、どれも「短い往復」で完結するということだ。一回の作業が数日にわたって自律的に走り続ける、という形をしていない。私が問い、AIが答え、私が判断する。その繰り返しである。


3. 増分とワークフローを重ねると

ここで二つの図形を重ねてみる。Fable 5の能力増分は「長時間・自律エージェント作業」に集中している。私のワークフローは「短い往復」でできている。

重なりが小さい。

これは性能を疑っているのではない。Fable 5が強いのは事実だ。だが、その強さが最も発揮される場面——数時間から数日、人間の介入なしに走り続ける作業——を、私はそもそも作業として持っていない。

gear_analyzer.pyの改修を例にとる。あれは私が構造を熟知し、何度も手を入れてきたコードだ。一回あたりの改修は「ここをこう直す」という短い往復で済む。これをFable 5に任せても、出てくるのは「往復が少し減った」程度の差でしかない。前のモデルでもv3.7まで作れていた事実が、それを裏づけている。

記事執筆も同じだ。長い文脈を保つ力は確かに上がっている。⑭まで積み上げた議論と矛盾しないように⑳を書く、という縛りには効く。だが私の書き方は、一気に全部書かせるのではなく、段落ごとに詰めて確かめる方式だ。ここでも「短い往復」が基本である。


4. では、私には無意味なのか

そうとは限らない。重なりが小さいのは「今の」ワークフローとの話だ。

もし私が、これまで手を出してこなかった種類の作業に踏み込むなら、話は変わる。たとえば——

  • 構造の見通しが要る、新規のソフト。慣らし中の電流増加とモーターのブラシ劣化を切り分けて記録するArduino計測側のソフトなど、ゼロから設計の筋を通す作業。
  • 長い理論的検証。低レイノルズ数まわりのBEM計算のように、何手も先まで整合を保ったまま進める作業。

こうした「新規性があり、見通しの長い」対象でこそ、Fable 5の「何手も先まで筋を通す」力が活きる。逆にいえば、Fable 5は私のワークフローを変える誘因にはなるが、今のワークフローを速くする道具ではない、というのが正確な評価だ。


5. コストという最後の物差し

評価には費用が要る。Fable 5は入力100万トークンあたり10ドル、出力50ドル。Mythos Previewの半額以下とはいえ、安くはない。

提供条件も特殊だ。Pro/Max/Team/Enterpriseの各プランに6月22日まで含まれるが、6月23日以降はプランから外れ、利用にはクレジットが必要になる。容量が確保され次第プランに再追加する予定、とされている。

つまり**「無料で試せるのは実質6月22日まで」**である。これは判断材料として大きい。AIメモリの高騰でDDR5の増設を見送ったときと同じ、コストと効果を天秤にかける場面だ。


6. 結論——道具は、得意な範囲で使い切る

整理する。

  • Fable 5の強みは長時間・自律エージェント作業に集中している。
  • 私のワークフローは短い往復でできており、重なりは小さい。
  • ゆえに「今の作業を速くする道具」としての価値は限定的。
  • ただし「新しい種類の作業に踏み込む誘因」としては価値がある。
  • 無料で確かめられるのは6月22日まで。

新しい道具が出たとき、最も愚かなのは「高性能だから使う」でも「自分には関係ないから無視する」でもない。自分の作業の形を正確に把握し、道具の強みと重ね合わせて、重なった部分だけを使い切ることだ。

性能の最高値に目を奪われず、自分の現場との重なりで測る。地図が正確であれば、道具は迷わず選べる。


7. 断っておく——本記事は仮説である

正直に書いておく。本記事の核心である「短い往復では差が出にくい」は、現時点では検証前の推論である。私はFable 5を今日初めて使った。観察はまだ無い。

6月22日までの無料期間に、実作業——スクリプトの相談、記事の協働、一問一答——の中で確かめる。往復は減ったか。見落としは減ったか。前のモデルと何が違ったか。結果は続編に書く。この見立てが外れていたなら、外れた理由ごと書く。


本記事は2026年6月10日時点の公開情報に基づく。Fable 5の提供条件・価格は変更される可能性がある。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?