Claude Fable 5、サブスクなら6月22日まではタダで使える。逆に言うと、もうすぐタダじゃなくなる。それまでに「自分は課金してまで使うのか」を決めたいので、料金まわりを一度ちゃんと整理した。
最初に断っておくと、この記事には「Fable 5 で X というタスクを回したら実測 Y トークンでした」みたいな実測値は載せていない。自分の本番タスクで厳密に測ったわけではないからで、適当な数字をでっち上げるくらいなら、公開されている料金からの試算と、自分で測るための手順を書いたほうが誠実だと思った。なので、この記事のゴールは「課金の判断材料を自分で作れるようになる」こと。
まず単価の事実
| 入力 | 出力 | |
|---|---|---|
| Fable 5(通常) | $10 / 1M tok | $50 / 1M tok |
| Fable 5(Batch API) | $5 / 1M tok | $25 / 1M tok |
| Opus 4.8(通常) | $5 / 1M tok | $25 / 1M tok |
| Sonnet 4.6(通常) | $3 / 1M tok | $15 / 1M tok |
ぱっと見「Fable 5 は Opus 4.8 のちょうど倍」。そして面白いのは、Fable 5 を Batch API で回した価格 ($5/$25) が、Opus 4.8 の通常価格とぴったり同じになること。急ぎじゃないバッチ処理なら、Opus の値段で最上位モデルが使える、と読み替えられる。ここは後で効いてくる。
「単価2倍」と「請求2倍」は別の話
ここが一番のポイントで、自分も最初は「倍の値段か、高いな」で止まっていた。でも実際のコストは 単価 × 消費トークン なので、Fable 5 が同じ仕事を少ないトークンで終わらせるなら、請求は2倍にはならない。
実際、コミュニティのレポートでは「Fable 5 は medium 効率設定でも他モデルより少ないトークンでエージェントタスクを完了した」という報告がいくつもある。理由はだいたい共通していて、最初に深く考えて手戻りが減るぶん、ツール呼び出しの往復が減るから。やり直しが1回減れば、その1往復ぶんの入力(巨大なシステムプロンプト+コンテキストを毎回読み直す)が丸ごと浮く。
逆に言うと、手戻りが起きないような簡単なタスクでは、この「効率の良さ」が発動しない。だから簡単なタスクほど Fable 5 は割高になる。単価2倍がそのまま請求2倍に近づく。
つまり判断軸はシンプルで、
やり直しが減ることで浮くトークン代 > 単価の上乗せ分 になるタスクだけ Fable 5 にする。
これが成り立つのは、長くて複雑で、間違えると検証や手戻りが高くつくタスク。逆が成り立つ単発・簡単タスクは Opus 4.8 か Sonnet 4.6 のほうが安く済む。
数字で雑に試算してみる
具体的な感覚を持つために、公開料金だけで雑に計算してみる(これはあくまで料金からの試算で、実測ではない)。
仮に、あるエージェントタスクで 入力 50万トークン・出力 5万トークン 消費したとする(長めのコンテキストを何往復かする想定)。
- Opus 4.8: 0.5M × $5 + 0.05M × $25 = $2.5 + $1.25 = $3.75
- Fable 5(同じトークン量なら): 0.5M × $10 + 0.05M × $50 = $5.0 + $2.5 = $7.5
同じトークン量なら、たしかにきっちり2倍。ここで「Fable 5 は手戻りが減ってトークンが3割少なくて済む」と仮定すると、
- Fable 5(入力35万・出力3.5万): 0.35M × $10 + 0.035M × $50 = $3.5 + $1.75 = $5.25
2倍 ($7.5) には届かず、$5.25 まで下がる。それでも Opus の $3.75 よりは高い。つまり「トークン3割減」程度では、まだ Opus のほうが安い。Fable 5 が金額で勝つには、トークン削減だけじゃなく「Opus だと2回失敗するタスクを1回で当てる」みたいな回数の削減まで必要になる、というのがこの試算から見える。
ここに Batch で半額が効いてくる。急ぎでないなら Fable 5 を $5/$25 で回せるので、上の Fable 5 の試算はそのまま半額になり、Opus の通常価格と勝負できるラインに乗る。「Fable 5 を使いたいが金額が気になる」なら、まず Batch に回せるタスクかを考えるのが一番効く。
キャッシュは「持続可能か暴走請求か」の分かれ目
エージェントを長く走らせると、毎ターン巨大なシステムプロンプトとコンテキストを読み直すので、入力トークンがどんどん積み上がる。$10/1M の入力単価だと、ここが効いてくる。
プロンプトキャッシュを効かせると、キャッシュ読み出しは入力単価の約1割になる。長時間タスクほど効果が大きい。地味だけど、Fable 5 のキャッシュ可能な最小プレフィックスは 2048 トークンで、Opus 4.8 の 4096 より小さい(=短めのプロンプトでもキャッシュが効きやすい)。
確認方法は簡単で、レスポンスの usage を見るだけ。
print(resp.usage.cache_read_input_tokens) # キャッシュから読めた分(約0.1倍)
print(resp.usage.cache_creation_input_tokens) # キャッシュに書いた分(約1.25倍)
print(resp.usage.input_tokens) # 素で課金された分(full)
何度も同じプレフィックスで投げているのに cache_read_input_tokens がずっと 0 なら、どこかで毎回プロンプトが変わってキャッシュが壊れている(システムプロンプトに datetime.now() を埋めてる、JSON のキー順が安定してない、ツール定義が毎回変わってる、など)。長時間 Fable 5 を回すなら、ここが効いてるかどうかで請求が一桁変わりうる。
無料期間中に「自分のタスクで」測るための手順
料金表をいくら睨んでも、自分の使い方での答えは出ない。6月22日までに、いつも投げているタスクで実際に測っておくのがいい。やることは多くない。
- 自分が普段投げる代表的なタスクを3つくらい選ぶ(例: 機能追加、バグ調査、コードレビュー)。
- 同じタスクを Fable 5 / Opus 4.8 / Sonnet 4.6 にそれぞれ投げる。
- 各実行の
usage(input / output / cache_read)を記録する。Claude Code なら JSONL のログに残っているので、そこから拾える。 -
入力tok × 単価 + 出力tok × 単価で実コストを出す。 - 金額だけでなく「やり直し回数」と「最終的な品質」も並べて記録する。ここが本丸。Fable が高くても、Opus が2回失敗するタスクを1回で通すなら、トータルでは安い・速い。
表にするとこんな感じで埋まる(数字は各自が埋める欄)。
| タスク | モデル | 入力tok | 出力tok | 実コスト | やり直し | 品質の手応え |
|---|---|---|---|---|---|---|
| 機能追加 | Fable 5 | — | — | — | — | — |
| 機能追加 | Opus 4.8 | — | — | — | — | — |
| バグ調査 | Fable 5 | — | — | — | — | — |
| … |
これを埋めれば、「自分の場合、どのタスクは Fable に払う価値があって、どれは Opus で十分か」が数字で見える。料金論争に付き合うより、自分のログ1枚のほうがよっぽど判断に効く。
今のところの自分の結論(暫定)
まだ無料期間中なので断定はしないけど、今の手応えでの暫定ルールはこう。
- デフォルトは Opus 4.8 / Sonnet 4.6 のまま。 普段使いで Fable に切り替える理由は、今のところ見つかっていない。差が出ないのに高い。
- 「これは長丁場で、間違えると検証がしんどい」タスクのときだけ Fable 5。 数時間級の自律実行、大きめの移行、深い調査。
- 急ぎじゃないものは Batch に逃がす。 半額で最上位モデルが使えるなら、待てるものは待つ。
- 長く走らせるならキャッシュが効いてるか必ず usage で確認。 ここがザルだと請求が一気に膨らむ。
「最強だから常用」は、品質が変わらないのに財布だけ削られる。逆に「高いから一切使わない」も、本当に効くタスクを取り逃がす。境界を自分のログで引くのが、無料期間中にやっておく価値のある唯一の作業だと思う。