Claude Fable 5に課金すべきか、無料期間が終わる前に料金を真面目に考えた

Posted at 2026-07-05

Claude Fable 5、サブスクなら6月22日まではタダで使える。逆に言うと、もうすぐタダじゃなくなる。それまでに「自分は課金してまで使うのか」を決めたいので、料金まわりを一度ちゃんと整理した。

最初に断っておくと、この記事には「Fable 5 で X というタスクを回したら実測 Y トークンでした」みたいな実測値は載せていない。自分の本番タスクで厳密に測ったわけではないからで、適当な数字をでっち上げるくらいなら、公開されている料金からの試算と、自分で測るための手順を書いたほうが誠実だと思った。なので、この記事のゴールは「課金の判断材料を自分で作れるようになる」こと。

まず単価の事実

	入力	出力
Fable 5（通常）	$10 / 1M tok	$50 / 1M tok
Fable 5（Batch API）	$5 / 1M tok	$25 / 1M tok
Opus 4.8（通常）	$5 / 1M tok	$25 / 1M tok
Sonnet 4.6（通常）	$3 / 1M tok	$15 / 1M tok

ぱっと見「Fable 5 は Opus 4.8 のちょうど倍」。そして面白いのは、Fable 5 を Batch API で回した価格 ($5/$25) が、Opus 4.8 の通常価格とぴったり同じになること。急ぎじゃないバッチ処理なら、Opus の値段で最上位モデルが使える、と読み替えられる。ここは後で効いてくる。

「単価2倍」と「請求2倍」は別の話

ここが一番のポイントで、自分も最初は「倍の値段か、高いな」で止まっていた。でも実際のコストは 単価 × 消費トークン なので、Fable 5 が同じ仕事を少ないトークンで終わらせるなら、請求は2倍にはならない。

実際、コミュニティのレポートでは「Fable 5 は medium 効率設定でも他モデルより少ないトークンでエージェントタスクを完了した」という報告がいくつもある。理由はだいたい共通していて、最初に深く考えて手戻りが減るぶん、ツール呼び出しの往復が減るから。やり直しが1回減れば、その1往復ぶんの入力（巨大なシステムプロンプト＋コンテキストを毎回読み直す）が丸ごと浮く。

逆に言うと、手戻りが起きないような簡単なタスクでは、この「効率の良さ」が発動しない。だから簡単なタスクほど Fable 5 は割高になる。単価2倍がそのまま請求2倍に近づく。

つまり判断軸はシンプルで、

やり直しが減ることで浮くトークン代 > 単価の上乗せ分 になるタスクだけ Fable 5 にする。

これが成り立つのは、長くて複雑で、間違えると検証や手戻りが高くつくタスク。逆が成り立つ単発・簡単タスクは Opus 4.8 か Sonnet 4.6 のほうが安く済む。

数字で雑に試算してみる

具体的な感覚を持つために、公開料金だけで雑に計算してみる（これはあくまで料金からの試算で、実測ではない）。

仮に、あるエージェントタスクで 入力 50万トークン・出力 5万トークン 消費したとする（長めのコンテキストを何往復かする想定）。

Opus 4.8: 0.5M × $5 + 0.05M × $25 = $2.5 + $1.25 = $3.75
Fable 5（同じトークン量なら）: 0.5M × $10 + 0.05M × $50 = $5.0 + $2.5 = $7.5

同じトークン量なら、たしかにきっちり2倍。ここで「Fable 5 は手戻りが減ってトークンが3割少なくて済む」と仮定すると、

Fable 5（入力35万・出力3.5万）: 0.35M × $10 + 0.035M × $50 = $3.5 + $1.75 = $5.25

2倍 ($7.5) には届かず、$5.25 まで下がる。それでも Opus の $3.75 よりは高い。つまり「トークン3割減」程度では、まだ Opus のほうが安い。Fable 5 が金額で勝つには、トークン削減だけじゃなく「Opus だと2回失敗するタスクを1回で当てる」みたいな回数の削減まで必要になる、というのがこの試算から見える。

ここに Batch で半額が効いてくる。急ぎでないなら Fable 5 を $5/$25 で回せるので、上の Fable 5 の試算はそのまま半額になり、Opus の通常価格と勝負できるラインに乗る。「Fable 5 を使いたいが金額が気になる」なら、まず Batch に回せるタスクかを考えるのが一番効く。

キャッシュは「持続可能か暴走請求か」の分かれ目

エージェントを長く走らせると、毎ターン巨大なシステムプロンプトとコンテキストを読み直すので、入力トークンがどんどん積み上がる。$10/1M の入力単価だと、ここが効いてくる。

プロンプトキャッシュを効かせると、キャッシュ読み出しは入力単価の約1割になる。長時間タスクほど効果が大きい。地味だけど、Fable 5 のキャッシュ可能な最小プレフィックスは 2048 トークンで、Opus 4.8 の 4096 より小さい(=短めのプロンプトでもキャッシュが効きやすい)。

確認方法は簡単で、レスポンスの usage を見るだけ。

print(resp.usage.cache_read_input_tokens)   # キャッシュから読めた分(約0.1倍)
print(resp.usage.cache_creation_input_tokens) # キャッシュに書いた分(約1.25倍)
print(resp.usage.input_tokens)               # 素で課金された分(full)

何度も同じプレフィックスで投げているのに cache_read_input_tokens がずっと 0 なら、どこかで毎回プロンプトが変わってキャッシュが壊れている（システムプロンプトに datetime.now() を埋めてる、JSON のキー順が安定してない、ツール定義が毎回変わってる、など）。長時間 Fable 5 を回すなら、ここが効いてるかどうかで請求が一桁変わりうる。

無料期間中に「自分のタスクで」測るための手順

料金表をいくら睨んでも、自分の使い方での答えは出ない。6月22日までに、いつも投げているタスクで実際に測っておくのがいい。やることは多くない。

自分が普段投げる代表的なタスクを3つくらい選ぶ（例: 機能追加、バグ調査、コードレビュー）。
同じタスクを Fable 5 / Opus 4.8 / Sonnet 4.6 にそれぞれ投げる。
各実行の usage（input / output / cache_read）を記録する。Claude Code なら JSONL のログに残っているので、そこから拾える。
入力tok × 単価 + 出力tok × 単価 で実コストを出す。
金額だけでなく「やり直し回数」と「最終的な品質」も並べて記録する。ここが本丸。Fable が高くても、Opus が2回失敗するタスクを1回で通すなら、トータルでは安い・速い。

表にするとこんな感じで埋まる（数字は各自が埋める欄）。

タスク	モデル	入力tok	出力tok	実コスト	やり直し	品質の手応え
機能追加	Fable 5	—	—	—	—	—
機能追加	Opus 4.8	—	—	—	—	—
バグ調査	Fable 5	—	—	—	—	—
…

これを埋めれば、「自分の場合、どのタスクは Fable に払う価値があって、どれは Opus で十分か」が数字で見える。料金論争に付き合うより、自分のログ1枚のほうがよっぽど判断に効く。

今のところの自分の結論（暫定）

まだ無料期間中なので断定はしないけど、今の手応えでの暫定ルールはこう。

デフォルトは Opus 4.8 / Sonnet 4.6 のまま。 普段使いで Fable に切り替える理由は、今のところ見つかっていない。差が出ないのに高い。
「これは長丁場で、間違えると検証がしんどい」タスクのときだけ Fable 5。 数時間級の自律実行、大きめの移行、深い調査。
急ぎじゃないものは Batch に逃がす。 半額で最上位モデルが使えるなら、待てるものは待つ。
長く走らせるならキャッシュが効いてるか必ず usage で確認。 ここがザルだと請求が一気に膨らむ。

「最強だから常用」は、品質が変わらないのに財布だけ削られる。逆に「高いから一切使わない」も、本当に効くタスクを取り逃がす。境界を自分のログで引くのが、無料期間中にやっておく価値のある唯一の作業だと思う。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up