結論
・Claude Code 使ってるなら、mksglu氏のcontext-mode を今すぐ入れましょう。
・/ctx-statsで、セッション終わりにどのくらい節約されたかを見てニヨニヨしましょう。
・Webサイトの開発では40~50%程のコンテキスト削減が観測されました。
以下はClaude君が書いてくれたので流し見でOK
そもそも「コンテキストが溢れる」problem
Claude Code(に限らず AI コーディングエージェント全般)を長く使ってると、必ずこいつにぶつかります。
Context low · /compact will run soon...
ログを cat したり、git log を流したり、JSON を読んだり、テストを回したり——
ツールの出力 1 バイト残らず会話メモリに積まれていくんですよね。
そして一定量を超えると /compact(自動要約・圧縮)が走る。
要約されること自体は悪くないけど、
- 要約のたびに細かいニュアンスが落ちる
- 圧縮処理の分だけ待たされる
- そして何より「さっき調べたあれ、もう一回調べ直すか…」が発生する
これ、地味にストレスだし、地味にトークン代がかさむ。
context-mode が何をしてくれるのか
ざっくり言うと、
ツールの生出力を会話に直接流さず、いったんサンドボックスに溜めて全文インデックス化。
必要な部分だけを検索で引っ張ってくる。
という仕組みです。
たとえば 1000 行のログがあっても、会話に積まれるのは「エラー行だけ」「集計した結果だけ」。
生の 1000 行は会話の外(インデックス)に置かれるので、コンテキストを食わない。
しかも溜めたものはセッションをまたいで検索できるので、
--continue や /resume で戻ってきたときに「前回の決定」「前回のエラー」がそのまま引ける。
で、実際どれだけ削れたの?(実測)
ここからが本題。先日、自分のプロジェクトでこんなダッシュボードが出ました。
(プロジェクト名・本番情報などは伏せてます)
このセッション単体の節約
Without context-mode 214 KB ████████████████████████████████ 54.9K tokens
With context-mode 122 KB ██████████████████░░░░░░░░░░░░░░ 31.3K tokens
→ 43% をコンテキストの外に追い出した
→ /compact が走るまで、AI が 2 倍長く走れた
214 KB → 122 KB。 何も意識せず、勝手にこれ。
全体での積み上げ
| 指標 | 数値 |
|---|---|
| コンテキスト外に逃がした量(このチャット) | 210 KB |
| キャプチャ数(このチャット) | 301 件 |
| 全プロジェクト累計 | 145 KB / 838 captures / 16 projects |
| 浮いたトークン代(Opus 4 換算) | $3.22 |
※ ドル表記は Opus レート基準の「分かりやすさ用」。
安いモデルなら金額は下がるけど、削減「率」は変わりません。
「1 人で $3.22? しょぼくない?」と思うかもしれませんが、
これを 10 人チームで 1 年回すと ~$5,873/year という試算になります。塵も積もれば。
「キャプチャ」って具体的に何を溜めてるの
このセッションで溜まってた 301 件の内訳がこちら。
単なるログだけじゃなくて、作業の文脈そのものを拾ってるのが分かります。
Files tracked 99 ████████████████████████████
Working directory 33 █████████░░░░░░░░░░░░░░░░░░░
sandbox 29 ████████░░░░░░░░░░░░░░░░░░░░
Tasks in progress 24 ███████░░░░░░░░░░░░░░░░░░░░░
External docs indexed 23 ███████░░░░░░░░░░░░░░░░░░░░░
Your messages remembered 19 █████░░░░░░░░░░░░░░░░░░░░░░░
Git operations 15 ████░░░░░░░░░░░░░░░░░░░░░░░░
Errors caught 8 ██░░░░░░░░░░░░░░░░░░░░░░░░░░
Your decisions 6 ██░░░░░░░░░░░░░░░░░░░░░░░░░░
ファイル・作業ディレクトリ・タスク・過去の決定・捕まえたエラーまで。
だから「あれ、この前どう決めたっけ?」を AI 側がちゃんと覚えてる。
おまけに「自分の作業の好み」まで学習してくれてました。
11 preferences picked up:
何を作っているか 7
どう働くか 2
長期的な文脈 1
どこを見ればいいか 1
入れ方
⚠️ 環境によっては
/pluginから普通に入れられます。
自分は/pluginが使えない環境だったので、設定 JSON に直書きで導入しました。
普通に使える人は plugin マーケットプレイスから context-mode を追加するだけ。
導入後は 特別な操作は不要で、ツールを使うたびに裏で勝手にインデックスされていきます。
節約量を確認したいときはこれ。
/ctx-stats
冒頭に貼ったあのダッシュボードが出ます。
(/ctx-doctor で診断、/ctx-purge でインデックス全消し、もできます)
使ってみて感じた地味に効くポイント
-
/compactの発火が明確に減る → 長い調査セッションが途切れにくい -
セッション再開が強い →
--continueで戻ると前回の文脈がちゃんと残ってる - 意識コストがゼロ → 「節約しよう」と頑張らなくていい。入れたら勝手に効く
逆に注意点としては、
- ファイル書き込みは通常どおりエディタ側で行う(サンドボックス実行は分析・集計用)
-
/clearや/compactしてもインデックス自体は残る(消したいならctx purge)
結論(もう一回)
Claude Code を使ってるなら、context-mode を今すぐ入れましょう。
- コンテキストが 実測 43% 削れて、
- AI が
/compact前に 2 倍長く走れて、 - トークン代まで浮く。
しかも導入後の手間はほぼゼロ。
「コンテキスト溢れてきたな…」のストレスから解放されたい人は、ぜひ入れてみてください。
入れたら /ctx-stats を叩いて、自分の削減量をぜひ晒してみてほしい。たぶん思ったより削れてます。
数値はすべて自分の実環境の
/ctx-stats出力ベース(プロジェクト名・本番情報は伏せています)。
ドル試算は Opus レート基準の参考値です。