AIコンテキスト消費で悩んでいる人のための『context-mode』

Posted at 2026-05-28

結論

・Claude Code 使ってるなら、mksglu氏のcontext-mode を今すぐ入れましょう。
・/ctx-statsで、セッション終わりにどのくらい節約されたかを見てニヨニヨしましょう。
・Webサイトの開発では40～50%程のコンテキスト削減が観測されました。

以下はClaude君が書いてくれたので流し見でOK

そもそも「コンテキストが溢れる」problem

Claude Code（に限らず AI コーディングエージェント全般）を長く使ってると、必ずこいつにぶつかります。

Context low · /compact will run soon...

ログを cat したり、git log を流したり、JSON を読んだり、テストを回したり——
ツールの出力 1 バイト残らず会話メモリに積まれていくんですよね。

そして一定量を超えると /compact（自動要約・圧縮）が走る。
要約されること自体は悪くないけど、

要約のたびに細かいニュアンスが落ちる
圧縮処理の分だけ待たされる
そして何より「さっき調べたあれ、もう一回調べ直すか…」が発生する

これ、地味にストレスだし、地味にトークン代がかさむ。

context-mode が何をしてくれるのか

ざっくり言うと、

ツールの生出力を会話に直接流さず、いったんサンドボックスに溜めて全文インデックス化。
必要な部分だけを検索で引っ張ってくる。

という仕組みです。

たとえば 1000 行のログがあっても、会話に積まれるのは「エラー行だけ」「集計した結果だけ」。
生の 1000 行は会話の外（インデックス）に置かれるので、コンテキストを食わない。

しかも溜めたものはセッションをまたいで検索できるので、
--continue や /resume で戻ってきたときに「前回の決定」「前回のエラー」がそのまま引ける。

で、実際どれだけ削れたの？（実測）

ここからが本題。先日、自分のプロジェクトでこんなダッシュボードが出ました。
（プロジェクト名・本番情報などは伏せてます）

このセッション単体の節約

Without context-mode    214 KB  ████████████████████████████████   54.9K tokens
With context-mode       122 KB  ██████████████████░░░░░░░░░░░░░░   31.3K tokens

→ 43% をコンテキストの外に追い出した
→ /compact が走るまで、AI が 2 倍長く走れた

214 KB → 122 KB。 何も意識せず、勝手にこれ。

全体での積み上げ

指標	数値
コンテキスト外に逃がした量（このチャット）	210 KB
キャプチャ数（このチャット）	301 件
全プロジェクト累計	145 KB / 838 captures / 16 projects
浮いたトークン代（Opus 4 換算）	$3.22

※ ドル表記は Opus レート基準の「分かりやすさ用」。
安いモデルなら金額は下がるけど、削減「率」は変わりません。

「1 人で $3.22？しょぼくない？」と思うかもしれませんが、
これを 10 人チームで 1 年回すと ~$5,873/year という試算になります。塵も積もれば。

「キャプチャ」って具体的に何を溜めてるの

このセッションで溜まってた 301 件の内訳がこちら。
単なるログだけじゃなくて、作業の文脈そのものを拾ってるのが分かります。

Files tracked                 99   ████████████████████████████
Working directory             33   █████████░░░░░░░░░░░░░░░░░░░
sandbox                       29   ████████░░░░░░░░░░░░░░░░░░░░
Tasks in progress             24   ███████░░░░░░░░░░░░░░░░░░░░░
External docs indexed         23   ███████░░░░░░░░░░░░░░░░░░░░░
Your messages remembered      19   █████░░░░░░░░░░░░░░░░░░░░░░░
Git operations                15   ████░░░░░░░░░░░░░░░░░░░░░░░░
Errors caught                  8   ██░░░░░░░░░░░░░░░░░░░░░░░░░░
Your decisions                 6   ██░░░░░░░░░░░░░░░░░░░░░░░░░░

ファイル・作業ディレクトリ・タスク・過去の決定・捕まえたエラーまで。
だから「あれ、この前どう決めたっけ？」を AI 側がちゃんと覚えてる。

おまけに「自分の作業の好み」まで学習してくれてました。

11 preferences picked up:
  何を作っているか     7
  どう働くか          2
  長期的な文脈        1
  どこを見ればいいか   1

入れ方

⚠️ 環境によっては /plugin から普通に入れられます。
自分は /plugin が使えない環境だったので、設定 JSON に直書きで導入しました。

普通に使える人は plugin マーケットプレイスから context-mode を追加するだけ。
導入後は 特別な操作は不要で、ツールを使うたびに裏で勝手にインデックスされていきます。

節約量を確認したいときはこれ。

/ctx-stats

冒頭に貼ったあのダッシュボードが出ます。
（/ctx-doctor で診断、/ctx-purge でインデックス全消し、もできます）

使ってみて感じた地味に効くポイント

/compact の発火が明確に減る → 長い調査セッションが途切れにくい
セッション再開が強い → --continue で戻ると前回の文脈がちゃんと残ってる
意識コストがゼロ → 「節約しよう」と頑張らなくていい。入れたら勝手に効く

逆に注意点としては、

ファイル書き込みは通常どおりエディタ側で行う（サンドボックス実行は分析・集計用）
/clear や /compact してもインデックス自体は残る（消したいなら ctx purge）

結論（もう一回）

Claude Code を使ってるなら、context-mode を今すぐ入れましょう。

コンテキストが 実測 43% 削れて、
AI が /compact 前に 2 倍長く走れて、
トークン代まで浮く。

しかも導入後の手間はほぼゼロ。
「コンテキスト溢れてきたな…」のストレスから解放されたい人は、ぜひ入れてみてください。

入れたら /ctx-stats を叩いて、自分の削減量をぜひ晒してみてほしい。たぶん思ったより削れてます。

数値はすべて自分の実環境の /ctx-stats 出力ベース（プロジェクト名・本番情報は伏せています）。
ドル試算は Opus レート基準の参考値です。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up