0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Claude Codeのトークン危機を解決 — gemma4 + ローカルLLMで80%削減、Codex移行は不要

0
Last updated at Posted at 2026-04-03

Claude Code ユーザーの危機

2026年4月、Claude Code Maxプラン($100-200/月)ユーザーが深刻な問題に直面しています:

  • 19分で5時間分のトークンを消費するケースが報告
  • Anthropicが「予想以上に早くリミットに達している」と公式に認める
  • OpenAI Codexが$20/月で無制限を発表 → 流出加速
  • OpenClawは346K Starsだが**RCE脆弱性(CVSS 8.8)**が発見

Codexに移行する前に

helix-agents v0.9.0は、Claude Codeに留まりながらトークン消費を60-80%削減するMCPサーバーです。

仕組み

Claude Code (Opus 4.6) — 判断・意思決定
  ↓ MCPで委譲
helix-agents (ローカル, $0)
  ├── gemma4:31b — リサーチ、画像解析、ツール実行
  ├── Qdrant共有記憶 — セッション横断永続メモリ
  └── Computer Use — ブラウザ/デスクトップ自動操作

Opus 4.6が「何をするか」を決定し、ルーチンタスク(ファイル読み込み、コード検索、画像解析)をローカルのgemma4:31bに委譲します。

gemma4: 昨日リリース、本日デフォルト採用

Google DeepMindが4月2日にgemma4をリリース。helix-agentsはDay 1でデフォルトモデルに採用 — MCPツールとして最速の対応です:

  • AIME 89.2% — クローズドモデルに匹敵する数学推論
  • LiveCodeBench 80% — 強力なコード生成能力
  • 256Kコンテキスト — 大規模コードベースに対応
  • Vision + Function Calling — マルチモーダルエージェント
  • Apache 2.0 — 完全オープン、制限なし
  • 20GB VRAMで動作 — RTX 4070以上で利用可能

Windows Computer Use

Claude CodeのComputer UseはmacOS限定です。helix-agentsはPlaywright + helix-pilot連携により、WindowsでComputer Useを提供する唯一のMCPツールです。

なぜCodexに移行しないのか?

Claude + helix-agents Codex OpenClaw
コスト $100 + $0 $20 無料
品質 Opus 4.6の判断力 GPT-5.3 不安定
セキュリティ 完全ローカル OpenAIクラウド CVE-2026-25253
トークン 実質5-10倍 無制限 N/A
Computer Use Windows + macOS なし なし

Claudeの品質を捨てなくても、コスト問題は解決できます。

v0.9.0の新機能

  • gemma4:31bデフォルト — Vision + 推論 + Function Calling対応
  • Fork-styleコンテキスト継承 — Claude Code内部アーキテクチャを解析して実装
  • Computer Use — Playwright/デスクトップGUI自動操作(Windows対応!)
  • Qdrant共有記憶 — セッション間の永続ベクトルメモリ
  • 280テスト — プロダクション品質
  • OOM自動フォールバック — VRAM不足時に小モデルへ自動切替
  • JSONLトレース — 完全な可観測性

実際の削減効果

タスク Opusトークン helix-agents使用 削減率
50ファイル探索 100K 2K 98%
500行コードレビュー 30K 1K 97%
マルチステップ調査 200K 3K 98%

クイックスタート(2分)

git clone https://github.com/tsunamayo7/helix-agent.git
cd helix-agent && uv sync
ollama pull gemma4:31b
uv run python server.py

Claude Code設定に追加:

{
  "mcpServers": {
    "helix-agents": {
      "command": "uv",
      "args": ["run", "--directory", "/path/to/helix-agent", "python", "server.py"]
    }
  }
}

Anthropicへ

これはAnti-Claudeツールではなく、ユーザー維持ツールです。Codexに流れるユーザーを引き留め、Maxプランの継続利用を促進します。

GitHub: tsunamayo7/helix-agent


2026年トークン危機の中で開発。最高のコードアシスタントにタイマーは要らない。

マルチプロバイダーアーキテクチャ

helix-agentsの真の強みはgemma4対応だけではありません。3つのプロバイダーを1つのMCPで統一的に扱えます:

プロバイダー 用途
ollama ローカルLLM ($0) gemma4:31b, qwen3.5:122b, deckard-uncensored
codex リポジトリ規模のコーディング Codex CLI統合、サンドボックス付き
openai-compatible ホスト型API GPT, Mistral, Groq等

全プロバイダーで同じ11ツール(think, agent_task, fork_task, computer_use等)が使える統一インターフェース:

providers(action="use", provider="codex")     # Codexに切替
providers(action="use", provider="ollama")    # ローカルに戻す
providers(action="use_auto")                   # 自動選択

使い分け:

  • ルーチンタスク → Ollama ($0)
  • リポジトリ規模のコーディング → Codex
  • 高品質が必要だがOpusを使いたくない → OpenAI互換

Claude Code + helix-agents = 最適なモデルを最適なコストで使い分ける統合プラットフォーム

v0.4.0から実装済みで、v0.9.0まで後方互換100%を維持しています。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?