Claude Code ユーザーの危機
2026年4月、Claude Code Maxプラン($100-200/月)ユーザーが深刻な問題に直面しています:
- 19分で5時間分のトークンを消費するケースが報告
- Anthropicが「予想以上に早くリミットに達している」と公式に認める
- OpenAI Codexが$20/月で無制限を発表 → 流出加速
- OpenClawは346K Starsだが**RCE脆弱性(CVSS 8.8)**が発見
Codexに移行する前に
helix-agents v0.9.0は、Claude Codeに留まりながらトークン消費を60-80%削減するMCPサーバーです。
仕組み
Claude Code (Opus 4.6) — 判断・意思決定
↓ MCPで委譲
helix-agents (ローカル, $0)
├── gemma4:31b — リサーチ、画像解析、ツール実行
├── Qdrant共有記憶 — セッション横断永続メモリ
└── Computer Use — ブラウザ/デスクトップ自動操作
Opus 4.6が「何をするか」を決定し、ルーチンタスク(ファイル読み込み、コード検索、画像解析)をローカルのgemma4:31bに委譲します。
gemma4: 昨日リリース、本日デフォルト採用
Google DeepMindが4月2日にgemma4をリリース。helix-agentsはDay 1でデフォルトモデルに採用 — MCPツールとして最速の対応です:
- AIME 89.2% — クローズドモデルに匹敵する数学推論
- LiveCodeBench 80% — 強力なコード生成能力
- 256Kコンテキスト — 大規模コードベースに対応
- Vision + Function Calling — マルチモーダルエージェント
- Apache 2.0 — 完全オープン、制限なし
- 20GB VRAMで動作 — RTX 4070以上で利用可能
Windows Computer Use
Claude CodeのComputer UseはmacOS限定です。helix-agentsはPlaywright + helix-pilot連携により、WindowsでComputer Useを提供する唯一のMCPツールです。
なぜCodexに移行しないのか?
| Claude + helix-agents | Codex | OpenClaw | |
|---|---|---|---|
| コスト | $100 + $0 | $20 | 無料 |
| 品質 | Opus 4.6の判断力 | GPT-5.3 | 不安定 |
| セキュリティ | 完全ローカル | OpenAIクラウド | CVE-2026-25253 |
| トークン | 実質5-10倍 | 無制限 | N/A |
| Computer Use | Windows + macOS | なし | なし |
Claudeの品質を捨てなくても、コスト問題は解決できます。
v0.9.0の新機能
- gemma4:31bデフォルト — Vision + 推論 + Function Calling対応
- Fork-styleコンテキスト継承 — Claude Code内部アーキテクチャを解析して実装
- Computer Use — Playwright/デスクトップGUI自動操作(Windows対応!)
- Qdrant共有記憶 — セッション間の永続ベクトルメモリ
- 280テスト — プロダクション品質
- OOM自動フォールバック — VRAM不足時に小モデルへ自動切替
- JSONLトレース — 完全な可観測性
実際の削減効果
| タスク | Opusトークン | helix-agents使用 | 削減率 |
|---|---|---|---|
| 50ファイル探索 | 100K | 2K | 98% |
| 500行コードレビュー | 30K | 1K | 97% |
| マルチステップ調査 | 200K | 3K | 98% |
クイックスタート(2分)
git clone https://github.com/tsunamayo7/helix-agent.git
cd helix-agent && uv sync
ollama pull gemma4:31b
uv run python server.py
Claude Code設定に追加:
{
"mcpServers": {
"helix-agents": {
"command": "uv",
"args": ["run", "--directory", "/path/to/helix-agent", "python", "server.py"]
}
}
}
Anthropicへ
これはAnti-Claudeツールではなく、ユーザー維持ツールです。Codexに流れるユーザーを引き留め、Maxプランの継続利用を促進します。
GitHub: tsunamayo7/helix-agent
2026年トークン危機の中で開発。最高のコードアシスタントにタイマーは要らない。
マルチプロバイダーアーキテクチャ
helix-agentsの真の強みはgemma4対応だけではありません。3つのプロバイダーを1つのMCPで統一的に扱えます:
| プロバイダー | 用途 | 例 |
|---|---|---|
ollama |
ローカルLLM ($0) | gemma4:31b, qwen3.5:122b, deckard-uncensored |
codex |
リポジトリ規模のコーディング | Codex CLI統合、サンドボックス付き |
openai-compatible |
ホスト型API | GPT, Mistral, Groq等 |
全プロバイダーで同じ11ツール(think, agent_task, fork_task, computer_use等)が使える統一インターフェース:
providers(action="use", provider="codex") # Codexに切替
providers(action="use", provider="ollama") # ローカルに戻す
providers(action="use_auto") # 自動選択
使い分け:
- ルーチンタスク → Ollama ($0)
- リポジトリ規模のコーディング → Codex
- 高品質が必要だがOpusを使いたくない → OpenAI互換
Claude Code + helix-agents = 最適なモデルを最適なコストで使い分ける統合プラットフォーム
v0.4.0から実装済みで、v0.9.0まで後方互換100%を維持しています。