【徹底解説】OpenSquilla — トークン効率を極めるAIエージェントフレームワーク

Posted at 2026-06-08

はじめに

AIエージェントの活用が広がる中、「性能は欲しいが、コストが高すぎる」という課題に直面している方は多いのではないでしょうか。すべてのリクエストを最高性能のモデル（Claude Opus、GPT-4o など）に投げれば確かに賢いですが、毎月の請求書を見て青ざめた経験はありませんか？

OpenSquilla は、まさにこの課題を解決するために生まれたオープンソースの AI エージェントフレームワークです。

"Same budget, more capability, better results."
（同じ予算で、より高い能力、より良い結果を。）

本記事では、OpenSquilla の設計思想からアーキテクチャ、主要機能、インストール方法まで徹底的に解説します。

OpenSquilla とは

OpenSquilla は、トークン効率に特化したマイクロカーネル型 AI エージェントです。2026 年 5 月にオープンソース（Apache 2.0 ライセンス）として公開され、わずか 3 週間で GitHub スター 3,000 超 を獲得し、急速に注目を集めています。

基本情報

項目	内容
リポジトリ	opensquilla/opensquilla
最新バージョン	v0.3.1（2026 年 6 月時点）
ライセンス	Apache License 2.0
言語	Python 3.12+
パッケージマネージャー	uv（推奨）
対応 OS	Windows / macOS / Linux
公式サイト	opensquilla.ai

一言で言うと

「タクシー配車」のように、簡単な質問はバス（安価モデル）で、複雑な質問だけハイヤー（高性能モデル）で処理する — この自動判断をオンデバイスの ML モデルが行うことで、トークンコストを 60〜80% 削減しつつ、最高級モデルと同等の品質を維持するフレームワークです。

マイクロカーネル・アーキテクチャ

OpenSquilla の設計思想は、OS のマイクロカーネルからインスピレーションを受けています。

設計の核心

コアエンジン（約 100 行）= オーケストレーション + 状態管理
↓
それ以外のすべて = 「ユーザー空間」のプラグイン

コアが極めてコンパクトであるため、以下の利点が生まれます：

プラグインがクラッシュしてもコアは無事
コアをアップグレードしてもプラグインは壊れない
LLM プロバイダの切り替え → Protocol を実装するだけ
新しいツールの追加 → コード 5 行で完了

アーキテクチャ図

┌──────────────────────────────────────────────────────┐
│              OpenSquilla Core Engine                 │
│   コンパクトなパイプラインオーケストレーター             │
│   ステートマシン · 完全非同期 · エラー時自動ロールバック │
├──────────┬──────────┬──────────┬─────────────────────┤
│ ⚙️      │ 🤖       │ 🌐       │ 🧠                 │
│ engine/  │ provider/│ gateway/ │ memory/             │
│ 状態機械 │ マルチLLM │ ASGI RPC │ 多層記憶             │
├──────────┼──────────┼──────────┼─────────────────────┤
│ 📡       │ 🔧      │ 🛡️       │ ⏰                 │
│ channels/│ tools/   │ sandbox/ │ scheduler/          │
│ チャネル  │ MCP-First│ サンド   │ タスク               │
│ アダプタ  │ ツール   │ ボックス  │ スケジューラ         │
├──────────┴──────────┴──────────┴─────────────────────┤
│ 🧩 skills/ スキルプラグイン                           │
│ 🎭 identity/ アイデンティティ & プロンプト             │
└──────────────────────────────────────────────────────┘

共有ターンループ

OpenSquilla の大きな特徴は、すべてのエントリポイント（Web UI、CLI、チャットチャネル）が同一のターンループ（TurnRunner）を経由することです。

これにより：

ツール実行、リトライ、判断ログの動作がどの環境でも完全に同一
チャネルごとの個別実装が不要
テストとデバッグが一箇所で完結

SquillaRouter — ML ベースのインテリジェントルーティング

OpenSquilla の技術的な中核であり、最大の差別化要因が SquillaRouter です。

仕組み

ユーザーのプロンプト
       ↓
┌──────────────────────────┐
│    SquillaRouter         │
│  （LightGBM + ONNX）     │
│  ─ オンデバイスで動作 ─   │
│                         │
│  分析項目：              │
│  ・メッセージの長さ       │
│  ・言語                  │
│  ・コードの有無           │
│  ・キーワードパターン      │
│  ・意味的埋め込みベクトル  │
└──────────┬───────────────┘
           ↓
  4 段階のモデルティアに振り分け

4 段階ルーティングティア

ティア	用途	モデル例	コスト
T0（Nano/Flash）	挨拶、簡単な質問、定型応答	DeepSeek 4 Flash 等	💰 最安
T1（Mid-tier）	一般的な質問、要約、翻訳	GLM 5.1 等	💰💰
T2（Frontier）	複雑な推論、コード生成	Claude Opus 4.7 等	💰💰💰
T3（Extended Context）	超長文処理、深い分析	拡張コンテキストモデル	💰💰💰💰

コスト削減の多重戦略

SquillaRouter 単体ではなく、複数の戦略が連携してトークンコストを最適化します：

スマートルーティング — タスクの複雑度に応じてモデルを自動選択
思考深度の階層化 — 簡単な質問では推論課金を OFF、複雑な質問のみ deep thinking を有効化
アダプティブ Prompt — タスク難易度に応じてシステムプロンプトの記述量をスケール
スキルのオンデマンド読込 — 現在のタスクに必要な能力だけをロード
Prompt キャッシュ分離 — セッション間でのコンテキスト再利用

💡 ポイント: ルーティングの判断はすべてオンデバイスで完了するため、プロンプトがルーティング判定のために外部 API に送信されることはありません（プライバシー保護）。

4 層認知メモリシステム

OpenSquilla は人間の認知システムを模倣した 4 層のメモリアーキテクチャを搭載しています。

4 層構造

┌─────────────────────────────────────────┐
│   ワーキングメモリ（Working Memory）      │  ← 現在のタスクの文脈
├─────────────────────────────────────────┤
│   エピソード記憶（Episodic Memory）       │  ← 経験と因果関係
├─────────────────────────────────────────┤
│   意味記憶（Semantic Memory）            │  ← 事実とルール
├─────────────────────────────────────────┤
│   生記憶（Raw Memory）                   │  ← 監査・再学習基盤
└─────────────────────────────────────────┘

メモリ層	説明	人間で例えると
ワーキングメモリ	現在のタスクに必要な情報をリアルタイムで保持	作業中のデスク
エピソード記憶	過去の経験、因果関係、会話の流れ	「あの時こうしたらうまくいった」
意味記憶	事実、ルール、構造化された知識	教科書的な知識
生記憶	すべてのやり取りの原データ	日記・ログ

高度なメモリ機能

🔥 ホットメモリの浮上（Hot Memory Promotion）

頻繁に呼び出される記憶は自動的に「浮上」します。よく使うほどアクセスしやすくなり、冷えた記憶は自然に沈みます。

⏰ 時間減衰メカニズム（Temporal Decay）

日付付きの記憶は指数関数的に減衰しますが、「永続（evergreen）」とマークされた中核知識は影響を受けません。

💤 Memory Dream 統合

24 時間ごとに AI が「夢を見る」 — 散らばった記憶を構造化された知識に整理します。人間の睡眠が記憶を定着させるのと同じ原理です。

🔍 ハイブリッド検索

ベクトル意味検索（セマンティック）+ フルテキストキーワード検索 を並列実行
内蔵 ONNX 推論は CPU で動作し、埋め込みデータが端末から外に出ない
オプションで OpenAI / Ollama の埋め込みに切り替え可能

データの保存形式

記憶はキュレーションされた MEMORY.md と日付付きの Markdown ノートとして保存され、SQLite の全文検索と sqlite-vec によるセマンティック検索で検索されます。

MetaSkills プロトコル

v0.3.0 で導入された MetaSkills は、繰り返し使うマルチステップの作業を再利用可能なワークフローに変換する仕組みです。

概要

繰り返しのマルチステップ作業
       ↓
MetaSkills プロトコルで解析
       ↓
再利用可能・監査可能なワークフローに変換
       ↓
次回から自動的に適用

主要機能

機能	説明
自己組織化	マルチステップの作業を再利用可能なワークフローに自動構築
meta-skill-creator	繰り返し発生するスキルの協調パターンを分析し、新しい MetaSkill を提案。エージェントが自律的に自身の能力カタログを拡張
N+ コミュニティスキル	コミュニティカタログからスキルを自律的に発見・ランク付け・呼び出し
10+ バンドル MetaSkills	リサーチ→レポート、論文執筆、就活準備、プロジェクト計画、ショートドラマ制作など
リプレイ & Dream モード	全ワークフローの実行が監査・リプレイ可能。アイドル時に使用パターンを蒸留して新しい MetaSkill 候補を生成

バンドルスキル（15 種以上）

OpenSquilla には以下のスキルが標準搭載されています：

コーディング支援
GitHub 操作
cron ジョブ管理
pptx / docx / xlsx / pdf 生成
要約
tmux セッション管理
天気情報
Web 検索
画像生成
音声ワークフロー
その他

スキルは必要な時だけオンデマンドでロードされるため、不要なスキルがコンテキストを消費することはありません。

セキュリティサンドボックス

AIエージェントに自律的にコードを実行させる以上、セキュリティは最重要課題です。OpenSquilla は3 段階のポリシーとシステムコールレベルの分離でこの課題に対処しています。

3 段階セキュリティポリシー

ポリシー	動作	ユースケース
Standard	直接実行	信頼できる環境、ローカル開発
Strict	サンドボックス内実行 + 承認要求	本番環境、共有サーバー
Locked	人間によるレビュー必須	コンプライアンス要件が厳格な環境

サンドボックス技術

OS	分離技術	状態
Linux	Bubblewrap（bwrap）	✅ 完全動作
macOS	Seatbelt	⚠️ プロファイル生成のみ（実行は今後）
Windows	—	⚠️ 未対応（今後対応予定）

Docker 不要！ — システムコールレベルで CPU / メモリ / 時間を分離するため、Docker コンテナなしで安全な実行環境を構築できます。サーバーレス環境にも適合。

その他のセキュリティ機能

拒否台帳（Denial Ledger） — 3 回連続で拒否された場合、AI は自動停止。ブルートフォースでセキュリティを迂回する試行を防止
古い出力の参照防止 — 拒否された操作の結果は即座にキャッシュから削除。「前回の結果を読む」サイドチャネルを封鎖
Prompt Injection 防御 — すべてのスキルメタデータとツール結果を XML エスケープ

マルチチャネル対応

一度エージェントを設定すれば、10 以上のチャネルからシームレスにアクセスできます。

             ┌── Terminal（CLI）
             ├── Web UI
             ├── Slack
             ├── Discord
             ├── Telegram
             ├── Microsoft Teams
OpenSquilla ─┼── Matrix
             ├── Lark（飛書）
             ├── DingTalk（釘釘）
             ├── WeCom（企業微信）
             └── QQ

すべてのチャネルが同一の TurnRunner を経由するため、チャネルごとの動作の差異はありません。チャネルの追加は opensquilla configure channels で対話的に設定可能です。

💡 補足: 一部のチャネル（Slack、Discord 等）にはプラットフォーム固有の API トークンが必要です。Matrix の E2E 暗号化には matrix-e2e エクストラのインストールが必要です。

20+ LLM プロバイダー対応

OpenSquilla のプラグイン可能なプロバイダー層は、コードや設定スキーマを変更することなく、20 以上の LLM バックエンドに接続できます。

対応プロバイダー一覧

カテゴリ	プロバイダー
アグリゲーター	OpenRouter
メジャープロバイダー	OpenAI, Anthropic, Google Gemini, DeepSeek
中国系プロバイダー	DashScope/Qwen, Moonshot, Zhipu, SiliconFlow
ローカル / セルフホスト	Ollama, vLLM, LM Studio
その他クラウド	Groq, Mistral, その他

プロバイダー設定

# プロバイダーの変更は 1 コマンド
opensquilla configure provider --provider openai --model gpt-4o --api-key-env OPENAI_API_KEY

# OpenRouter 経由で複数モデルにアクセス
opensquilla configure provider --provider openrouter --api-key-env OPENROUTER_API_KEY

プライマリ + フォールバック の選択も可能で、プライマリプロバイダーが利用不可の場合に自動的にフォールバックします。

ベンチマーク結果 — 9 倍のコスト効率

OpenSquilla の真価を最もよく示しているのが、PinchBench 1.2.1（25 タスク） でのベンチマーク結果です。

比較結果

エージェント	ベースモデル	平均スコア	総コスト	コスト効率
OpenSquilla	Router（Opus 4.7 / GLM 5.1 / DS4 Flash）	0.9251	$0.688	🏆 9 倍安い
OpenClaw	Claude Opus 4.7（直接利用）	0.9255	$6.233	基準

何が起きているか

品質差:  0.9255 - 0.9251 = 0.0004 （わずか 0.04%）
コスト差: $6.233 / $0.688 = 約 9.06 倍

→ ほぼ同じ品質で、コストは 9 分の 1

さらに、ローカルベンチマークでは 3 つのプロンプトが合計 279,762 トークンを処理し、そのうち約 222,848 トークン（約 80%）がセッション間のコンテキスト再利用でキャッシュから提供されました。総セッションコストはわずか $0.0094 でした。

🎯 結論: 「高いモデル = 高品質」ではなく、「適切なモデル × 適切なタスク = 最高のコストパフォーマンス」 という新しいパラダイムを OpenSquilla は証明しています。

他フレームワークとの比較

OpenSquilla、OpenClaw、Hermes Agent の 3 つのフレームワークを項目別に比較します。

比較項目	OpenSquilla	OpenClaw	Hermes Agent
🏗️ アーキテクチャ	✅ マイクロカーネル 5 層分離。コア約 100 行。全能力がプラグイン化。エラー時自動スキップ + ロールバック	⚠️ 成熟したプラグインエコシステムだが層が多い	❌ 巨大なモノリシック同期メインループ。全ロジック密結合
💰 コスト最適化	✅ ML ルーティング + 思考深度階層 + キャッシュ分離 + オンデマンドスキル → 60-80% 削減	⚠️ メイン + フォールバック固定。内容に応じた自動選択なし	⚠️ キーワード + 文字数の粗いヒューリスティック
🪄 MetaSkills	✅ コンポーザブルワークフロー + 自己進化 + コミュニティスキル自動検索	⚠️ プロンプト駆動のスキルチェーン。メタプロトコル層なし	❌ 再利用可能なワークフロー抽象化なし
💾 記憶システム	✅ ベクトル + キーワード + 重複排除 + 時間減衰 + ホットメモリ浮上 + Memory Dream	⚠️ 減衰 / 浮上あるが 4 層構造と Dream 統合なし	⚠️ キーワード検索のみ。ベクトル意味検索なし
🛡️ サンドボックス	✅ Docker 不要。syscall レベル分離 + 3 段階ネットワーク制御	⚠️ Docker 任意。OpenShell で軽量化だが syscall 分離には及ばない	✅ 危険コマンド承認 + 6 種類の実行環境
💰 コスト追跡	✅ 呼び出しごとの実支払額 + 超過時自動スロットル	✅ 内蔵価格表。セッションメタデータに記録	✅ 入出力 / キャッシュ / 推論を 5 項目で個別計測
📊 可観測性	✅ ハッシュ化決定ログ（コンプラ対応）。全段計装	✅ OpenTelemetry ネイティブ対応	⚠️ SQLite + 呼び出しカウンタの基礎レベル
🧩 拡張開発	✅ 数行の duck-typed クラスで OK。SDK / manifest 不要	⚠️ plugin-sdk + manifest 必要	⚠️ import 時のグローバル登録（暗黙の副作用）

インストールガイド

OpenSquilla は 4 つのインストールパスを提供しています。ユースケースに応じて選択してください。

インストールパスの選び方

パス	対象	Git 必要？	Python 必要？
Windows ポータブル	Windows ユーザー	❌	❌（同梱）
Quick terminal install ⭐推奨	全 OS のエンドユーザー	❌	❌（uv が管理）
Install from source	main ブランチを追従	✅ + Git LFS	uv 推奨
Develop from source	コントリビューター	✅ + Git LFS	uv 必須

パス 1: Windows ポータブル（最速）

Python のインストール不要。ZIP を展開してダブルクリックするだけ。

1. ポータブル ZIP をダウンロード:
   https://github.com/opensquilla/opensquilla/releases/latest/download/OpenSquilla-windows-x64-portable.zip

2. 書き込み可能なフォルダ（ダウンロード、ドキュメント等）に展開

3. 「Start OpenSquilla.cmd」を右クリック → 「管理者として実行」

4. 初回セットアップを完了後、ブラウザで http://127.0.0.1:18791/control/ にアクセス

⚠️ 注意: プレビュービルドは未署名です。SmartScreen が表示されたら「詳細情報 → 実行」を選択してください。

パス 2: Quick terminal install（⭐ 推奨）

Windows、macOS、Linux 共通。uv が Python を自動管理します。

Step 1: uv をインストール

# Linux / macOS
curl -LsSf https://astral.sh/uv/install.sh | sh
. "$HOME/.local/bin/env"

# Windows PowerShell
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
$env:Path = "$env:USERPROFILE\.local\bin;" + $env:Path

Step 2: OpenSquilla をインストール

uv tool install --python 3.12 \
  "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

Step 3: 設定 & 起動

# 対話式ウィザード
opensquilla onboard

# Gateway 起動
opensquilla gateway run

パス 3: ソースからインストール

# Git LFS のセットアップ & クローン
git lfs install
git clone https://github.com/opensquilla/opensquilla.git
cd opensquilla
git lfs pull --include="src/opensquilla/squilla_router/models/**"

# インストーラー実行
# macOS / Linux
bash scripts/install_source.sh

# Windows PowerShell
powershell -ExecutionPolicy Bypass -File ./scripts/install_source.ps1

パス 4: 開発者向け（Develop from source）

ソースコードの変更・テスト・デバッグを行う場合に使用。

# ローカル .venv を作成
uv sync --extra recommended --extra dev

# 動作確認
uv run opensquilla --help

# 追加エクストラ（Matrix 等）の導入
uv sync --extra recommended --extra dev --extra matrix

⚠️ 開発モードではすべてのコマンドに uv run プレフィックスが必要です。

設定と起動

初回セットアップ（onboard）

# 完全な対話式ウィザード
opensquilla onboard

# 冪等モード（スクリプトや再インストールに安全）
opensquilla onboard --if-needed

# プロバイダーのみの最小セットアップ
opensquilla onboard --minimal

# 設定状態の確認
opensquilla onboard status

非対話モード（CI / SSH 環境向け）

# Linux / macOS
export OPENROUTER_API_KEY="sk-..."
opensquilla onboard --provider openrouter --api-key-env OPENROUTER_API_KEY

# Windows PowerShell
$env:OPENROUTER_API_KEY="sk-..."
opensquilla onboard --provider openrouter --api-key-env OPENROUTER_API_KEY

セクション別再設定

opensquilla configure provider --provider openai --model gpt-4o --api-key-env OPENAI_API_KEY
opensquilla configure router --router recommended
opensquilla configure search --search-provider brave --api-key-env BRAVE_SEARCH_API_KEY
opensquilla configure channels

Gateway の起動と管理

# フォアグラウンド起動
opensquilla gateway run

# バックグラウンド起動
opensquilla gateway start --json

# ヘルスチェック
opensquilla doctor
opensquilla doctor --json

# インタラクティブ REPL
opensquilla chat

# ワンショット実行（自動化向け）
opensquilla agent -m "your prompt"

設定ファイルの優先順位

1. OPENSQUILLA_GATEWAY_CONFIG_PATH（環境変数）
2. ./opensquilla.toml（カレントディレクトリ）
3. ~/.opensquilla/config.toml（ホームディレクトリ）
4. 組み込みデフォルト値

他エージェントからの移行

OpenClaw や Hermes Agent からの移行もサポートされています：

# ドライラン（変更なし、レポートの確認のみ）
opensquilla migrate openclaw --json

# 適用
opensquilla migrate openclaw --apply

# 複数ソースからの移行
opensquilla migrate --source openclaw,hermes --apply

ユースケース

🏢 オンプレミスデータ分析

厳格なコンプライアンス要件を持つ組織向け。ローカル埋め込みと ML ルーティングにより、機密データをローカルネットワーク外に出すことなく、高性能な検索と分析が可能。

📋 自動プロジェクトガバナンス

cron ジョブを設定して MetaSkill をトリガーし、Git ログや Slack 更新を監視。差分の取得、進捗の要約、日次ブリーフの MS Teams チャネルへの配信を自動化。

💸 予算制約下でのAIエージェント運用

スタートアップや個人開発者が、限られた予算で最大の成果を得たい場合。スマートルーティングにより、同じ予算で 9 倍のタスクを処理。

🧠 長期プロジェクトでの文脈維持

4 層メモリと Memory Dream により、長期間にわたるプロジェクトでもコンテキストを蓄積・整理。毎回ゼロから説明する必要がなくなります。

🤖 マルチチャネル AI アシスタント

1 つのエージェントを設定するだけで、Slack、Discord、Teams、Web UI、CLI から同時にアクセス可能。チーム全体で共有できる AI アシスタントを構築。

まとめ

OpenSquilla は、AI エージェント開発におけるコスト・品質・セキュリティのトリレンマに対する一つの解答です。

OpenSquilla の 5 つの強み

#	強み	詳細
1	💰 圧倒的コスト効率	ML ルーティングで 60-80% のトークンコスト削減。9 倍安いのに品質はほぼ同じ
2	🧠 人間らしい記憶	4 層認知メモリ + Memory Dream で使うほど賢くなるエージェント
3	🛡️ 本格セキュリティ	syscall レベルのサンドボックス。Docker 不要
4	🔌 圧倒的な拡張性	20+ LLM プロバイダー、10+ チャネル、プラグイン 5 行で作成可能
5	🪄 自己進化する能力	MetaSkills プロトコルでワークフローを自動生成し、能力カタログを自律拡張

始め方（最短 3 ステップ）

# 1. uv をインストール
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. OpenSquilla をインストール
uv tool install --python 3.12 \
  "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

# 3. セットアップ & 起動
opensquilla onboard
opensquilla gateway run

AI エージェントの世界は急速に進化しており、「すべてを最強モデルに投げる」時代は終わりつつあります。OpenSquilla が提示する**「適切なモデルを適切なタスクに」**というパラダイムは、コスト意識の高い開発者やチームにとって非常に魅力的な選択肢です。

ぜひ試してみてください！

参考リンク

📦 GitHub: opensquilla/opensquilla
🌐 公式サイト: opensquilla.ai
📝 CHANGELOG: CHANGELOG.md
📖 ドキュメント: docs/
🛠️ MetaSkill ガイド: META_SKILL_GUIDE.md

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up