2025年11月にGitHubに登場し、わずか3ヶ月で23万スターを突破したOSSがあります。
皆さん最近よく耳にするOpenClawです。
「自分のデバイスで動く、パーソナルAIアシスタント」という触れ込みですが、単なるチャットボットではありません。Telegram、Discord、Slack、WhatsApp、Signal、iMessage――26以上のメッセージングチャネルを統合し、iOS/macOS/Androidのネイティブアプリまで備えた本格的なAIプラットフォームです。
ただ、OpenClawの本当の凄さは、目に見えない部分にあります。
この記事では、OpenClawという「表舞台」と、それを支える「縁の下の立役者」の両方を、初心者にもわかるように段階的に解き明かしていきます。読み進めるほどに、このプロジェクトの深さが見えてくるはずです。
OpenClawとは何か
一言でいえば、セルフホスト型のパーソナルAIアシスタントです。
「セルフホスト」とは、クラウドサービスではなく、自分のPC・サーバー上で動かすという意味です。ChatGPTやClaude.aiのようなWebサービスと違い、データが自分のデバイスに残ります。
OpenClawの最大の特徴は、あらゆるメッセージングプラットフォームから同じAIに話しかけられることです。
朝はTelegramで「今日の予定を教えて」と聞き、仕事中はSlackで「このコードをレビューして」と頼み、夜はWhatsAppで「明日のリマインダーを設定して」と依頼する。すべて同じAIが、文脈を保ったまま応答してくれます。
対応チャネルは以下の通りです。
| カテゴリ | チャネル |
|---|---|
| コア | Telegram, Discord, Slack, WhatsApp, Signal, iMessage |
| 拡張 | Microsoft Teams, Matrix, Google Chat, LINE, IRC, Twitch 等20+ |
| ネイティブアプリ | macOS (メニューバー), iOS, Android |
| Web | WebChat UI |
AIの「頭脳」も選べます。Claude、GPT-4、Gemini、Mistral、Ollamaによるローカルモデルなど、15以上のプロバイダーに対応しています。
「待って、これ誰が作ったの?」
OpenClawのリードメンテナーはPeter Steinberger(GitHub: steipete)。iOS開発者なら知らない人はいないでしょう。PDF SDK「PSPDFKit」の創業者であり、iOSフレームワーク開発の第一人者です。累計コミット数は10,000を超えています。
そしてOpenClawの心臓部、AIエージェント基盤「pi-mono」を作ったのはMario Zechner(GitHub: badlogic)。こちらも知る人ぞ知る存在です。
MarioはlibGDXの作者です。Javaベースのクロスプラットフォームゲーム開発フレームワークで、GitHubスター数は24,000超。2012年の公開以来、数多くのモバイルゲームやインディーゲームの基盤として使われてきました。
「ゲーム開発フレームワークの人が、なぜAIエージェントを?」
Marioは近年、社会貢献への意識を強めています。オーストリアの食品価格インフレーションを可視化するプロジェクトを手がけたり、問題のあるAI活用を批判する活動を行ったりしています。「父親になったことが転機だった」と本人は語っています。
そして2025年8月、Marioはpi-monoを公開しました。ゲーム開発で培った「フレームワーク思考」をAIエージェントの世界に持ち込んだのです。
氷山の下 ―― pi-monoという基盤
OpenClawは「アプリケーション」です。その下には「基盤」がある。それがpi-monoです。
pi-monoは7つのパッケージからなるTypeScriptモノレポで、現在16,900スターを獲得しています。最新バージョンはv0.55.1(2026年2月時点)。Node.js 20以上で動作します。
各パッケージの役割を説明します。
pi-ai ―― 18+プロバイダーの統一API
OpenAI、Anthropic、Google Gemini、AWS Bedrock、Mistral、xAI、Groq、Ollama――これらの異なるLLM APIを、1つの統一インターフェースで扱えるようにする抽象化レイヤーです。
// プロバイダーが違っても同じ書き方(概念的なコード例)
const response = await chat({
provider: "anthropic", // ここを変えるだけ
model: "claude-sonnet-4-20250514",
messages: [{ role: "user", content: "Hello" }]
});
自動モデル検出、トークン/コスト追跡、プロンプトキャッシング、ストリーミング、会話途中でのモデル切り替え(クロスプロバイダーハンドオフ)まで備えています。
pi-aiが対応するプロバイダーは18以上。OpenAI、Anthropic、Google Gemini、AWS Bedrock、Mistral、xAI、Groq、Cerebras、OpenRouter、Azure OpenAI、GitHub Copilot、Ollama、vLLM、LM Studio等を統一的に扱えます。
pi-agent-core ―― エージェントの心臓部
LLMに「道具」を持たせて自律的に動かすためのランタイムです。
- ユーザーの質問を受け取る
- LLMが「この道具を使いたい」と判断する
- 道具(ツール)を実行し、結果をLLMに返す
- LLMが次の行動を判断する
- 繰り返し
このループをイベントベースで管理します。中断、リトライ、コンテキストウィンドウのオーバーフロー時の自動コンパクションなど、実運用に必要な機能が揃っています。
pi-coding-agent ―― CLIアプリケーション
pi-agent-coreの上に構築されたインタラクティブなコーディングエージェントです。ファイル読み書き、シェル実行、grep検索など7つのデフォルトツールを持っています。
4つの実行モードがあります。
| モード | 用途 |
|---|---|
| Interactive | フルTUIモード(メインのユーザー体験) |
| stdout出力(スクリプト連携用) | |
| RPC | JSON stdin/stdoutプロトコル(外部プロセス統合) |
| SDK |
createAgentSession() APIによるプログラマティック利用 |
OpenClawが使っているのは主にRPCモードです。pi-coding-agentをプロセスとして起動し、JSON-RPCで通信します。
その他のパッケージ
- pi-tui: ちらつきのないターミナルUIライブラリ。CSI 2026同期出力や差分レンダリングなど、ゲーム開発者ならではの描画最適化が光ります
- pi-web-ui: ブラウザ用AIチャットコンポーネント。Web Components + Tailwind CSS
- pi-mom: Slackボット。Docker/ホストサンドボックス上で隔離実行
- pi-pods: DataCrunch, RunPod, Vast.ai等のGPUポッドにvLLMをデプロイするCLI
OpenClawの4層アーキテクチャ
ここからは、OpenClaw自体のアーキテクチャを見ていきます。複雑に見えますが、4つの層に整理できます。
レストランに例えるとわかりやすいです。
1. インターフェース層(ホール係)
お客さん(ユーザー)の注文(メッセージ)を受け取り、料理(応答)を届ける層です。
Telegram、Discord、Slack――それぞれのプラットフォームには独自の作法があります。Slackにはブロック記法があり、Discordにはスレッドがあり、Telegramにはインラインボタンがある。この層がそれらの差異を吸収し、内部には統一された「注文伝票」(MsgContext)として渡します。
各チャネルはプラグインとして実装されており、ChannelPluginインターフェースを通じてMessaging / Streaming / Threadingなどのアダプターを提供します。
2. オーケストレーション層(フロアマネージャー)
「この注文はどのシェフに回すか」を判断する層です。
中核はWebSocketベースのゲートウェイ。認証(token / password / Tailscale等4モード)、チャネル管理、ヘルスチェック、Cronスケジューリングを担います。
ルーティングシステムは agent:main:main 形式のセッションキーでエージェント・チャネル・ユーザーを識別し、適切なセッションにメッセージを振り分けます。
コマンドキューはレーンベースの直列化を行い、同時実行数を制御します。混雑した厨房でも注文が混線しない仕組みです。
3. インテリジェンス層(シェフ)
実際に「料理」を作る層です。pi-coding-agentのランタイムをベースに、76以上のツールを駆使して応答を生成します。
ツールの一部を紹介します。
76+ツールの主なカテゴリ
| カテゴリ | ツール例 |
|---|---|
| Web | HTTP取得、Web検索、ブラウザ自動操作 |
| 実行 | シェル実行(サンドボックス付き)、Cronタスク |
| 通信 | クロスチャネルメッセージ送信、セッション操作 |
| メディア | 画像操作、音声文字起こし、動画解析 |
| 記憶 | ベクトルDB(LanceDB)による長期記憶 |
マルチエージェントにも対応しており、子エージェントを生成してタスクを並列に委任できます。
4. プラットフォーム層(厨房設備)
すべてを支える基盤です。設定管理(JSON5、環境変数参照、Zodバリデーション)、セキュリティ(監査ログ、実行承認、SSRF防御)、永続化(セッション、認証情報、メディアキャッシュ)を提供します。
プラグインシステムが強力で、ツール・フック・チャネル・プロバイダー・HTTPルート・CLIコマンド・バックグラウンドサービス・診断チェックを追加できます。
なぜOpenClawが特別なのか
AIコーディングエージェントは多いです。Claude Code、OpenAI Codex CLI、Gemini CLI、Cursorなど、選択肢は豊富です。ではOpenClawは何が違うのか。
決定的な差は「スコープ」にあります。
Claude CodeやCodex CLIは「コーディング」に特化しています。ターミナルで使い、コードを書き、テストを走らせる。開発者のための開発ツールです。
OpenClawは「生活全体のアシスタント」を目指しています。コーディングもできますが、それは76以上あるツールの一部に過ぎません。メッセージ送信、Web検索、ブラウザ操作、スケジュール管理、画像解析、音声文字起こし、音声合成――日常のあらゆるタスクをカバーします。
もう一つの大きな差はデータの所在です。
ChatGPTやClaude.aiを使うと、会話データはクラウドに保存されます。OpenClawはセルフホスト。すべてのデータが ~/.openclaw/ 配下に残ります。セッション履歴、認証情報、ベクトルDBの長期記憶が自分のデバイス上にあります。
セルフホストはデータの主権を得る代わりに、自分でサーバーを管理する責任が伴います。Node.js 22以上の環境が必要です。
そしてマルチチャネル統合。これは他のツールにはありません。LINEで話しかけてもSlackで話しかけても、同じAI、同じ文脈、同じ記憶が応答します。プラットフォームに縛られない、自分だけのAIアシスタントが手に入ります。
技術的に面白いポイント
エンジニアの目を引く技術的な特徴をいくつか紹介します。
クロスプロバイダーハンドオフ
会話の途中でLLMプロバイダーを切り替えられます。ClaudeからGPT-4に、GPT-4からGeminiに、シームレスに移行する。思考ブロックの自動変換まで行うため、会話の文脈が途切れません。
メッセージに @claude-opus と書くだけで、次の応答からモデルが切り替わります。コストや速度の最適化を、ユーザーがリアルタイムに制御できます。
pi-tuiの差分レンダリング
pi-tuiはターミナルUIライブラリですが、ゲーム開発者が作っただけあって描画が最適化されています。3つのレンダリング戦略(最小差分、フルリドロー、パーシャル)を使い分け、CSI 2026同期出力でちらつきを完全に排除します。
Kitty/iTerm2のグラフィクスプロトコルにも対応しており、ターミナル上に画像を表示できます。
ベクトルDBによる長期記憶
LanceDBまたはsqlite-vecをバックエンドに、ベクトルデータベースによる長期記憶を実装しています。過去の会話からセマンティックに関連する情報を検索し、コンテキストに組み込みます。
「先月話した○○の件だけど」と言えば、AIが自分で過去のやりとりを探し出してくれます。
プラグインによるエコシステム
OpenClaw自体もOSSですが、その周辺にもエコシステムが生まれています。
- clawhub: スキルディレクトリ(コミュニティ製スキルの集約)
- lobster: OpenClaw用のワークフローシェル
- nix-openclaw: NixOSパッケージング
- openclaw-ansible: Tailscale連携のAnsibleデプロイ
GitHubのopenclaw organizationには20以上のプロジェクトが並んでいます。
考察:「フレームワーク脳」が生んだもの
libGDXは「ゲームエンジン」ではありませんでした。UnityやUnreal Engineとは設計思想が違います。ゲームエンジンは「こう作りなさい」というレールを敷く。libGDXは「必要な部品を揃えるから、好きに組み合わせて」というスタンスでした。
pi-monoにも同じ哲学が息づいています。
pi-monoは「AIエージェント」ではなく、「AIエージェントを作るためのフレームワーク」です。pi-aiはLLM APIを抽象化しますが、どのプロバイダーを使うかは開発者に委ねる。pi-agent-coreはエージェントランタイムを提供しますが、どんなツールを組み込むかは自由です。pi-coding-agentですら、拡張機能・スキル・プロンプトテンプレート・テーマを通じて大幅にカスタマイズできます。
この「フレームワーク思考」がOpenClawの成功を生んだと筆者は考えています。
pi-monoは基盤として十分に柔軟だったからこそ、Peter SteinbergerのチームがOpenClawという「アプリケーション」をその上に構築できました。コーディングエージェントのランタイムが、メッセージングプラットフォームの統合基盤に化けた。作者が想定していなかった使い方すら可能にする――それがフレームワークの力です。
OSSエコシステムの力学がここにあります。優れた基盤を公開すれば、自分が想像もしなかったものが建つ。 pi-monoの16,900スターも立派ですが、その上に建てたOpenClawは231,000スターを獲得しました。基盤の価値は、その上に何が建つかで決まります。
まとめ
OpenClawは「23万スターのAIアシスタント」という華やかな表舞台と、それを支える「ゲーム開発者が設計したエージェント基盤 pi-mono」という縁の下の立役者で成り立っています。
- OpenClaw: セルフホスト型パーソナルAIアシスタント。26+チャネル対応、76+ツール、iOS/macOS/Androidアプリ
- pi-mono: 7パッケージのTypeScript AIエージェントツールキット。OpenClawの心臓部
- Mario Zechner: libGDX(24k stars)の作者がpi-monoを設計
- Peter Steinberger: PSPDFKit創業者がOpenClawを主導
試してみたい方は以下からどうぞ。
- OpenClaw: https://github.com/openclaw/openclaw
- pi-mono: https://github.com/badlogic/pi-mono
- OpenClaw公式サイト: https://openclaw.ai
- ドキュメント: https://docs.openclaw.ai
OpenClawは毎日リリースを出しており(バージョン体系は vYYYY.M.D)、2026年2月現在もアクティブに開発が続いています。AIエージェントの世界がどこに向かうのか、このプロジェクトの動向は一つの指標になるでしょう。