23
22

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

3ヶ月で23万スターを獲得したAIアシスタント「OpenClaw」の全貌 ―― 知られざるエージェント基盤と、ゲーム開発者の設計思想

23
Last updated at Posted at 2026-02-26

2025年11月にGitHubに登場し、わずか3ヶ月で23万スターを突破したOSSがあります。

皆さん最近よく耳にするOpenClawです。

「自分のデバイスで動く、パーソナルAIアシスタント」という触れ込みですが、単なるチャットボットではありません。Telegram、Discord、Slack、WhatsApp、Signal、iMessage――26以上のメッセージングチャネルを統合し、iOS/macOS/Androidのネイティブアプリまで備えた本格的なAIプラットフォームです。

ただ、OpenClawの本当の凄さは、目に見えない部分にあります。

この記事では、OpenClawという「表舞台」と、それを支える「縁の下の立役者」の両方を、初心者にもわかるように段階的に解き明かしていきます。読み進めるほどに、このプロジェクトの深さが見えてくるはずです。

OpenClawとは何か

一言でいえば、セルフホスト型のパーソナルAIアシスタントです。

「セルフホスト」とは、クラウドサービスではなく、自分のPC・サーバー上で動かすという意味です。ChatGPTやClaude.aiのようなWebサービスと違い、データが自分のデバイスに残ります。

OpenClawの最大の特徴は、あらゆるメッセージングプラットフォームから同じAIに話しかけられることです。

朝はTelegramで「今日の予定を教えて」と聞き、仕事中はSlackで「このコードをレビューして」と頼み、夜はWhatsAppで「明日のリマインダーを設定して」と依頼する。すべて同じAIが、文脈を保ったまま応答してくれます。

対応チャネルは以下の通りです。

カテゴリ チャネル
コア Telegram, Discord, Slack, WhatsApp, Signal, iMessage
拡張 Microsoft Teams, Matrix, Google Chat, LINE, IRC, Twitch 等20+
ネイティブアプリ macOS (メニューバー), iOS, Android
Web WebChat UI

AIの「頭脳」も選べます。Claude、GPT-4、Gemini、Mistral、Ollamaによるローカルモデルなど、15以上のプロバイダーに対応しています。

「待って、これ誰が作ったの?」

OpenClawのリードメンテナーはPeter Steinberger(GitHub: steipete)。iOS開発者なら知らない人はいないでしょう。PDF SDK「PSPDFKit」の創業者であり、iOSフレームワーク開発の第一人者です。累計コミット数は10,000を超えています。

そしてOpenClawの心臓部、AIエージェント基盤「pi-mono」を作ったのはMario Zechner(GitHub: badlogic)。こちらも知る人ぞ知る存在です。

MarioはlibGDXの作者です。Javaベースのクロスプラットフォームゲーム開発フレームワークで、GitHubスター数は24,000超。2012年の公開以来、数多くのモバイルゲームやインディーゲームの基盤として使われてきました。

「ゲーム開発フレームワークの人が、なぜAIエージェントを?」

Marioは近年、社会貢献への意識を強めています。オーストリアの食品価格インフレーションを可視化するプロジェクトを手がけたり、問題のあるAI活用を批判する活動を行ったりしています。「父親になったことが転機だった」と本人は語っています。

そして2025年8月、Marioはpi-monoを公開しました。ゲーム開発で培った「フレームワーク思考」をAIエージェントの世界に持ち込んだのです。

氷山の下 ―― pi-monoという基盤

OpenClawは「アプリケーション」です。その下には「基盤」がある。それがpi-monoです。

pi-monoは7つのパッケージからなるTypeScriptモノレポで、現在16,900スターを獲得しています。最新バージョンはv0.55.1(2026年2月時点)。Node.js 20以上で動作します。

各パッケージの役割を説明します。

pi-ai ―― 18+プロバイダーの統一API

OpenAI、Anthropic、Google Gemini、AWS Bedrock、Mistral、xAI、Groq、Ollama――これらの異なるLLM APIを、1つの統一インターフェースで扱えるようにする抽象化レイヤーです。

// プロバイダーが違っても同じ書き方(概念的なコード例)
const response = await chat({
  provider: "anthropic", // ここを変えるだけ
  model: "claude-sonnet-4-20250514",
  messages: [{ role: "user", content: "Hello" }]
});

自動モデル検出、トークン/コスト追跡、プロンプトキャッシング、ストリーミング、会話途中でのモデル切り替え(クロスプロバイダーハンドオフ)まで備えています。

pi-aiが対応するプロバイダーは18以上。OpenAI、Anthropic、Google Gemini、AWS Bedrock、Mistral、xAI、Groq、Cerebras、OpenRouter、Azure OpenAI、GitHub Copilot、Ollama、vLLM、LM Studio等を統一的に扱えます。

pi-agent-core ―― エージェントの心臓部

LLMに「道具」を持たせて自律的に動かすためのランタイムです。

  1. ユーザーの質問を受け取る
  2. LLMが「この道具を使いたい」と判断する
  3. 道具(ツール)を実行し、結果をLLMに返す
  4. LLMが次の行動を判断する
  5. 繰り返し

このループをイベントベースで管理します。中断、リトライ、コンテキストウィンドウのオーバーフロー時の自動コンパクションなど、実運用に必要な機能が揃っています。

pi-coding-agent ―― CLIアプリケーション

pi-agent-coreの上に構築されたインタラクティブなコーディングエージェントです。ファイル読み書き、シェル実行、grep検索など7つのデフォルトツールを持っています。

4つの実行モードがあります。

モード 用途
Interactive フルTUIモード(メインのユーザー体験)
Print stdout出力(スクリプト連携用)
RPC JSON stdin/stdoutプロトコル(外部プロセス統合)
SDK createAgentSession() APIによるプログラマティック利用

OpenClawが使っているのは主にRPCモードです。pi-coding-agentをプロセスとして起動し、JSON-RPCで通信します。

その他のパッケージ

  • pi-tui: ちらつきのないターミナルUIライブラリ。CSI 2026同期出力や差分レンダリングなど、ゲーム開発者ならではの描画最適化が光ります
  • pi-web-ui: ブラウザ用AIチャットコンポーネント。Web Components + Tailwind CSS
  • pi-mom: Slackボット。Docker/ホストサンドボックス上で隔離実行
  • pi-pods: DataCrunch, RunPod, Vast.ai等のGPUポッドにvLLMをデプロイするCLI

OpenClawの4層アーキテクチャ

ここからは、OpenClaw自体のアーキテクチャを見ていきます。複雑に見えますが、4つの層に整理できます。

レストランに例えるとわかりやすいです。

1. インターフェース層(ホール係)

お客さん(ユーザー)の注文(メッセージ)を受け取り、料理(応答)を届ける層です。

Telegram、Discord、Slack――それぞれのプラットフォームには独自の作法があります。Slackにはブロック記法があり、Discordにはスレッドがあり、Telegramにはインラインボタンがある。この層がそれらの差異を吸収し、内部には統一された「注文伝票」(MsgContext)として渡します。

各チャネルはプラグインとして実装されており、ChannelPluginインターフェースを通じてMessaging / Streaming / Threadingなどのアダプターを提供します。

2. オーケストレーション層(フロアマネージャー)

「この注文はどのシェフに回すか」を判断する層です。

中核はWebSocketベースのゲートウェイ。認証(token / password / Tailscale等4モード)、チャネル管理、ヘルスチェック、Cronスケジューリングを担います。

ルーティングシステムは agent:main:main 形式のセッションキーでエージェント・チャネル・ユーザーを識別し、適切なセッションにメッセージを振り分けます。

コマンドキューはレーンベースの直列化を行い、同時実行数を制御します。混雑した厨房でも注文が混線しない仕組みです。

3. インテリジェンス層(シェフ)

実際に「料理」を作る層です。pi-coding-agentのランタイムをベースに、76以上のツールを駆使して応答を生成します。

ツールの一部を紹介します。

76+ツールの主なカテゴリ
カテゴリ ツール例
Web HTTP取得、Web検索、ブラウザ自動操作
実行 シェル実行(サンドボックス付き)、Cronタスク
通信 クロスチャネルメッセージ送信、セッション操作
メディア 画像操作、音声文字起こし、動画解析
記憶 ベクトルDB(LanceDB)による長期記憶

マルチエージェントにも対応しており、子エージェントを生成してタスクを並列に委任できます。

4. プラットフォーム層(厨房設備)

すべてを支える基盤です。設定管理(JSON5、環境変数参照、Zodバリデーション)、セキュリティ(監査ログ、実行承認、SSRF防御)、永続化(セッション、認証情報、メディアキャッシュ)を提供します。

プラグインシステムが強力で、ツール・フック・チャネル・プロバイダー・HTTPルート・CLIコマンド・バックグラウンドサービス・診断チェックを追加できます。

なぜOpenClawが特別なのか

AIコーディングエージェントは多いです。Claude Code、OpenAI Codex CLI、Gemini CLI、Cursorなど、選択肢は豊富です。ではOpenClawは何が違うのか。

決定的な差は「スコープ」にあります。

Claude CodeやCodex CLIは「コーディング」に特化しています。ターミナルで使い、コードを書き、テストを走らせる。開発者のための開発ツールです。

OpenClawは「生活全体のアシスタント」を目指しています。コーディングもできますが、それは76以上あるツールの一部に過ぎません。メッセージ送信、Web検索、ブラウザ操作、スケジュール管理、画像解析、音声文字起こし、音声合成――日常のあらゆるタスクをカバーします。

もう一つの大きな差はデータの所在です。

ChatGPTやClaude.aiを使うと、会話データはクラウドに保存されます。OpenClawはセルフホスト。すべてのデータが ~/.openclaw/ 配下に残ります。セッション履歴、認証情報、ベクトルDBの長期記憶が自分のデバイス上にあります。

セルフホストはデータの主権を得る代わりに、自分でサーバーを管理する責任が伴います。Node.js 22以上の環境が必要です。

そしてマルチチャネル統合。これは他のツールにはありません。LINEで話しかけてもSlackで話しかけても、同じAI、同じ文脈、同じ記憶が応答します。プラットフォームに縛られない、自分だけのAIアシスタントが手に入ります。

技術的に面白いポイント

エンジニアの目を引く技術的な特徴をいくつか紹介します。

クロスプロバイダーハンドオフ

会話の途中でLLMプロバイダーを切り替えられます。ClaudeからGPT-4に、GPT-4からGeminiに、シームレスに移行する。思考ブロックの自動変換まで行うため、会話の文脈が途切れません。

メッセージに @claude-opus と書くだけで、次の応答からモデルが切り替わります。コストや速度の最適化を、ユーザーがリアルタイムに制御できます。

pi-tuiの差分レンダリング

pi-tuiはターミナルUIライブラリですが、ゲーム開発者が作っただけあって描画が最適化されています。3つのレンダリング戦略(最小差分、フルリドロー、パーシャル)を使い分け、CSI 2026同期出力でちらつきを完全に排除します。

Kitty/iTerm2のグラフィクスプロトコルにも対応しており、ターミナル上に画像を表示できます。

ベクトルDBによる長期記憶

LanceDBまたはsqlite-vecをバックエンドに、ベクトルデータベースによる長期記憶を実装しています。過去の会話からセマンティックに関連する情報を検索し、コンテキストに組み込みます。

「先月話した○○の件だけど」と言えば、AIが自分で過去のやりとりを探し出してくれます。

プラグインによるエコシステム

OpenClaw自体もOSSですが、その周辺にもエコシステムが生まれています。

  • clawhub: スキルディレクトリ(コミュニティ製スキルの集約)
  • lobster: OpenClaw用のワークフローシェル
  • nix-openclaw: NixOSパッケージング
  • openclaw-ansible: Tailscale連携のAnsibleデプロイ

GitHubのopenclaw organizationには20以上のプロジェクトが並んでいます。

考察:「フレームワーク脳」が生んだもの

libGDXは「ゲームエンジン」ではありませんでした。UnityやUnreal Engineとは設計思想が違います。ゲームエンジンは「こう作りなさい」というレールを敷く。libGDXは「必要な部品を揃えるから、好きに組み合わせて」というスタンスでした。

pi-monoにも同じ哲学が息づいています。

pi-monoは「AIエージェント」ではなく、「AIエージェントを作るためのフレームワーク」です。pi-aiはLLM APIを抽象化しますが、どのプロバイダーを使うかは開発者に委ねる。pi-agent-coreはエージェントランタイムを提供しますが、どんなツールを組み込むかは自由です。pi-coding-agentですら、拡張機能・スキル・プロンプトテンプレート・テーマを通じて大幅にカスタマイズできます。

この「フレームワーク思考」がOpenClawの成功を生んだと筆者は考えています。

pi-monoは基盤として十分に柔軟だったからこそ、Peter SteinbergerのチームがOpenClawという「アプリケーション」をその上に構築できました。コーディングエージェントのランタイムが、メッセージングプラットフォームの統合基盤に化けた。作者が想定していなかった使い方すら可能にする――それがフレームワークの力です。

OSSエコシステムの力学がここにあります。優れた基盤を公開すれば、自分が想像もしなかったものが建つ。 pi-monoの16,900スターも立派ですが、その上に建てたOpenClawは231,000スターを獲得しました。基盤の価値は、その上に何が建つかで決まります。

まとめ

OpenClawは「23万スターのAIアシスタント」という華やかな表舞台と、それを支える「ゲーム開発者が設計したエージェント基盤 pi-mono」という縁の下の立役者で成り立っています。

  • OpenClaw: セルフホスト型パーソナルAIアシスタント。26+チャネル対応、76+ツール、iOS/macOS/Androidアプリ
  • pi-mono: 7パッケージのTypeScript AIエージェントツールキット。OpenClawの心臓部
  • Mario Zechner: libGDX(24k stars)の作者がpi-monoを設計
  • Peter Steinberger: PSPDFKit創業者がOpenClawを主導

試してみたい方は以下からどうぞ。

OpenClawは毎日リリースを出しており(バージョン体系は vYYYY.M.D)、2026年2月現在もアクティブに開発が続いています。AIエージェントの世界がどこに向かうのか、このプロジェクトの動向は一つの指標になるでしょう。

23
22
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
23
22

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?