はじめに
最近話題のOpenClawですが、何がこれまでのAI Agentと違うのか、どうしてそこまで話題になっているのかが、正直なところクリアに答えられないという人は多いのではないでしょうか?実際、OpenClawで調べてみると仕組みだったりインストールの仕方だったりはいろいろ出てきますが、OpenClawが持つ意味をちゃんと説明はできているとは言えないと思います。本稿ではそこにつっこんでみたいと思います。
OpenClawのどこが新しいのか
ローカルで動くというアーキテクチャ
OpenClawは一言でいえば、プライベートで常時起動(Always ON)しているAI Agentです。ではそれがなぜ新しいのか。これまでのAI Agentとの構成の違いを考えてみます。
OpenClaw以前のAI Agentはすべからくクラウド側(データセンタ含む)で起動していました。ハイパースケーラやSaaSベンダはAI Agentをクラウド側で起動することで、リソース利用料とデータという貴重な収入源を得ています。データは個人ごとにIsolateするとかリソースは共有できるとかいろいろなオプションはありましたが、ユーザを囲い込んで収入につなげるというビジネスがつねに紐づいていました。
OpenClawはそこのつながりを断ち切り、プライベートな空間でAI Agentを起動するアーキテクチャを採用しています。OpenClawの開発者であるPeter Steinbergerは誰かがやるのではと思っていたが誰もやらないので自分で作ることにした、と言ってました。なぜ他はやらなかったのか。それは、少なくともクラウドベンダーやSaaS企業にとっては、OpenClawのようなものは作ってもマネタイズの道がないから、というのが答えになるでしょう。AIモデルはクラウドが提供しており、OpenClawからも使えますが、Mac Miniで動かせばそこも収益が無くなります。業界のプレーヤーで唯一、これでも儲かるのがNVIDIAです。彼らはGPUの使い道が増えてくれればそのまま儲かる仕組みです。なのでNemoClawを作ったし、強く推しているのです。
普段使っているチャネルから使える体験の新鮮さ
OpenClawはTUIと言われているWebUIもありますが、やはりチャネルでつなぐことに価値があります。現在対応しているのはWhatsApp, Slack, Telegram, Discordなど。残念ながら日本でよく使われるLINEやMS Teamsは未対応なので、これは日本では大きなマイナス要素であります。
チャネルにつなぐと、OpenClawがbotとして出てくるので、普段のチャットのインタフェースで会話ができます。欧米ではWhatsAppがよく使われているので、WhatsAppで簡単につなげられて会話ができる感覚というのはヒットの要因だと思います。ChatGPTにしてもClaudeにしても、ブラウザでアクセスするかアプリを開くというひと手間があります。Claude Codeがシンプルにコマンドプロンプトから使えたのが新鮮だったように、普段のインタフェースにそのまま乗っかってくるというのは使いやすさという面で大きなインパクトがあります。OpenClawはまさにそこを突いたと言えるでしょう。もちろんこれまでのAIツールでもbotが作れましたし、機構的には同じようなものは実現できていました。ですがそれがシンプルかつ汎用的だったこと、チャネルだけをインタフェースとするというセンスがよかったこと、が大きいと思います。
ユースケースからみたOpenClawの新しさ
ChatGPTのように質問をして答えてくれるというAIからタスクを任せてやってもらうのがAI Agentで可能になりました。これはAIモデルが進化して、AIが自分で考えて動いてくれるようになったためです。OpenClawになると、AI自体がやり方を考えるだけでなく、仕組み自体を作ってくれるようになります。よくOpenClawで、音声認識の機能がなかったが、音声ファイルを渡したら勝手にこれが音声ファイルだと認識し、音声認識のモデルとつなげるプログラムを作成して認識できるようにしたという話があります。このようにOpenClawではタスクを示すのではなく、やりたいことをそのまま伝えるだけで、やり方から考えてくれるようになりました。これはAIモデルの進化によるものなので、OpenClawでなくてもできるはずですが、OpenClawはローカルで動きマシン上の操作や権限を持っているので、制限なくできるようになっているのが大きいです。他のAI Agentプラットフォームでも、個別のSandbox環境を作って動くようなことができていますし、Claude Codeでも制限を外せばできるのですが、OpenClawだとそこがより自由度が高くなったということだと思います。
CLIツール、Skillsに落とし込むというシンプルさ
OpenClawの作りはシンプルで、Claude Codeとも通じますが、設定やコンテキストはテキストファイル(マークダウン)になっています。なので簡単にエディタで編集ができますし、他の環境への移行も簡単にできます。Skillsでコンテキストの消費を少なくし、MCPのようなコンテキストを食う仕組みではなくCLIに落とす。この作りはAIモデルの使い方の現状での最適解といえるのではないかと思います。開発者のPeter SteinbergerはいろいろなCLIツールを作っていたそうです。その経験とセンスが生かされているのだろうと思います。
まとめ
つらつらと特徴を書いてみましたが、一言でまとめると、「センスがよい」 ということだと思います。それが新鮮な体験として多くの人に響いた。セキュリティの面もよく言われますし、実際にだいぶ脆弱だったのも確かですが、それも含めて逆にセンスを感じさせてしまう、というのもあったと思います。人の感覚としても、はじめから高度に作りこまれてセキュリティも考慮されているアプリやツールではなく、荒っぽくて危なっかしい、だがすごくセンスがよい、そういうものに魅力を感じてしまう、というのがあるのではないでしょうか。OpenClawはまさにそこにはまったのだと思います。
これからは同じようなものが他社からも出てくるでしょうし、セキュリティを考慮したNemoClawのようなものも出てきています。ものによっては当初のOpenClawがもっていた特徴を消しかねないものもあるように思えます。そこに目くじらを立てるつもりはないです。マーケットというのはそういうものなので。ただOpenClawの本質を把握したうえで、違いはよくよく見ていかないといけないと思います。