430Bトークンが示した勝負——Hermes Agentが問う「育つAI」と任せ方の設計

Posted at 2026-05-25

AIエージェントの競争は、いま「どのモデルが一番賢いか」だけでは決まりにくくなっています。会話のたびにリセットされるチャットボットの延長ではなく、作業環境に常駐し、経験を残し、次の仕事に活かす設計が、利用の中心に入りつつあるからです。

その流れをはっきり示しているのが、Nous Researchが開発するオープンソースAIエージェント Hermes Agent です。OpenRouterのApp & Agent Rankings（2026年5月22日時点）では、当日の利用量として Hermes Agent が 430B tokens、OpenClaw が 165B tokens と表示されており、少なくとも OpenRouter 上のトラフィックでは Hermes Agent が大きく先行しています。もちろんこれは OpenRouter 経由の利用に限られた指標であり、全世界のエージェント利用をそのまま代表する数字ではありません。同じページの累計利用量では、Hermes Agent が約 8.29T tokens、OpenClaw が約 7.02T tokens と表示されており（いずれも2026年5月22日時点）、当日の数字だけの話ではない動きも示唆されます。それでも重要なのは順位そのものより、「賢さのベンチマーク」より 実際にどれだけ動かされているか が見える場所で、経験を蓄積する型のエージェントに需要が寄っている、という読み方です。

本記事では、Hermes Agent が何を目指しているのか、OpenClaw との違いはどこにあるのか、そして IT 技術者や教育・業務現場が押さえるべき設計の論点を、公開情報に沿って整理します。エージェントの権限や止めどころの考え方は、AIエージェントを使うとき、どこまで任せてどこで止める？——Anthropicの実測研究が教えてくれたことや AI活用の次の地図——指示する仕事から委任する仕事へ、IT技術者のための3ステップ実装読本でも扱っています。あわせて読んでいただくと、今回の話の位置づけがつかみやすいと思います。

利用量の先にあるもの——「答える」から「積み上げる」へ

数字だけを追う必要はありません。ただ、OpenRouter の説明文が Hermes Agent を「self-improving（自己改善型）」「memory across sessions（セッションをまたいだ記憶）」「reusable skills from experience（経験から再利用可能なスキル）」と紹介している点は、競争軸の変化を表しています（Hermes Agent（OpenRouter））。

従来の AI アシスタントは、会話が終われば基本的にリセットされる存在でした。会話履歴やメモリ機能はあっても、多くの場合は「前に話したことを覚えている」程度にとどまります。Hermes Agent が目指しているのは、その一歩先です。失敗した作業、直した手順、ユーザーの好み、繰り返し発生する仕事の流れを蓄積し、次の仕事に活かす。つまり、AI が道具から 経験を積む作業者 に近づいている、という見方ができます。

Nous Research の GitHub では、Hermes Agent を「self-improving AI agent」と説明し、経験からスキルを作成し、使用中に改善し、過去の会話を検索し、ユーザー理解を深める仕組みを持つとされています（公式ドキュメント）。ここでいう「自己改善」は、モデルそのものが夜中に学習し続ける、という意味ではなく、使うほど手順とスキルが厚くなる、という運用面の改善に近いです。

OpenClawとの違い——接続の広さと、技能の深さ

OpenClaw も強力なオープンソース AI エージェントです。メッセージアプリとつながり、Web 閲覧、ファイル操作、メール送信、コマンド実行など、実際の行動を代行できる点で注目を集めました。OpenRouter 上でも、OpenClaw は「メッセージアプリと接続し、実行系タスクをこなすエージェント」と説明されています（OpenClaw（OpenRouter））。DeNA が OpenClaw を基盤に社内エージェントを育てた事例や、ローカル優先・Gateway 中心の設計については、プロンプトより「環境」——DeNAのAI社員が教えてくれた、技術者の次の主戦場で整理しています。

一方、Hermes Agent の特徴は、作業のたびに少しずつ 自分のやり方 を獲得していく点にあります。たとえば、あるユーザーが毎週同じ形式でレポートを作るとします。従来型の AI なら、その都度プロンプトで指示する必要があります。Hermes Agent のような設計では、成功した手順をスキルとして保存し、「この人のレポートはこの構成、この文体、この確認手順で作る」といった形で再利用できる可能性があります。

教育現場に置き換えると、イメージがつかみやすくなります。単発で質問に答える AI は「その場で説明してくれる先生」に近い。一方、Hermes Agent 型の AI は「前回の授業で生徒がどこにつまずいたかを覚え、次の授業準備に活かす補助者」に近づいています。接続先の多さだけでなく、同じ仕事を繰り返すほど手戻りが減る 方向に価値が移っている、という読み方ができます。

なお、OpenClaw から Hermes へ設定・メモリ・スキルを移す hermes claw migrate も用意されており（README）、両者は単純な「どちらか一方」の対立というより、設計思想の違いを選ぶ 局面に入りつつあると言えます。

スキルが増えすぎたらどうするか——Curatorと「記憶の整理」

経験を残す設計には、当然ながら副作用もついてきます。AI が自動でスキルを作ると、今度は 似たようなスキルが増えすぎる 問題が起きます。ノートを取りすぎるだけでは学習にならないのと同じで、何でも記憶するとノイズが増え、判断が悪くなることがあります。

Hermes Agent には Curator という仕組みがあります。エージェントが作成したスキルの利用状況を確認し、長く使われていないものを stale や archived に移し、必要に応じて LLM で統合・修正を提案します。デフォルトでは 30日未使用で stale、90日未使用で archive される設計です（Curator | Hermes Agent）。重要なのは、自動削除はしない こと。アーカイブは ~/.hermes/skills/.archive/ に移され、hermes curator restore で復元できる、とドキュメントに書かれています。

ここが、単なる「記憶する AI」と「記憶を管理する AI」の分岐点です。人間の業務でも、ログを溜めるだけでは運用は改善しません。整理し、統合し、不要なものを脇に置く——その設計がエージェント側に入り始めている、という意味で Curator は見逃せない要素です。

CLIの向こう——IDEとメッセージの「いつもの場」に常駐する

Hermes Agent は CLI だけでなく、Telegram、Discord、Slack、WhatsApp、Signal などのメッセージ環境から使えると説明されています（Messaging Gateway）。さらに ACP（Agent Communication Protocol） によって、VS Code、Zed、JetBrains 系エディタとの連携も想定されています（ACP Editor Integration）。hermes acp でエディタから Hermes を呼び出し、ファイル操作やターミナル、承認プロンプトをエディタ内に表示する、という流れです。

これは、AI エージェントが「専用画面で開くツール」ではなく、日常の仕事場に入り込む ことを意味します。開発者ならエディタの中で、教師なら Slack やチャットの中で、事務職なら定型業務の流れの中で使う。AI が別室にいるのではなく、普段の作業環境に常駐する——この変化は、利用量の数字以上に、働き方の変化として効いてきます。

便利さと危うさは表裏——任せる範囲を設計する

Hermes Agent や OpenClaw のようなエージェントは、単に文章を生成するだけではありません。ツールを呼び出し、ファイルを操作し、Web を調べ、場合によっては外部サービスに接続します。そのため、今後の焦点は「どれだけ賢いか」だけではなく、次のような点になります。

どの権限を与えるのか

エージェントに接続できる範囲が広いほど、便利さとリスクは同時に増えます。OpenClaw ではローカル優先や Gateway の loopback 運用が推奨され、不適切な設定によるリスクが議論されてきました（プロンプトより「環境」——DeNAのAI社員が教えてくれた、技術者の次の主戦場）。Hermes でも Security でコマンド承認や DM ペアリングなどが説明されています。

どの作業は人間の承認を要するのか

Anthropic の実測研究が示すように、エージェントの自律性はモデルの性能だけでなく、人がどこまで任せ、どこで止めるか で決まります（AIエージェントを使うとき、どこまで任せてどこで止める？）。メール送信やファイル書き込みの前に停止点を置く設計は、エージェント時代の基本線です。

記憶とスキルをどう管理するのか

成績情報、個人情報、校務文書、社内データに自由にアクセスさせるのは危険です。記憶が残るほど、データの所在と保持期間 を設計しないと、コンプライアンス上の負債になります。外部データ経由の命令混入については、外部データに隠れた命令——間接プロンプトインジェクションを「AIの弱点」ではなく「設計の穴」として見る【前編】でも、エージェントの権限と外部データの扱いを扱っています。

誤った手順を「成功体験」として保存していないか

自動生成されたスキルが、一度うまくいったように見えても、実は誤った手順だった——そうした 誤学習 のリスクは、記憶型エージェントほど深刻です。Curator や人間によるレビュー、ピン留め（hermes curator pin）など、スキルの品質を後から直す仕組み がセットで必要になります。

AI エージェント時代に問われるのは、「AI を使えるか」より 「AI にどこまで任せるか」 です。便利だからといって、境界を決めずに接続する設計は、長期的にはコストのほうが大きくなりがちです（生成AIは「便利な道具」では終わらない——IT技術者がこれから何を作り、何を止め、どう振る舞うかも同じ論点です）。

これからのAIは「答える」より「育つ」——三つの視点で捉える

Hermes Agent の躍進は、エージェント競争のニュースであると同時に、私たちへの問いかけでもあります。ここでは、現場で使える三つの視点に整理します。

第一に——主戦場はモデル単体から「継続する仕事」へ移っている

これまでは、より賢く答えるモデルが注目されてきました。これからは、ユーザーの作業環境に入り、記憶を持ち、スキルを増やし、継続的に仕事を改善するエージェントが重要になります。OpenRouter の当日ランキングは、その需要の一端を示している、と読めます。

第二に——「育つ」設計には、整理と統制がセットになる

記憶する AI、行動する AI、自動でスキルを作る AI は便利であると同時に、誤作動や権限濫用、情報漏洩のリスクも大きくなります。Curator のような メンテナンスの仕組み があるかどうかは、導入判断のチェック項目になります。

第三に——人間側の「任せ方の設計力」が差をつける

これから問われるのは、AI そのものの性能だけではありません。任せる仕事、任せない仕事、途中で確認する仕事を分ける設計力があるかどうかです。単発のプロンプトで終わらせるのか、経験を積み上げる AI とどう付き合うかを、チームや組織として本気で設計するのか——その選択が、今後数年の生産性と安全性の両方を左右します。

Hermes Agent と OpenClaw の競争は、どちらが「正解」かを決める話ではないかもしれません。接続の広さを取るのか、経験の深さを取るのか。あるいは移行ツールで両方を試すのか。いずれにしても、IT 技術者にとっての実務は、エージェントを選ぶこと より 任せ方を設計すること に重心が移りつつある、ということだけは、数字とドキュメントの両方が示しています。

作成日：2026年5月22日

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up