はじめに
AIエージェントの多くは、セッションが終わると学んだことをすべて忘れる。毎回同じ環境説明を繰り返し、同じタスクの手順を一からやり直す。NousResearchが開発した Hermes Agent は、この「AIの健忘症」を根本から解決するオープンソースのエージェントフレームワークである。
2026年3月12日にリリースされたv0.2.0では、63名のコントリビューターによる216のPRがマージされ、永続メモリシステム・自動スキル生成・マルチプラットフォームメッセージングといった機能が大幅に強化された。
この記事で学べること
- Hermes Agentのアーキテクチャと「成長するエージェント」の仕組み
- 永続メモリシステムとスキル自動生成の技術的な構造
- インストールからMCP連携までのセットアップ手順
- Telegram・Slack・Discord経由でのリモート運用方法
対象読者
- AIエージェントの構築・運用に関心があるエンジニア
- Claude Code・Codexなどのコーディングエージェントとは異なるアプローチを探している方
- オープンソースでセルフホスト可能なエージェント基盤を検討している方
TL;DR
- Hermes Agentは 永続メモリ と 自動スキル生成 を備えたOSS(MITライセンス)のAIエージェント
- セッションをまたいでユーザーの環境・好み・過去の作業を記憶し、学習した手順を再利用可能な「スキル文書」として蓄積する
- Telegram・Discord・Slack・WhatsApp・Signal・Emailの7プラットフォームからアクセス可能
- MCP(Model Context Protocol)にネイティブ対応し、既存のMCPサーバーとシームレスに連携する
- 6種類の実行バックエンド(ローカル・Docker・SSH・Daytona・Singularity・Modal)に対応
Hermes Agentとは何か
Hermes Agentは、NousResearch(Hermes-3モデルファミリーの開発元)が構築したCLIベースの自律型AIエージェントである。IDE統合型のコーディングアシスタント(Claude Code、Codexなど)とは根本的に異なり、サーバー上で独立して動作する「パーソナルAIインフラ」という位置づけになる。
公式サイトのキャッチコピー "The agent that grows with you" が示すとおり、使い込むほど賢くなる自己改善型のアーキテクチャが最大の特徴である。
主要な差別化ポイント
| 特徴 | Hermes Agent | 一般的なAIエージェント |
|---|---|---|
| メモリ | セッション横断で永続化 | セッション終了で消失 |
| スキル学習 | 成功体験からスキル文書を自動生成 | 毎回ゼロから実行 |
| デプロイ先 | サーバー / クラウド / ローカル | 主にローカルマシン |
| アクセス方法 | CLI + 7つのメッセージングプラットフォーム | CLI or IDE |
| ライセンス | MIT | 製品による |
永続メモリシステム
Hermes Agentのメモリシステムは3層構造で設計されている。
セッションメモリ
通常の会話コンテキスト。1回のセッション内で有効な短期記憶として機能する。
永続メモリ(Persistent Memory)
セッションを越えて保持される長期記憶。ユーザーの環境設定、プロジェクト構成、好みのワークフローなどを記憶する。公式ドキュメントによると、記憶内容は上限付きでキュレーション(定期的な整理・強化)が行われ、関連性の低い記憶は自動的に整理される。
セッション検索(Session Search)
過去のすべてのCLI・メッセージングセッションはSQLiteにFTS5(Full-Text Search 5)インデックス付きで保存される。エージェントは過去のセッションを全文検索し、関連する会話をLLMで要約して現在のタスクに活用できる。
この3層構造により、Hermes Agentは「先週のセッションで設定したデプロイスクリプトの内容」や「以前解決したエラーへの対処法」をセッションをまたいで参照できる。
自動スキル生成
Hermes Agentのもう一つの核心機能が、経験からスキル文書(Skill Document)を自動生成する仕組みである。
スキル文書の仕組み
エージェントが複雑なタスクを完了すると、その手順を agentskills.io オープン標準に準拠したMarkdownファイルとして永続化する。次回以降、類似タスクが発生した場合、エージェントは自身のスキルライブラリを検索し、過去の成功手順を再利用する。
公式ドキュメントによると、スキルは「作成 → 使用中の改善 → 共有」というライフサイクルで進化する。
バンドルスキルと拡張
v0.2.0時点で 70以上のバンドルスキル が15以上のカテゴリに分類されて同梱されている。主なカテゴリには以下がある。
| カテゴリ | スキル例 |
|---|---|
| Web検索 | DuckDuckGo検索、Webスクレイピング |
| 開発ツール | GitHub操作、コード実行、QAテスト |
| ナレッジ管理 | Notion連携、Obsidian連携 |
| ブロックチェーン | Solanaトランザクション |
| メディア | ASCII動画変換、画像処理 |
スキルはプラットフォームごとに有効/無効を切り替え可能で、ツールの可用性に基づく条件付きアクティベーションにも対応している。
インストールとセットアップ
インストール
Linux・macOS・WSL2に対応したワンライナーでインストールできる。Python 3.11とUVパッケージマネージャーが自動構成される。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
インストール後にシェルを再読み込みする。
source ~/.zshrc # macOSの場合
初期設定
3つの設定コマンドが用意されている。
hermes setup # 全設定を一括で構成
hermes model # LLMプロバイダーとモデルの選択
hermes tools # プラットフォームごとのツール有効化/無効化
対応するLLMプロバイダーは以下のとおりである。
- Nous Portal — NousResearch公式(OAuth認証)
- OpenAI — GPT-5.x系(Codex OAuth対応)
- Anthropic — Claude Opus / Sonnet
- OpenRouter — 複数プロバイダーのルーティング
- z.ai / GLM — Zhipu AI
- Kimi / Moonshot — Moonshot AI
- MiniMax — MiniMax
- Azure OpenAI — エンタープライズ向け
- カスタムOpenAI互換エンドポイント
起動
hermes # インタラクティブチャット起動
hermes --continue # 前回セッションの再開
hermes doctor # プロバイダー接続の診断
MCP連携
Hermes AgentはMCP(Model Context Protocol)にネイティブ対応しており、stdioとHTTPの両トランスポートをサポートする。MCPサーバーが提供するツールは、ビルトインツールと同様にエージェントから呼び出せる。
設定例
MCPサーバーの設定は ~/.hermes/config.yaml に記述する。
mcp_servers:
filesystem:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-filesystem", "/home/user/projects"]
env: {}
github:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"
MCPサーバーが切断された場合、指数バックオフ(1秒→2秒→4秒→8秒→16秒、最大5回)で自動再接続が行われる。エージェント終了時にはすべてのMCP接続がクリーンにシャットダウンされる。
マルチプラットフォームメッセージング
Hermes Agentの大きな特徴として、7つのメッセージングプラットフォームからリモートでエージェントにアクセスできるゲートウェイ機能がある。
| プラットフォーム | 主な機能 |
|---|---|
| Telegram | ファイル添付、PDF/Office処理、フォーラムトピック分離 |
| Discord | チャンネルトピック対応、Bot フィルタリング、動画サポート |
| Slack | チャンネル統合、スレッド対応 |
| ネイティブメディア送信、マルチユーザーセッション分離 | |
| Signal | signal-cli-rest-api経由のフルメッセンジャー対応 |
| IMAP/SMTPゲートウェイ | |
| Home Assistant | スマートホーム連携 |
ゲートウェイの起動は以下のコマンドで行う。
hermes gateway
各プラットフォームの認証情報は ~/.hermes/config.yaml で設定する。セッションはプラットフォーム間で統一管理され、Telegramで開始した会話をSlackから継続するといった使い方も可能である。
実行バックエンドとセキュリティ
6つの実行バックエンド
| バックエンド | 用途 | 特徴 |
|---|---|---|
| Local | 開発・テスト | 最もシンプル、ローカルマシンで直接実行 |
| Docker | 本番運用 | コンテナ隔離、カスタムボリュームマウント |
| SSH | リモートサーバー | 既存インフラの活用 |
| Daytona | クラウドサンドボックス | 非アクティブ時の自動ハイバネーション |
| Singularity | HPCクラスタ | GPUワークロード向け |
| Modal | サーバーレス | 従量課金、自動スケーリング |
セキュリティ対策
v0.2.0ではセキュリティが大幅に強化されている。主な対策は以下のとおりである。
- パストラバーサル防止: スキル表示時のディレクトリ脱出を防止
- シェルインジェクション防止: sudo操作時の注入攻撃を検出
- 危険コマンド検出: マルチラインバイパス、teeパターンなどを検知
- シンボリックリンク境界チェック: サンドボックス外へのアクセスを遮断
- プロンプトインジェクション防止: cronジョブのスキャナー強化
- 機密情報の自動秘匿: 設定パターンに基づくシークレットのリダクション
- ファイル権限の強制: 機密ファイルに0600/0700パーミッションを適用
- アトミック書き込み: セッション・cronジョブ・.envファイルのデータ損失防止
Claude Code・Codexとの使い分け
Hermes Agentは、Claude CodeやCodexのようなIDE統合型コーディングエージェントとは競合しない。両者の使い分けを整理すると以下のようになる。
| 用途 | 推奨ツール |
|---|---|
| コードの記述・リファクタリング・PR作成 | Claude Code / Codex |
| サーバー運用・監視・定期タスク自動化 | Hermes Agent |
| マルチプラットフォームからのリモート操作 | Hermes Agent |
| 長期的な知識蓄積・学習の永続化 | Hermes Agent |
| IDE内でのリアルタイムコーディング支援 | Claude Code / Codex |
Hermes Agentはサーバーサイドで常時稼働する「パーソナルAIインフラ」として、コーディングエージェントを補完する位置づけで活用するのが効果的である。
v0.2.0の規模と品質
v0.2.0は、63名のコントリビューターによる216のPRマージと119のイシュー解決を含む大規模リリースである。テストスイートは 3,289件 のテストケースで構成され、pytest-xdistによる並列実行に対応している。
主なバグ修正として、SQLiteセッションの重複問題(3〜4倍のトークン膨張を引き起こしていた)、ゲートウェイのトランスクリプトオフセットずれ(1ターンあたり1メッセージの損失)などが解決された。
まとめ
Hermes Agentは、AIエージェントに「記憶」と「成長」をもたらすオープンソースフレームワークである。
- 永続メモリ でセッションをまたいだ知識を蓄積し、 自動スキル生成 で反復タスクを効率化する
- MCPネイティブ対応 により、既存のMCPサーバーエコシステムとシームレスに連携できる
- 7つのメッセージングプラットフォーム からリモートアクセスが可能で、サーバー常駐型のAIインフラとして運用できる
- MITライセンス でセルフホストでき、LLMプロバイダーは自由に選択可能
IDE統合型のコーディングエージェントと組み合わせることで、開発から運用までをカバーするAIエージェントスタックを構築できる。



