Hermes Agent入門 — 永続メモリと自動スキル生成で成長するOSSエージェント

Last updated at 2026-03-16Posted at 2026-03-16

はじめに

AIエージェントの多くは、セッションが終わると学んだことをすべて忘れる。毎回同じ環境説明を繰り返し、同じタスクの手順を一からやり直す。NousResearchが開発した Hermes Agent は、この「AIの健忘症」を根本から解決するオープンソースのエージェントフレームワークである。

2026年3月12日にリリースされたv0.2.0では、63名のコントリビューターによる216のPRがマージされ、永続メモリシステム・自動スキル生成・マルチプラットフォームメッセージングといった機能が大幅に強化された。

この記事で学べること

Hermes Agentのアーキテクチャと「成長するエージェント」の仕組み
永続メモリシステムとスキル自動生成の技術的な構造
インストールからMCP連携までのセットアップ手順
Telegram・Slack・Discord経由でのリモート運用方法

対象読者

AIエージェントの構築・運用に関心があるエンジニア
Claude Code・Codexなどのコーディングエージェントとは異なるアプローチを探している方
オープンソースでセルフホスト可能なエージェント基盤を検討している方

TL;DR

Hermes Agentは 永続メモリ と 自動スキル生成 を備えたOSS（MITライセンス）のAIエージェント
セッションをまたいでユーザーの環境・好み・過去の作業を記憶し、学習した手順を再利用可能な「スキル文書」として蓄積する
Telegram・Discord・Slack・WhatsApp・Signal・Emailの7プラットフォームからアクセス可能
MCP（Model Context Protocol）にネイティブ対応し、既存のMCPサーバーとシームレスに連携する
6種類の実行バックエンド（ローカル・Docker・SSH・Daytona・Singularity・Modal）に対応

Hermes Agentとは何か

Hermes Agentは、NousResearch（Hermes-3モデルファミリーの開発元）が構築したCLIベースの自律型AIエージェントである。IDE統合型のコーディングアシスタント（Claude Code、Codexなど）とは根本的に異なり、サーバー上で独立して動作する「パーソナルAIインフラ」という位置づけになる。

公式サイトのキャッチコピー "The agent that grows with you" が示すとおり、使い込むほど賢くなる自己改善型のアーキテクチャが最大の特徴である。

主要な差別化ポイント

特徴	Hermes Agent	一般的なAIエージェント
メモリ	セッション横断で永続化	セッション終了で消失
スキル学習	成功体験からスキル文書を自動生成	毎回ゼロから実行
デプロイ先	サーバー / クラウド / ローカル	主にローカルマシン
アクセス方法	CLI + 7つのメッセージングプラットフォーム	CLI or IDE
ライセンス	MIT	製品による

永続メモリシステム

Hermes Agentのメモリシステムは3層構造で設計されている。

セッションメモリ

通常の会話コンテキスト。1回のセッション内で有効な短期記憶として機能する。

永続メモリ（Persistent Memory）

セッションを越えて保持される長期記憶。ユーザーの環境設定、プロジェクト構成、好みのワークフローなどを記憶する。公式ドキュメントによると、記憶内容は上限付きでキュレーション（定期的な整理・強化）が行われ、関連性の低い記憶は自動的に整理される。

セッション検索（Session Search）

過去のすべてのCLI・メッセージングセッションはSQLiteにFTS5（Full-Text Search 5）インデックス付きで保存される。エージェントは過去のセッションを全文検索し、関連する会話をLLMで要約して現在のタスクに活用できる。

この3層構造により、Hermes Agentは「先週のセッションで設定したデプロイスクリプトの内容」や「以前解決したエラーへの対処法」をセッションをまたいで参照できる。

自動スキル生成

Hermes Agentのもう一つの核心機能が、経験からスキル文書（Skill Document）を自動生成する仕組みである。

スキル文書の仕組み

エージェントが複雑なタスクを完了すると、その手順を agentskills.io オープン標準に準拠したMarkdownファイルとして永続化する。次回以降、類似タスクが発生した場合、エージェントは自身のスキルライブラリを検索し、過去の成功手順を再利用する。

公式ドキュメントによると、スキルは「作成 → 使用中の改善 → 共有」というライフサイクルで進化する。

バンドルスキルと拡張

v0.2.0時点で 70以上のバンドルスキル が15以上のカテゴリに分類されて同梱されている。主なカテゴリには以下がある。

カテゴリ	スキル例
Web検索	DuckDuckGo検索、Webスクレイピング
開発ツール	GitHub操作、コード実行、QAテスト
ナレッジ管理	Notion連携、Obsidian連携
ブロックチェーン	Solanaトランザクション
メディア	ASCII動画変換、画像処理

スキルはプラットフォームごとに有効/無効を切り替え可能で、ツールの可用性に基づく条件付きアクティベーションにも対応している。

インストールとセットアップ

インストール

Linux・macOS・WSL2に対応したワンライナーでインストールできる。Python 3.11とUVパッケージマネージャーが自動構成される。

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

インストール後にシェルを再読み込みする。

source ~/.zshrc  # macOSの場合

初期設定

3つの設定コマンドが用意されている。

hermes setup    # 全設定を一括で構成
hermes model    # LLMプロバイダーとモデルの選択
hermes tools    # プラットフォームごとのツール有効化/無効化

対応するLLMプロバイダーは以下のとおりである。

Nous Portal — NousResearch公式（OAuth認証）
OpenAI — GPT-5.x系（Codex OAuth対応）
Anthropic — Claude Opus / Sonnet
OpenRouter — 複数プロバイダーのルーティング
z.ai / GLM — Zhipu AI
Kimi / Moonshot — Moonshot AI
MiniMax — MiniMax
Azure OpenAI — エンタープライズ向け
カスタムOpenAI互換エンドポイント

起動

hermes          # インタラクティブチャット起動
hermes --continue  # 前回セッションの再開
hermes doctor   # プロバイダー接続の診断

MCP連携

Hermes AgentはMCP（Model Context Protocol）にネイティブ対応しており、stdioとHTTPの両トランスポートをサポートする。MCPサーバーが提供するツールは、ビルトインツールと同様にエージェントから呼び出せる。

設定例

MCPサーバーの設定は ~/.hermes/config.yaml に記述する。

mcp_servers:
  filesystem:
    command: "npx"
    args: ["-y", "@modelcontextprotocol/server-filesystem", "/home/user/projects"]
    env: {}

  github:
    command: "npx"
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

MCPサーバーが切断された場合、指数バックオフ（1秒→2秒→4秒→8秒→16秒、最大5回）で自動再接続が行われる。エージェント終了時にはすべてのMCP接続がクリーンにシャットダウンされる。

マルチプラットフォームメッセージング

Hermes Agentの大きな特徴として、7つのメッセージングプラットフォームからリモートでエージェントにアクセスできるゲートウェイ機能がある。

プラットフォーム	主な機能
Telegram	ファイル添付、PDF/Office処理、フォーラムトピック分離
Discord	チャンネルトピック対応、Bot フィルタリング、動画サポート
Slack	チャンネル統合、スレッド対応
WhatsApp	ネイティブメディア送信、マルチユーザーセッション分離
Signal	signal-cli-rest-api経由のフルメッセンジャー対応
Email	IMAP/SMTPゲートウェイ
Home Assistant	スマートホーム連携

ゲートウェイの起動は以下のコマンドで行う。

hermes gateway

各プラットフォームの認証情報は ~/.hermes/config.yaml で設定する。セッションはプラットフォーム間で統一管理され、Telegramで開始した会話をSlackから継続するといった使い方も可能である。

実行バックエンドとセキュリティ

6つの実行バックエンド

バックエンド	用途	特徴
Local	開発・テスト	最もシンプル、ローカルマシンで直接実行
Docker	本番運用	コンテナ隔離、カスタムボリュームマウント
SSH	リモートサーバー	既存インフラの活用
Daytona	クラウドサンドボックス	非アクティブ時の自動ハイバネーション
Singularity	HPCクラスタ	GPUワークロード向け
Modal	サーバーレス	従量課金、自動スケーリング

セキュリティ対策

v0.2.0ではセキュリティが大幅に強化されている。主な対策は以下のとおりである。

パストラバーサル防止: スキル表示時のディレクトリ脱出を防止
シェルインジェクション防止: sudo操作時の注入攻撃を検出
危険コマンド検出: マルチラインバイパス、teeパターンなどを検知
シンボリックリンク境界チェック: サンドボックス外へのアクセスを遮断
プロンプトインジェクション防止: cronジョブのスキャナー強化
機密情報の自動秘匿: 設定パターンに基づくシークレットのリダクション
ファイル権限の強制: 機密ファイルに0600/0700パーミッションを適用
アトミック書き込み: セッション・cronジョブ・.envファイルのデータ損失防止

Claude Code・Codexとの使い分け

Hermes Agentは、Claude CodeやCodexのようなIDE統合型コーディングエージェントとは競合しない。両者の使い分けを整理すると以下のようになる。

用途	推奨ツール
コードの記述・リファクタリング・PR作成	Claude Code / Codex
サーバー運用・監視・定期タスク自動化	Hermes Agent
マルチプラットフォームからのリモート操作	Hermes Agent
長期的な知識蓄積・学習の永続化	Hermes Agent
IDE内でのリアルタイムコーディング支援	Claude Code / Codex

Hermes Agentはサーバーサイドで常時稼働する「パーソナルAIインフラ」として、コーディングエージェントを補完する位置づけで活用するのが効果的である。

v0.2.0の規模と品質

v0.2.0は、63名のコントリビューターによる216のPRマージと119のイシュー解決を含む大規模リリースである。テストスイートは 3,289件 のテストケースで構成され、pytest-xdistによる並列実行に対応している。

主なバグ修正として、SQLiteセッションの重複問題（3〜4倍のトークン膨張を引き起こしていた）、ゲートウェイのトランスクリプトオフセットずれ（1ターンあたり1メッセージの損失）などが解決された。

まとめ

Hermes Agentは、AIエージェントに「記憶」と「成長」をもたらすオープンソースフレームワークである。

永続メモリ でセッションをまたいだ知識を蓄積し、 自動スキル生成 で反復タスクを効率化する
MCPネイティブ対応 により、既存のMCPサーバーエコシステムとシームレスに連携できる
7つのメッセージングプラットフォーム からリモートアクセスが可能で、サーバー常駐型のAIインフラとして運用できる
MITライセンス でセルフホストでき、LLMプロバイダーは自由に選択可能

IDE統合型のコーディングエージェントと組み合わせることで、開発から運用までをカバーするAIエージェントスタックを構築できる。

参考リンク

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up