hermes AIエージェントを作る ―― 3層メモリと脳の記憶固定化
酒で海馬が溶けるので、最近話題のhermes agentで自分の擬似脳を作ることにしました。
人間の脳の構造と照らし合わせた自分なりの理解を記事にします。
- AIエージェントの 3層メモリ(短期 / 中期 / 長期 + 永続) は、脳の記憶系(作業記憶 / 海馬 / 大脳皮質 + 固定化)とほぼ同型。偶然ではなく、設計の発想元が脳(CLS理論)だから。
- 似ているのは“箱”より**“プロセス”** ―― 観察(observe)→ 内省(reflect)→ 昇格(consolidation)→ 忘却。
- 昇格は**眠っている間(dreaming)**に起こり、出力先は2つ:宣言的記憶は
MEMORY.md、手続き的記憶は Skills。 - だったら、アルコールでアテにならない生物海馬の代わりに、設計で“擬似脳”を建てればいい。
対象読者:LLMエージェント/メモリ設計に興味があるエンジニア。脳科学の前提知識は不要。
1. 動機:海馬は飲むと働きが落ちる
人間の海馬は、新しい出来事を書き込む「速記係」。ところがこいつはアルコールに弱く、ひどいと記憶の書き込み自体が飛ぶ(翌朝「あれ、どうやって帰った?」のアレ)。
なら、書き込みと保管を“外”に持てばいい。本稿は、LLMエージェントの記憶アーキテクチャを脳の記憶系に重ね、「外付け海馬=擬似脳」をどう設計するかの考察である。
2. 脳の記憶系・5分速習
| 仕組み | 役割 |
|---|---|
| 作業記憶(前頭前野 PFC) | いま頭に乗っている数チャンク。秒オーダー、揮発。 |
| 海馬 | 新規エピソードを高速ワンショット書き込み。疎で“索引”的。最近の記憶を保持。 |
| 大脳皮質(neocortex) | 時間をかけて統合された安定知識。一般化・スキーマ化。海馬非依存。 |
| システム固定化(consolidation) | 海馬 → 皮質へ記憶が移る過程。最終的に海馬なしで想起できるようになる。 |
| 睡眠リプレイ | 徐波睡眠で海馬がその日を高速再生し、皮質を“訓練”する。 |
ポイントは、「短期 = 海馬」ではないこと。瞬間の短期は前頭前野の作業記憶で、海馬はその一段奥の「最近のエピソードを溜める速記係」だ。
3. 3層メモリ ↔ 脳
| エージェントの層 | 脳の対応 | 機能 |
|---|---|---|
| 短期 | 作業記憶(前頭前野) | コンテキスト窓・スクラッチパッド。即時・揮発 |
| 中期 | 海馬 | 最近のエピソードを高速書き込み&索引化。検索で引ける |
| 長期 / 永続 | 大脳皮質=定着記憶 | 要約・抽象化して固定。スキーマ。安定 |
“定着記憶”は別レイヤーではなく、大脳皮質に統合された状態そのものである点に注意。
4. 観察と内省ループ ―― MEMORY.md と Skills に焼き付くまで
擬似脳の学習は1本のループで回る。観て(observe)→ 寝て整理し(reflect / dream)→ 知識か技能として焼き付ける。 肝は、内省(reflect)の出力先が2つあること。
| reflect が昇格するもの | 行き先 | 脳の対応 |
|---|---|---|
| 宣言的(何が真か:事実・好み・文脈) | MEMORY.md + memory files |
意味記憶 = 大脳皮質 |
| 手続き的(どうやるか:再利用可能な手順) | Skills | 手続き記憶 = 大脳基底核・小脳 |
「3層メモリ(宣言系)」と「Skills(手続き系)」が、同じ固定化ループの両輪として収まる。この発想はAIで実装済みだ:
- Generative Agents(Park et al., 2023):observation stream → reflection で高次の洞察を合成 → memory。observe/reflect の直接の元ネタ。
- Reflexion(Shinn et al., 2023):失敗を内省して「教訓」を記憶 → 次回改善(宣言的昇格)。
- Voyager(Wang et al., 2023):再利用可能な skill library を構築(手続き的昇格)。
自己言及:この記事を書いている仕組みそのもの
筆者がこの記事を書くのに使っている Claude Code のメモリが、小さな実例。
- observe:セッション中の気づき・訂正・好みを拾う
-
reflect:
consolidate-memory(統合パス)でまとめる -
焼き付け:宣言的なら
MEMORY.mdに1行 + memory file、手続き的なら Skill を新規/更新
5. 昇格は“眠っている間”に起こる ―― 夢というメカニズム
中期 → 長期の昇格は、起きている最中ではなくオフライン処理で進む。脳ではこれが睡眠で、しかも役割分担がある。
- NREM(徐波睡眠):海馬が日中の経験を高速リプレイし、皮質へ“転送”する = 昇格の本体。
- REM(夢):個別の記憶を統合し、スキーマ化・創造的に再結合する = 長期化での「要約・抽象化」に相当。
つまり「眠っている間に転送し、夢で意味を整理する」。
驚くべきことに、AI側でも“夢で学ぶ”は実在の手法:
- Wake-Sleep アルゴリズム(Hinton et al., 1995):文字どおり“覚醒”と“睡眠”フェーズで学習する。
- World Models(Ha & Schmidhuber, 2018)/ Dreamer 系:学習した世界モデルの中(“dream”)でエージェントを訓練する。
- Deep Generative Replay(Shin et al., 2017):過去を生成して再生し、破滅的忘却を防ぐ = 海馬リプレイの工学版。
脳側の裏付けもある:「Sleep inspires insight」(Wagner et al., 2004, Nature)――睡眠が問題の洞察を倍増させた、という実験だ。reflect = 夢、はダテじゃない。
エージェントの「統合ジョブ」を非同期バッチで回すのは、生物が睡眠で記憶を固定するのと同じ戦略 ―― 起きているうちは速く憶え、寝ている(オフラインの)うちに整理して焼き付ける。
6. なぜ2系統に分けるのか(CLS理論)
そもそも、なぜ海馬と皮質を分けるのか。答えは Complementary Learning Systems(McClelland, McNaughton & O'Reilly, 1995)にある。
- 海馬 = 速い学習:疎・パターン分離で、新情報が既存を上書きしない。
- 皮質 = 遅い学習:多数の事例をインターリーブして、統計的な構造(スキーマ)を抽出する。
- 分ける理由 = 破滅的忘却(catastrophic forgetting)の回避。速い海馬で即記憶し、リプレイで少しずつ皮質に馴染ませる。
この理論はもともとニューラルネットの文脈で提案された。だからこそ、エージェントのメモリ設計と地続きなのだ。「3層 + 永続」は、CLS の工学実装と見ると一気に腑に落ちる。
7. 擬似脳を建てる:設計の勘所
| 要素 | 設計指針 |
|---|---|
| 短期 | 直近のやり取り(コンテキスト窓)。安く・揮発でよい。 |
| 中期 | 最近セッションの検索可能バッファ。高速ワンショット書き込みを重視。 |
| 長期 / 永続 | 生ログを貯めず、“教訓”に圧縮して保存(皮質の汎化に相当)。 |
| 統合ジョブ(dream) | 定期リプレイで「昇格 / 要約 / 剪定」を回す(=睡眠)。 |
| 昇格条件 | 固定化の閾値 = 重要度 × 反復回数。雑に全部を永続化しない。 |
| 2系統の振り分け | 「何が真か」→ MEMORY.md、「どうやるか」→ Skills。 |
8. アナロジーの限界(過信しない)
- 再固定化(reconsolidation):脳は思い出すたびに記憶を書き換える。DBの無損失な書き込みとは別物。
- 作業記憶 ≠ 短期貯蔵庫:§2の区別を雑にすると「短期=海馬」という誤解に戻る。
- 完璧な対応はない:脳はきれいな階層ではなく、複数系統が重なって動いている。あくまで設計のメタファーとして使う。
9. おわりに:外付け海馬を持つということ
生物の海馬は飲むと落ちるが、設計した海馬は酒に強い。観察と内省のループを回せば、個人の記憶補完にも、チーム知の固定化にも効く。
そう考えると安心してもう一杯 ―― とはならない。バックアップ先に全部を委ねると、それが単一障害点になる。 擬似脳はあくまで冗長化であって、本体(生物)のケアもお忘れなく。
参考文献
- McClelland, McNaughton & O'Reilly (1995). Why there are complementary learning systems in the hippocampus and neocortex. Psychological Review.
- Hinton, Dayan, Frey & Neal (1995). The wake-sleep algorithm for unsupervised neural networks. Science.
- Ha & Schmidhuber (2018). World Models.
- Shin, Lee, Kim & Kim (2017). Continual Learning with Deep Generative Replay. NeurIPS.
- Park et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior.
- Shinn et al. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning.
- Wang et al. (2023). Voyager: An Open-Ended Embodied Agent with Large Language Models.
- Wagner, Gais, Haider, Verleger & Born (2004). Sleep inspires insight. Nature.