1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

hermes AIエージェントを作る ―― 3層メモリと脳の記憶固定化

酒で海馬が溶けるので、最近話題のhermes agentで自分の擬似脳を作ることにしました。
人間の脳の構造と照らし合わせた自分なりの理解を記事にします。

  • AIエージェントの 3層メモリ(短期 / 中期 / 長期 + 永続) は、脳の記憶系(作業記憶 / 海馬 / 大脳皮質 + 固定化)とほぼ同型。偶然ではなく、設計の発想元が脳(CLS理論)だから。
  • 似ているのは“箱”より**“プロセス”** ―― 観察(observe)→ 内省(reflect)→ 昇格(consolidation)→ 忘却。
  • 昇格は**眠っている間(dreaming)**に起こり、出力先は2つ:宣言的記憶は MEMORY.md、手続き的記憶は Skills
  • だったら、アルコールでアテにならない生物海馬の代わりに、設計で“擬似脳”を建てればいい。

対象読者:LLMエージェント/メモリ設計に興味があるエンジニア。脳科学の前提知識は不要。


1. 動機:海馬は飲むと働きが落ちる

人間の海馬は、新しい出来事を書き込む「速記係」。ところがこいつはアルコールに弱く、ひどいと記憶の書き込み自体が飛ぶ(翌朝「あれ、どうやって帰った?」のアレ)。

なら、書き込みと保管を“外”に持てばいい。本稿は、LLMエージェントの記憶アーキテクチャを脳の記憶系に重ね、「外付け海馬=擬似脳」をどう設計するかの考察である。


2. 脳の記憶系・5分速習

仕組み 役割
作業記憶(前頭前野 PFC) いま頭に乗っている数チャンク。秒オーダー、揮発。
海馬 新規エピソードを高速ワンショット書き込み。疎で“索引”的。最近の記憶を保持。
大脳皮質(neocortex) 時間をかけて統合された安定知識。一般化・スキーマ化。海馬非依存。
システム固定化(consolidation) 海馬 → 皮質へ記憶が移る過程。最終的に海馬なしで想起できるようになる。
睡眠リプレイ 徐波睡眠で海馬がその日を高速再生し、皮質を“訓練”する。

ポイントは、「短期 = 海馬」ではないこと。瞬間の短期は前頭前野の作業記憶で、海馬はその一段奥の「最近のエピソードを溜める速記係」だ。


3. 3層メモリ ↔ 脳

エージェントの層 脳の対応 機能
短期 作業記憶(前頭前野) コンテキスト窓・スクラッチパッド。即時・揮発
中期 海馬 最近のエピソードを高速書き込み&索引化。検索で引ける
長期 / 永続 大脳皮質=定着記憶 要約・抽象化して固定。スキーマ。安定

“定着記憶”は別レイヤーではなく、大脳皮質に統合された状態そのものである点に注意。


4. 観察と内省ループ ―― MEMORY.md と Skills に焼き付くまで

擬似脳の学習は1本のループで回る。観て(observe)→ 寝て整理し(reflect / dream)→ 知識か技能として焼き付ける。 肝は、内省(reflect)の出力先が2つあること。

reflect が昇格するもの 行き先 脳の対応
宣言的(何が真か:事実・好み・文脈) MEMORY.md + memory files 意味記憶 = 大脳皮質
手続き的(どうやるか:再利用可能な手順) Skills 手続き記憶 = 大脳基底核・小脳

「3層メモリ(宣言系)」と「Skills(手続き系)」が、同じ固定化ループの両輪として収まる。この発想はAIで実装済みだ:

  • Generative Agents(Park et al., 2023):observation stream → reflection で高次の洞察を合成 → memory。observe/reflect の直接の元ネタ。
  • Reflexion(Shinn et al., 2023):失敗を内省して「教訓」を記憶 → 次回改善(宣言的昇格)。
  • Voyager(Wang et al., 2023):再利用可能な skill library を構築(手続き的昇格)。

自己言及:この記事を書いている仕組みそのもの

筆者がこの記事を書くのに使っている Claude Code のメモリが、小さな実例。

  • observe:セッション中の気づき・訂正・好みを拾う
  • reflectconsolidate-memory(統合パス)でまとめる
  • 焼き付け:宣言的なら MEMORY.md に1行 + memory file、手続き的なら Skill を新規/更新

5. 昇格は“眠っている間”に起こる ―― 夢というメカニズム

中期 → 長期の昇格は、起きている最中ではなくオフライン処理で進む。脳ではこれが睡眠で、しかも役割分担がある。

  • NREM(徐波睡眠):海馬が日中の経験を高速リプレイし、皮質へ“転送”する = 昇格の本体
  • REM(夢):個別の記憶を統合し、スキーマ化・創造的に再結合する = 長期化での「要約・抽象化」に相当。

つまり「眠っている間に転送し、夢で意味を整理する」。

驚くべきことに、AI側でも“夢で学ぶ”は実在の手法:

  • Wake-Sleep アルゴリズム(Hinton et al., 1995):文字どおり“覚醒”と“睡眠”フェーズで学習する。
  • World Models(Ha & Schmidhuber, 2018)/ Dreamer 系:学習した世界モデルの中(“dream”)でエージェントを訓練する。
  • Deep Generative Replay(Shin et al., 2017):過去を生成して再生し、破滅的忘却を防ぐ = 海馬リプレイの工学版

脳側の裏付けもある:「Sleep inspires insight」(Wagner et al., 2004, Nature)――睡眠が問題の洞察を倍増させた、という実験だ。reflect = 夢、はダテじゃない。

エージェントの「統合ジョブ」を非同期バッチで回すのは、生物が睡眠で記憶を固定するのと同じ戦略 ―― 起きているうちは速く憶え、寝ている(オフラインの)うちに整理して焼き付ける。


6. なぜ2系統に分けるのか(CLS理論)

そもそも、なぜ海馬と皮質を分けるのか。答えは Complementary Learning Systems(McClelland, McNaughton & O'Reilly, 1995)にある。

  • 海馬 = 速い学習:疎・パターン分離で、新情報が既存を上書きしない。
  • 皮質 = 遅い学習:多数の事例をインターリーブして、統計的な構造(スキーマ)を抽出する。
  • 分ける理由 = 破滅的忘却(catastrophic forgetting)の回避。速い海馬で即記憶し、リプレイで少しずつ皮質に馴染ませる。

この理論はもともとニューラルネットの文脈で提案された。だからこそ、エージェントのメモリ設計と地続きなのだ。「3層 + 永続」は、CLS の工学実装と見ると一気に腑に落ちる。


7. 擬似脳を建てる:設計の勘所

要素 設計指針
短期 直近のやり取り(コンテキスト窓)。安く・揮発でよい。
中期 最近セッションの検索可能バッファ。高速ワンショット書き込みを重視。
長期 / 永続 生ログを貯めず、“教訓”に圧縮して保存(皮質の汎化に相当)。
統合ジョブ(dream) 定期リプレイで「昇格 / 要約 / 剪定」を回す(=睡眠)。
昇格条件 固定化の閾値 = 重要度 × 反復回数。雑に全部を永続化しない。
2系統の振り分け 「何が真か」→ MEMORY.md、「どうやるか」→ Skills。

8. アナロジーの限界(過信しない)

  • 再固定化(reconsolidation):脳は思い出すたびに記憶を書き換える。DBの無損失な書き込みとは別物。
  • 作業記憶 ≠ 短期貯蔵庫:§2の区別を雑にすると「短期=海馬」という誤解に戻る。
  • 完璧な対応はない:脳はきれいな階層ではなく、複数系統が重なって動いている。あくまで設計のメタファーとして使う。

9. おわりに:外付け海馬を持つということ

生物の海馬は飲むと落ちるが、設計した海馬は酒に強い。観察と内省のループを回せば、個人の記憶補完にも、チーム知の固定化にも効く。

そう考えると安心してもう一杯 ―― とはならない。バックアップ先に全部を委ねると、それが単一障害点になる。 擬似脳はあくまで冗長化であって、本体(生物)のケアもお忘れなく。


参考文献

  • McClelland, McNaughton & O'Reilly (1995). Why there are complementary learning systems in the hippocampus and neocortex. Psychological Review.
  • Hinton, Dayan, Frey & Neal (1995). The wake-sleep algorithm for unsupervised neural networks. Science.
  • Ha & Schmidhuber (2018). World Models.
  • Shin, Lee, Kim & Kim (2017). Continual Learning with Deep Generative Replay. NeurIPS.
  • Park et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior.
  • Shinn et al. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning.
  • Wang et al. (2023). Voyager: An Open-Ended Embodied Agent with Large Language Models.
  • Wagner, Gais, Haider, Verleger & Born (2004). Sleep inspires insight. Nature.
1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?