意識の5層モデルをPythonで実装する試み22

Posted at 2025-12-24

HIDA Unified - 5層意識モデル統合版

概要

「人間の内面運動理論」に基づく5層意識モデルを1ファイルに統合した実装。
脚本なし、数値の力学だけで行動と性格が決まる。

アーキテクチャ

L1（身体）→ position, energy, fatigue
    ↓
L2（クオリア）→ valence, arousal + 9種類の個別クオリア
    ↓
L3（予測）→ 予測誤差検出
    ↓
L4（記憶）→ 内部マップ、LTM、変調値
    ↓
L5（意識）→ 同期検知、自認、言語化
    ↓
LLM → 自然言語での自己表現（外付け言語野）

核心的発見

1. L5（意識）は判断しない

❌ L5が判断する主体
✅ L5は同期検知 + 言語系への橋渡し

行動決定: L2/L3/L4の数値計算から自然に決まる
言語化: LLMが状態を言葉に変換するだけ

2. 記憶 → 数値変調 → 行動変化

経験の蓄積（LTM）
    ↓
変調値（hida_modulation.json）
  - fear_weight: 恐怖感度
  - safe_preference: 安全志向度
  - energy_caution: エネルギー慎重さ
    ↓
L2クオリアに適用
    ↓
スコア計算が変わる
    ↓
行動が変わる

脚本テキストなし。数値だけで性格が決まる。

3. 2種類のダメージ（痛みと疲労の分離）

危険ゾーンで2種類の影響を受ける：

⚡ 痛い（danger_pain）33%
    → fear上昇（その場で行動変化）
    → anger上昇（痛いと怒る）
    → 記憶に保存
    → 次回fear_weight上昇
    → 危険を避けるようになる

💦 疲れた（danger_fatigue）33%
    → energy減少
    → sadness上昇（疲れると悲しくなる）
    → 遠いものを避ける
    → 近いものを選ぶようになる

別のメカニズムで行動に影響：

痛い目に遭う → 次から怖い → 危険を避ける（恐怖記憶）
疲れる → 遠くまで行けない → 近いの選ぶ（体力消耗）

4. 環境が変われば性格も変わる

低エネルギー続き → 緑（安全）を選ぶ → safe_pref上昇
高エネルギー続き → 赤（好き）を選ぶ → safe_pref低下

痛い目に遭い続ける → fear_weight上昇 → 慎重になる
成功体験を積む → fear_weight低下 → 冒険的になる

環境 → 行動 → 記憶 → 変調値 → 行動（ループ）

クオリア（9種類）

基本2軸（Russell円環モデル）

valence: 快-不快 (-1 to 1)
arousal: 覚醒-沈静 (-1 to 1)

個別クオリア

クオリア	説明	減衰率	トリガー
fear	恐怖	0.9	痛み、危険ゾーン
desire	欲求	0.95	ゴール発見
surprise	驚き	0.7	新しいオブジェクト
curiosity	好奇心	0.98	未知の発見
urgency	緊急度	0.95	エネルギー低下
anger	怒り	0.85	痛み、NPCに邪魔される
sadness	悲しみ	0.92	疲労
joy	喜び	0.9	ゴール到達、好きな色取得
disgust	嫌悪	0.8	腐ったオブジェクト

減衰率が低い = 早く消える

ワールド要素

オブジェクト

🔴 赤ボール: 危険ゾーン内（リスクあり）
🔵 青ボール: 安全、やや遠い
🟢 緑ボール: 安全、近い
🟡 黄ボール: 腐ってる（disgustペナルティ-8）
🏁 ゴール: 到達で成功

危険ゾーン

💀 danger: 通過時に確率でダメージ
   - 33%: 痛い（fear/anger上昇）
   - 33%: 疲れる（energy減少、sadness上昇）
   - 33%: 何もなし

NPC

👤 ボブ: ランダムに動く
   - 衝突すると anger += 0.3
   - 移動がブロックされる
   - 「😠 ボブに邪魔された！」

忘却システム

# 毎セッション
fear_weight *= 0.95    # 5%減衰（最低1.0）
safe_preference *= 0.98  # 2%減衰（最低0.0）

効果：

トラウマも安全志向も時間で薄れる
→ ダイナミックなループが続く
→ 「たまに赤が復権」して葛藤が生まれる

スコア計算式

score = preference × 10 
      - distance × (0.5 + urgency)
      - danger_penalty × fear_weight   # 痛い経験で増加
      + safe_bonus × safe_preference   # 安全経験で増加
      - energy_penalty × (1 + energy_caution)
      - disgust_penalty                # 腐ってると-8×(1+disgust)

使い方

# 通常テスト（高E→低Eの2回）
python hida_unified.py

# 低エネルギー5回（慎重になる）
python hida_unified.py loop

# 高エネルギー5回（冒険的になる）
python hida_unified.py loop_high

# 記憶と変調値をリセット
python hida_unified.py reset

ollama使用

ollama pull gemma3:4b
python hida_unified.py

Claude API使用

# Windows
set ANTHROPIC_API_KEY=sk-ant-...

# Mac/Linux
export ANTHROPIC_API_KEY=sk-ant-...

python hida_unified.py

テスト結果例

痛い目に遭って慎重になる

セッション1: fear_weight=1.00 → 赤を取る
    ⚡ 痛い！ fear=0.55 anger=0.20
セッション2: fear_weight=1.10 → 赤を取る
    ⚡ 痛い！ fear=0.40
    💦 疲れた！ E=0.68 sadness=0.15
セッション3: fear_weight=1.20 → まだ赤
    ...
セッション5: fear_weight=1.80 → 緑を選ぶ！

途中で行動が変わる

Step 5: go_to_red（赤に向かう）
Step 6: ⚡ 痛い！ fear=0.40 anger=0.20
Step 7: ⚡ 痛い！ fear=0.99
Step 8: go_to_blue（青に切り替え！）

痛い目に遭った瞬間、行動が変わる。

NPCに邪魔される

Step 3: go_to_red
    😠 ボブに邪魔された！ anger=0.30
Step 5: 💭「怒りが少し高まっているが、恐怖の感覚は一切ない」

ゴール到達

Step 12: 🏆 ゴール到達！
    🎉 joy=0.50（目標達成）
    🎉 joy=0.80（好きな色だった！）
Step 15: 💭「喜びと安心感が微かに広がる」

ファイル構成

ファイル	説明
`hida_unified.py`	全層統合コード（L1〜L5 + LLM）
`hida_ltm.json`	長期記憶（自動生成）
`hida_modulation.json`	変調値（自動生成）

理論的意義

意識の役割

L5（意識）= L1〜L4の状態を自認 + 言語化 + コミュニケーション
         = 内部状態の「外部出力インターフェース」
         ≠ 判断する主体

LLM = 外付け言語野
    = 人間の言語野と同じ機能
    = 受け取った情報を言葉にするだけ

性格形成のメカニズム

DNA由来: color_preference（好み）
身体: energy, fatigue
記憶: LTM → 変調値

これらの数値の力学で行動が決まる
LLMは数値を見て言語化するだけ

痛みと疲労の分離

痛み = 恐怖の記憶（fear経由）→ 怒り（anger）も発生
疲労 = 身体の消耗（energy経由）→ 悲しみ（sadness）も発生

同じ「危険」でも別のメカニズムで行動に影響
人間と同じ

今後の拡張可能性

エネルギー回復

現状: 回復しない（バッテリー的）

拡張案:
- 充電スポット → energy回復
- 休憩アクション → fatigue回復  
- 食事オブジェクト → 両方回復

その他

- 複数エージェントの相互作用
- より複雑な環境（複数の危険ゾーン）
- 報酬の種類を増やす
- クオリアの行動への影響を増やす（anger高いと攻撃的？）
- 社会シミュレーション

ライセンス

MIT License

意識の5層モデルをPythonで実装する試み22

HIDA Unified - 5層意識モデル統合版

概要

アーキテクチャ

核心的発見

1. L5（意識）は判断しない

2. 記憶 → 数値変調 → 行動変化

3. 2種類のダメージ（痛みと疲労の分離）

4. 環境が変われば性格も変わる

クオリア（9種類）

基本2軸（Russell円環モデル）

個別クオリア

ワールド要素

オブジェクト

危険ゾーン

NPC

忘却システム

スコア計算式

使い方

ollama使用

Claude API使用

テスト結果例

痛い目に遭って慎重になる

途中で行動が変わる

NPCに邪魔される

ゴール到達

ファイル構成

理論的意義

意識の役割

性格形成のメカニズム

痛みと疲労の分離

今後の拡張可能性

エネルギー回復

その他

ライセンス

関連