はじめに
- 認知アーキテクチャとは知的行動の基盤となる構造とプロセスをモデル化する統合フレームワークである
- 単なるアルゴリズムと異なり、記憶・学習・推論・知覚など人間の心に類似した幅広い認知機能を提供する統一理論を目指している
- シンボリックシステムから始まり、ハイブリッドシステム、ニューラルフレームワークへと発展してきた
初期基盤:汎用問題解決機(GPS)(1957年)
- ニューウェル、サイモン、ショーによって開発された最初の汎用認知モデル
- 物理的シンボルシステムアプローチに基づき、シンボル操作から知的行動が生じるという考え方
- 特徴:
- ドメイン固有知識と汎用的問題解決エンジンの分離
- 手段-目的分析による状態空間の探索
- 初期状態から目標状態への変換を繰り返す
- サブゴール生成による複雑問題の分解
- ハノイの塔など定義された問題での成功
- 限界:複雑な問題での組み合わせ爆発
- 理論的影響:物理的シンボルシステム仮説の基礎となった
Soar:統一認知理論に向けて(1980年代)
- ライアード、ニューウェル、ローゼンブルームによる汎用的知的行動のための統一認知アーキテクチャ
- 基本的にはプロダクションシステムに基づくシンボリックアーキテクチャ
- 主要コンポーネント:
- ワーキングメモリ(現在の状態)
- プロダクションメモリ(if-thenルール)
- 意思決定サイクル(並列的マッチング、選択、適用)
- 行き詰まり(インパス)時の自動サブゴール生成
- チャンキング(問題解決から新ルールを学習)
- 後期バージョンでのエピソード記憶・意味記憶・強化学習の追加
- パズル解決から仮想エージェント、ロボット制御まで幅広い応用
- 「統一認知理論」の候補として提案された最初のアーキテクチャの一つ
ACT-R:心理学に根ざした認知アーキテクチャ(1990年代)
- アンダーソン(とルビエールら)による、認知心理学と人間学習に根ざしたアーキテクチャ
- 理論的背景:合理的分析(環境に最適化された適応としての認知プロセス)
- モジュール構造:
- 宣言的記憶モジュール(chunk形式の事実)
- 手続き的記憶モジュール(プロダクションルール)
- 目標モジュール(現在の意図維持)
- 視覚・聴覚・運動モジュール(知覚と行動)
- 特徴:
- バッファを通じたモジュール間通信
- シンボリックレベルとサブシンボリックレベルの両方を持つ
- 活性化値による記憶検索の確率的性質
- 生産的コンパイルによる学習
- 脳構造との対応付け(宣言的モジュール→海馬系、目標モジュール→前頭皮質など)
- 応用:記憶想起、視覚的注意、言語処理、問題解決、マルチタスキングなど
- 認知的チューターなど教育応用での成功
EPIC:人間の知覚とマルチタスキングのモデル化(1990年代)
- キエラスとメイヤーによる知覚・運動面に焦点を当てた詳細モデル
- 理論的動機:人間行動の詳細なタイミングを予測し、特に知覚-運動応答とマルチタスキングを解明
- 主要コンポーネント:
- 中央の認知プロセッサ(Soar/ACT-R風のルールエンジン)
- 並列動作する知覚プロセッサ(視覚、聴覚、触覚)
- 運動プロセッサ(手、発話、眼球など)
- 現実的な遅延を伴う処理(視覚オブジェクト認識に100ms程度など)
- 単一の中央ボトルネックがなく、複数の独立プロセッサによる並列性
- マルチタスキングと予測:
- タスクの組み合わせによる干渉パターンの説明
- 条件次第で「完全な時間共有」が可能なことを実証
- ヒューマンコンピュータインタラクション(HCI)と人間工学への応用
- ACT-Rに知覚-運動モジュール採用の影響を与えた
CLARION:暗黙的・明示的認知のハイブリッドアーキテクチャ(2000年代)
- ロン・サンらによる明示的知識と暗黙的知識の相互作用を強調したアーキテクチャ
- 「二重過程」理論に基づく:無意識的・直感的スキルと意識的・宣言的知識の相互作用
- 主要サブシステム:
- 行動中心サブシステム(ACS):スキルの学習と実行
- 非行動中心サブシステム(NACS):一般知識の学習と保存
- 動機サブシステム(MS):動機づけ、報酬、目標
- メタ認知サブシステム(MCS):他のサブシステムの監視と調整
- 特徴:
- 各サブシステム内の二層構造:暗黙的層(ニューラルネットワーク)と明示的層(シンボリックルール)
- ボトムアップ学習:暗黙知から明示知を抽出
- トップダウン指導:明示知が暗黙知の学習を誘導
- 応用:地雷原ナビゲーションなどのスキル学習、暗黙的学習の実験、意思決定、社会シミュレーション
Leabra/Emergent:生物学的ニューラルアーキテクチャ(2000年代)
- オライリーらによる神経科学に基づく認知アーキテクチャ
- Local, Error-driven and Associative, Biologically Realistic Algorithm(Leabra)
- 理論的アプローチ:既知の神経生物学に基づく認知モデル化
- アルゴリズム的特徴:
- 誤差駆動学習(バックプロパゲーションの生物学的類似)
- ヘブ学習(連合学習)
- 両者の組み合わせによる構造的規則性の発見と目標指向学習
- システムレベルの主要モジュール:
- 後部皮質ネットワーク(知覚と意味記憶)
- 海馬形成モジュール(エピソード記憶の迅速学習)
- 前頭皮質と基底核モジュール(ワーキングメモリと実行制御)
- 神経調節系(報酬と動機づけ)
- 応用:視覚的物体認識、意味記憶発達、エピソード記憶、ストループ課題、作業記憶とタスク切り替え
- SAL(ACT-RとLeabraの統合)プロジェクトによる異なるアプローチの統合
Sigma:大統一アーキテクチャへの取り組み(2010年代)
- ポール・ローゼンブルームによる確率的AIの考え方を活用した認知アーキテクチャ
- 設計思想:シンボリック認知アーキテクチャの強みと確率的グラフィカルモデル・ニューラルネットワークの強みの融合
- 核心:因子グラフ形式主義とメッセージ伝播アルゴリズム(和積アルゴリズム変種)
- 機能的エレガンス:一つの基礎計算で多様な知能機能を実現
- アーキテクチャの構成:
- 知識レベル(認知コンテンツ)と因子グラフエンジン(ファームウェア)
- 変数間の関係を表す因子グラフ(論理命題からセンサー値まで)
- 認知サイクル:グラフ推論処理とグラフ修正フェーズ
- 学習:因子関数の勾配降下学習と構造学習
- 宣言的長期記憶、ワーキングメモリ、エピソード記憶の実装
- 応用:論理パズル、空間推論、メンタルイメージ、強化学習、仮想アバターとの統合
- 以前のアーキテクチャ(Soar、ACT-Rなど)から得た教訓を取り入れた設計
パラダイムシフトと統一への取り組み
- 認知アーキテクチャパラダイムの明確な変遷:
- 1950年代〜1970年代:純粋にシンボリック(GPS)
- 1980年代:シンボリックアプローチを維持しつつ統合と心理学的妥当性を重視(SoarとACT-R)
- 1990年代:知覚-運動インターフェースと精密なタイミングの重要性認識(EPIC)
- 2000年代:ハイブリッドアーキテクチャへの関心(CLARION)と神経レベルの記述へのシフト(Leabra)
- 2010年代:表現形式だけでなく機能性の統一を目指す(Sigma)
- 収束傾向:
- ACT-RとLeabraは起源が異なるが高レベルの労働分担で類似し、ハイブリッド化も実現(SAL)
- 「心の標準モデル」提案:複数のアーキテクチャプロジェクトから共通原則を特定
- ワーキングメモリと長期記憶の区別
- 数十ミリ秒のオーダーの認知サイクル
- シンボリック表現と統計的学習の統合
- 評価と比較:
- 共通タスクでのアーキテクチャの比較
- 異なる強みを持つアーキテクチャの相互影響
- 統合の試み:SAL、CogPrime/OpenCog、LIDA
- 1957年から現在までの発展は、単純なシンボリックな問題解決から心の複雑さを説明しようとする包括的なハイブリッドシステムへの進化を示している
- 各アーキテクチャの貢献:
- GPS:知識と戦略の分離
- Soar:統一された問題空間探索とチャンキング
- ACT-R:人間の認知を反映するモジュール性と定量的予測
- EPIC:知覚-運動の統合と並列性
- CLARION:二重処理の暗黙的-明示的相乗効果
- Leabra:生物学的妥当性とニューラル学習
- Sigma:異なる機能の数学的統一
- 究極的な目標は、計算的に基づき、認知的に正確で、神経学的に現実的な統一された知能理論の構築