固定重み×3D格子×予測誤差readout：Monolith（生成しないAI）の実験メモ

Posted at 2026-01-01

※これは個人の実験メモです（論文でも製品でもありません）。追試・関連研究の指摘・改善案、大歓迎です。

TL;DR（3行）

深層学習（Backprop）は強力ですが、ハードウェア目線では「グローバルな誤差伝搬」「配線の複雑さ」「計算・電力コスト」が気になります。
一方、生体の脳は局所的な誤差（予測誤差）を手掛かりに動いているように見える——という直感があります。

そこで今回は、予測符号化（Predictive Coding）っぽい誤差の扱いと、リザーバー計算（Reservoir Computing）の固定重みを合体させて、
「局所配線だけで回る」「誤差の場で認識する」モデルを作ってみました。

入力は z=0 層に投影し、内部状態を DIGIT_STEPS 回反復して落ち着かせます（内部に“波”や“反響”が出るイメージ）。

ポイントは、内部状態 p そのものを読まずに、予測誤差（loss）を読むことです。

Monolithでは「教師ラベルに対する誤差」を直接使うのではなく、局所的な“駆動（drive）”と予測のズレを 誤差（驚き）の流れとして定義します。

近傍集合を N(i) として、

分類は、反復後の loss（例：最終ステップの loss ベクトル、あるいはステップ平均）を特徴量として、線形分類します。

Digitsで試したところ、

という挙動を確認しました。

直感的には、固定リザーバーが入力を高次元へ射影し、さらに「誤差の干渉縞」みたいな模様が出ることで、線形分離しやすい特徴空間が得られているのかもしれません。

また、DIGIT_STEPS を層数以上にすると深層部まで信号が届き、反響（Feedback）によって数字固有の“定常波”っぽいものが出る気配がありました（Z方向の活性分布を観察）。

Monolithは（少なくとも思想として）以下がハード実装と相性が良いです。

もちろん「今すぐスマホサイズの外部脳が作れる」という話ではないですが、
“データセンターで巨大に学習させる生成AI”とは別方向の、物理的に置ける知能として面白いと思っています。

このモデルは発振・飽和に落ちる可能性があり、特に X（XOR系の変化検出ユニット）がチカチカして発振に寄る感触があります。

今後やりたい／議論したいのは以下です。

追試用コードはnoteに置きます。

実行例：

python monolith_nn15.py

Monolithは「学習で結線を変える」よりも、固定された複雑な編み目の中に“誤差（驚き）の波”を流し込むことで認識を立ち上げる、という発想の実験です。

追試報告・関連研究リンク・「それ既知だよ」も含めて、何でも歓迎です。コメント欄などで教えてください。