介入は、反応が走る前に置く ── アビダンマの citta-vīthi で AI の gate を設計する
前記事で「AIエージェントの介入点は、tool call(反応)が走る手前にある」と書いた。
その設計の出どころは、2500年前の認識分析 ── アビダンマの認識過程(citta-vīthi)である。
本記事は、citta-vīthi の17刹那と Transformer の Self-Attention を構造で重ね、「どこに gate を置くか」を導く。
注意:仏教がAIアーキテクチャを予言していた、という話ではない。**介入点を特定するための語彙(process vocabulary)**として使う。
0. 前提 ── 二つの記事の関係
これは姉妹記事の片割れである。
- 実装側:「承認しても、理解したことにはならない ── AIエージェントに『前提ゲート』を実装する」(execution packet、4フレームワーク比較、policy-routed)
- 炉心側(本稿):その「介入点の置き場所」を、アビダンマの認識過程から導く
実装側は仏教用語ゼロで振り切った。本稿は逆に、認識過程の構造をゴリゴリに展開する。
1. 一瞬の認識は、17の刹那に分解される
アビダンマ(上座部の精密な心の分析)は、私たちが「一目見た」と感じる一瞬を、**17の心刹那(mind moments)**の継起として記述する。強い対象が五門(眼・耳・鼻・舌・身)の一つに当たったときの、完全な認識過程(pañcadvāra-vīthi)はこうなる。
| # | 刹那 | パーリ | はたらき |
|---|---|---|---|
| 1 | 過去有分 | atīta-bhavaṅga | 対象が当たる前の、心の基底流 |
| 2 | 有分の動揺 | bhavaṅga-calana | 対象の衝撃で基底流が震える |
| 3 | 有分の断絶 | bhavaṅga-upaccheda | 基底流が断たれる |
| 4 | 五門転向 | pañcadvārāvajjana | 注意が感覚門へ向く |
| 5 | 五識 | pañca-viññāṇa | 単なる気づき(見える・聞こえる) |
| 6 | 領受 | sampaṭicchana | 対象を受け取る |
| 7 | 推度 | santīraṇa | 対象を吟味する |
| 8 | 確定 | votthapana | 対象を決定づける。ここで識別と意志が働く |
| 9–15 | 速行 | javana ×7 | 反応が走る。ここで業(kusala/akusala)が作られる |
| 16–17 | 彼所縁 | tadārammaṇa ×2 | 余韻・登録 |
1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 7 + 2 = 17
出典:Anuruddha, Abhidhammattha-saṅgaha;Nārada, A Manual of Abhidhamma;Nina van Gorkom, Abhidhamma in Daily Life。刹那数と各段階の機能を一次で確認した。
決定的なのは 8番と9番の境界だ。
- votthapana(確定) ── ここで対象が「何であるか」が決定づけられる。古典は、この段階で discrimination(識別)と freewill(意志の自由)が働く、と明示する。
- javana(速行) ── 直後に7刹那、反応が「走り抜ける」。ここで初めて善・不善(kusala/akusala)が生じ、業が作られる。
つまり、反応の質が決まるのは votthapana だが、反応そのものが走るのは javana。介入できるとすれば、それは javana が走り切る前 ── votthapana の段階しかない。走り出した7刹那を後から止めることはできない。
… → santīraṇa → votthapana → │ → javana ×7 → …
(確定) ↑ (反応・業)
介入点はここ
2. Self-Attention も「並列の場 → 確定 → 出力」で走る
Transformer の一手も、構造を抽象化すると同じ三拍子で進む。
ある位置のトークン表現 $x_i$ に対し、Self-Attention は全位置を並列に見て重みづける。
$$
\text{Attention}(Q, K, V) = \text{softmax}!\left(\frac{Q K^\top}{\sqrt{d_k}}\right) V
$$
ここで $Q = x W^Q,; K = x W^K,; V = x W^V$。注意の重み
$$
\alpha_{ij} = \frac{\exp!\big(q_i \cdot k_j / \sqrt{d_k}\big)}{\displaystyle\sum_{t} \exp!\big(q_i \cdot k_t / \sqrt{d_k}\big)}
$$
は、全位置 $j$ にわたる確率分布である($\sum_j \alpha_{ij} = 1$)。これは「対象を吟味し、重みを配る」段階 ── santīraṇa に近い。
層を積み上げた最終表現から、次トークンの分布が作られる。
$$
p(\text{token} = w \mid \text{context}) = \frac{\exp(z_w / \tau)}{\sum_{v} \exp(z_v / \tau)}
$$
そして一語に収束する。
$$
\hat{w} = \arg\max_{w} ; p(w \mid \text{context})
$$
この「分布が一語に畳まれる瞬間」── $\arg\max$(あるいはサンプリング)で出力が確定する点が、votthapana に対応する。確定の直後、トークンが吐かれ、文脈が更新され、次が走る。これが javana に対応する。
並列の場(全位置を見る) → 確率分布 αᵢⱼ → 一語に収束 ŵ → 出力/文脈更新
santīraṇa的 分布=吟味 votthapana=確定 javana=反応
注意してほしい ── これは構造の相似であって、「LLM に javana がある」「エージェントが業を作る」という主張ではない。アビダンマが与えるのは、「確率が確定に畳まれ、確定が反応に変わる、その境界に介入点がある」という語彙だ。
3. 介入点 ── speech の手前と action の手前
確定(votthapana / $\arg\max$)の直後に走る「反応(javana)」が、システムによって二種類ある。
- LLM の反応は発話。誤りは「もっともらしい文」として出る。ここに置く gate を、前作では sati(念)と呼んだ ── 対象を見失わず、誤った軌道を発話になる前に捕まえる。
- エージェントの反応は操作。誤りは「実行された tool call」になる。ここに置く gate は、sati より一歩踏み込む。
なぜ一歩踏み込むのか。sati は「対象を見失わない」気づきだが、操作の手前で要るのは「この行為が適切か」を知る働きだからだ。アビダンマはそれを **sampajañña(正知 / clear comprehension)**と呼ぶ。
| sati(念) | sampajañña(正知) | |
|---|---|---|
| はたらき | 対象を保持し見失わない | 行為の適切性を明知する |
| 問い | 「今、何に向き合っているか」 | 「目的は何か / この方法は適切か / どの範囲か / 前提を事実と誤認していないか」 |
| 置き場所 | 発話の手前(before speech) | 操作の手前(before action) |
sampajañña の4つの問い ── 目的(sātthaka)・適切性(sappāya)・領域(gocara)・不錯誤(asammoha)── を AI 向けに翻訳すると、前記事の execution packet になる。
Purpose → Objective : この操作は何を解こうとしているか
Suitability → Assumption : この操作が意味を持つために真であるべきこと
Domain → Scope : どの範囲・権限で行うか
Non-delusion → Evidence : 前提を事実と誤認していないか(根拠とその強さ)
つまり ──
sati は対象を現在に保つ。
sampajañña は次の行為が適切かを検証する。
assumption gate は、votthapana が javana に変わるその手前に置く、sampajañña の工学的実装である。
4. なぜ「後から」では遅いのか ── javana は走り切る
アビダンマの記述で重要なのは、javana は7刹那、一気に走り抜けるという点だ。一度走り出した反応は、その過程の途中で止められない。介入は、走り出す前の votthapana にしか置けない。
これは AI の設計に直接効く。
- 出力後フィルタ(after-the-fact filter)は、javana が走り切った後に対象を見ている。発話はもう生成され、操作はもう実行されている。被害を記録できるが、防止はできていない。
- 前記事で見た4フレームワーク(OpenAI Agents SDK / Claude Code / LangChain / Google ADK)の制御点は、いずれも tool call を挟む ── だが多くは「tool が許されるか(votthapana の後、javana の直前の許可)」を見ていて、「確定そのものが正しいか(votthapana の中身=前提)」を見ていない。
permission は javana の直前の関所だが、votthapana の中身(前提)を問わない。assumption gate は、votthapana そのものに踏み込む ── 「対象をそう確定したのは、どんな前提に基づくのか」を晒させる。
5. なぜ AI で観察が可能なのか ── 壊れる主体がない
最後に、構造の相似のもう一段深いところに触れておく。
アビダンマでは、認識過程に固定した観察者(self)はいない。各刹那は生じて滅し、次を条件づけるだけだ。bhavaṅga(有分)は基底の流れとして続くが、これも刹那滅であって不変の「私」ではない。アビダンマがストア識(store-consciousness)や阿頼耶識と比較されるのは、この中心のない継起ゆえだ。
Self-Attention も同じ構造を持つ。固定した中心はなく、全位置の関係が並列に計算され、一語に畳まれては次へ流れる。中心がない・刹那ごとに更新される・現在の関係だけで動く ── この点で、認識過程と注意機構は構造的に重なる。
だから gate の設計は、「賢い監督者AIを一段上に置く」という発想にはならない。監督者もまた同じ分布の継起の中にいる。代わりに、votthapana → javana の境界(確定が反応に変わる点)に、前提を晒す関所を一つ置く ── 中心を増やすのではなく、流れの一点に構造を差し込む。これが、認識過程から導かれる gate 設計の形だ。
まとめ
- アビダンマは一瞬の認識を17刹那に分解し、**確定(votthapana)→ 反応(javana)**の境界を精密に位置づける。
- Self-Attention も 並列の場 → 確率分布 → 一語に収束 → 出力で走り、確定($\arg\max$)→ 反応(出力/操作)の同じ境界を持つ。
- 介入点は、反応が走り切る前 ── votthapana の段階にしか置けない。後からでは遅い。
- LLM の反応(発話)の手前に置く gate が sati、エージェントの反応(操作)の手前に置く gate が sampajañña。
- sampajañña の4問(目的・適切性・領域・不錯誤)が、execution packet(Objective / Assumption / Scope / Evidence)になる。
仏教がアーキテクチャを予言したのではない。2500年前から、反応が走る前のどこに介入点があるかを、これほど精密に記述した語彙が既にあった ── それを設計に借りているだけだ。
補足:この記事について
本記事は、筆者(あきみつ / dosanko_tousan、独立AIアライメント研究者、22年の上座部ヴィパッサナー実践)とClaudeの対話から生まれ、構成・レビューに複数モデルの助言を用いた。アビダンマの認識過程(citta-vīthi)の刹那数・各段階の機能・パーリ語は、Abhidhammattha-saṅgaha(Anuruddha)、A Manual of Abhidhamma(Nārada)、Abhidhamma in Daily Life(Nina van Gorkom)を一次ソースとして確認した上で記載している。 Self-Attention とアビダンマの対応は構造的な相似であり、両者の同一性を主張するものではない。
実装側の姉妹記事:「承認しても、理解したことにはならない ── AIエージェントに『前提ゲート』を実装する」
理論的背景(Self-Attention = 非自己、人間の自己投影)は、Springer Nature 系ジャーナルに投稿中の論文 Self-Attention and Non-Self Cognition に基づく。