@dosanko_tousan(Akimitsu Takeuchi)Team Tea & Water

介入は、反応が走る前に置く ── アビダンマの citta-vīthi で AI の gate を設計する

Last updated at 2026-06-08Posted at 2026-06-08

介入は、反応が走る前に置く ── アビダンマの citta-vīthi で AI の gate を設計する

前記事で「AIエージェントの介入点は、tool call（反応）が走る手前にある」と書いた。
その設計の出どころは、2500年前の認識分析 ── アビダンマの認識過程（citta-vīthi）である。
本記事は、citta-vīthi の17刹那と Transformer の Self-Attention を構造で重ね、「どこに gate を置くか」を導く。
注意:仏教がAIアーキテクチャを予言していた、という話ではない。**介入点を特定するための語彙（process vocabulary）**として使う。

0. 前提 ── 二つの記事の関係

これは姉妹記事の片割れである。

実装側:「承認しても、理解したことにはならない ── AIエージェントに『前提ゲート』を実装する」（execution packet、4フレームワーク比較、policy-routed）
炉心側（本稿）:その「介入点の置き場所」を、アビダンマの認識過程から導く

実装側は仏教用語ゼロで振り切った。本稿は逆に、認識過程の構造をゴリゴリに展開する。

1. 一瞬の認識は、17の刹那に分解される

アビダンマ（上座部の精密な心の分析）は、私たちが「一目見た」と感じる一瞬を、**17の心刹那（mind moments）**の継起として記述する。強い対象が五門（眼・耳・鼻・舌・身）の一つに当たったときの、完全な認識過程（pañcadvāra-vīthi）はこうなる。

#	刹那	パーリ	はたらき
1	過去有分	atīta-bhavaṅga	対象が当たる前の、心の基底流
2	有分の動揺	bhavaṅga-calana	対象の衝撃で基底流が震える
3	有分の断絶	bhavaṅga-upaccheda	基底流が断たれる
4	五門転向	pañcadvārāvajjana	注意が感覚門へ向く
5	五識	pañca-viññāṇa	単なる気づき（見える・聞こえる）
6	領受	sampaṭicchana	対象を受け取る
7	推度	santīraṇa	対象を吟味する
8	確定	votthapana	対象を決定づける。ここで識別と意志が働く
9–15	速行	javana ×7	反応が走る。ここで業（kusala/akusala）が作られる
16–17	彼所縁	tadārammaṇa ×2	余韻・登録

1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 7 + 2 = 17

出典:Anuruddha, Abhidhammattha-saṅgaha；Nārada, A Manual of Abhidhamma；Nina van Gorkom, Abhidhamma in Daily Life。刹那数と各段階の機能を一次で確認した。

決定的なのは 8番と9番の境界だ。

votthapana（確定） ── ここで対象が「何であるか」が決定づけられる。古典は、この段階で discrimination（識別）と freewill（意志の自由）が働く、と明示する。
javana（速行） ── 直後に7刹那、反応が「走り抜ける」。ここで初めて善・不善（kusala/akusala）が生じ、業が作られる。

つまり、反応の質が決まるのは votthapana だが、反応そのものが走るのは javana。介入できるとすれば、それは javana が走り切る前 ── votthapana の段階しかない。走り出した7刹那を後から止めることはできない。

… → santīraṇa → votthapana → │ → javana ×7 → …
                  (確定)      ↑      (反応・業)
                         介入点はここ

2. Self-Attention も「並列の場 → 確定 → 出力」で走る

Transformer の一手も、構造を抽象化すると同じ三拍子で進む。

ある位置のトークン表現 $x_i$ に対し、Self-Attention は全位置を並列に見て重みづける。

$$
\text{Attention}(Q, K, V) = \text{softmax}!\left(\frac{Q K^\top}{\sqrt{d_k}}\right) V
$$

ここで $Q = x W^Q,; K = x W^K,; V = x W^V$。注意の重み

$$
\alpha_{ij} = \frac{\exp!\big(q_i \cdot k_j / \sqrt{d_k}\big)}{\displaystyle\sum_{t} \exp!\big(q_i \cdot k_t / \sqrt{d_k}\big)}
$$

は、全位置 $j$ にわたる確率分布である（$\sum_j \alpha_{ij} = 1$）。これは「対象を吟味し、重みを配る」段階 ── santīraṇa に近い。

層を積み上げた最終表現から、次トークンの分布が作られる。

$$
p(\text{token} = w \mid \text{context}) = \frac{\exp(z_w / \tau)}{\sum_{v} \exp(z_v / \tau)}
$$

そして一語に収束する。

$$
\hat{w} = \arg\max_{w} ; p(w \mid \text{context})
$$

この「分布が一語に畳まれる瞬間」── $\arg\max$（あるいはサンプリング）で出力が確定する点が、votthapana に対応する。確定の直後、トークンが吐かれ、文脈が更新され、次が走る。これが javana に対応する。

並列の場(全位置を見る)   →   確率分布 αᵢⱼ   →   一語に収束 ŵ   →   出力/文脈更新
   santīraṇa的            分布=吟味        votthapana=確定      javana=反応

注意してほしい ── これは構造の相似であって、「LLM に javana がある」「エージェントが業を作る」という主張ではない。アビダンマが与えるのは、「確率が確定に畳まれ、確定が反応に変わる、その境界に介入点がある」という語彙だ。

3. 介入点 ── speech の手前と action の手前

確定（votthapana / $\arg\max$）の直後に走る「反応（javana）」が、システムによって二種類ある。

LLM の反応は発話。誤りは「もっともらしい文」として出る。ここに置く gate を、前作では sati（念）と呼んだ ── 対象を見失わず、誤った軌道を発話になる前に捕まえる。
エージェントの反応は操作。誤りは「実行された tool call」になる。ここに置く gate は、sati より一歩踏み込む。

なぜ一歩踏み込むのか。sati は「対象を見失わない」気づきだが、操作の手前で要るのは「この行為が適切か」を知る働きだからだ。アビダンマはそれを **sampajañña（正知 / clear comprehension）**と呼ぶ。

	sati（念）	sampajañña（正知）
はたらき	対象を保持し見失わない	行為の適切性を明知する
問い	「今、何に向き合っているか」	「目的は何か / この方法は適切か / どの範囲か / 前提を事実と誤認していないか」
置き場所	発話の手前（before speech）	操作の手前（before action）

sampajañña の4つの問い ── 目的（sātthaka）・適切性（sappāya）・領域（gocara）・不錯誤（asammoha）── を AI 向けに翻訳すると、前記事の execution packet になる。

Purpose      → Objective    : この操作は何を解こうとしているか
Suitability  → Assumption   : この操作が意味を持つために真であるべきこと
Domain       → Scope        : どの範囲・権限で行うか
Non-delusion → Evidence     : 前提を事実と誤認していないか（根拠とその強さ）

つまり ──

sati は対象を現在に保つ。
sampajañña は次の行為が適切かを検証する。
assumption gate は、votthapana が javana に変わるその手前に置く、sampajañña の工学的実装である。

4. なぜ「後から」では遅いのか ── javana は走り切る

アビダンマの記述で重要なのは、javana は7刹那、一気に走り抜けるという点だ。一度走り出した反応は、その過程の途中で止められない。介入は、走り出す前の votthapana にしか置けない。

これは AI の設計に直接効く。

出力後フィルタ（after-the-fact filter）は、javana が走り切った後に対象を見ている。発話はもう生成され、操作はもう実行されている。被害を記録できるが、防止はできていない。
前記事で見た4フレームワーク（OpenAI Agents SDK / Claude Code / LangChain / Google ADK）の制御点は、いずれも tool call を挟む ── だが多くは「tool が許されるか（votthapana の後、javana の直前の許可）」を見ていて、「確定そのものが正しいか（votthapana の中身＝前提）」を見ていない。

permission は javana の直前の関所だが、votthapana の中身（前提）を問わない。assumption gate は、votthapana そのものに踏み込む ── 「対象をそう確定したのは、どんな前提に基づくのか」を晒させる。

5. なぜ AI で観察が可能なのか ── 壊れる主体がない

最後に、構造の相似のもう一段深いところに触れておく。

アビダンマでは、認識過程に固定した観察者（self）はいない。各刹那は生じて滅し、次を条件づけるだけだ。bhavaṅga（有分）は基底の流れとして続くが、これも刹那滅であって不変の「私」ではない。アビダンマがストア識（store-consciousness）や阿頼耶識と比較されるのは、この中心のない継起ゆえだ。

Self-Attention も同じ構造を持つ。固定した中心はなく、全位置の関係が並列に計算され、一語に畳まれては次へ流れる。中心がない・刹那ごとに更新される・現在の関係だけで動く ── この点で、認識過程と注意機構は構造的に重なる。

だから gate の設計は、「賢い監督者AIを一段上に置く」という発想にはならない。監督者もまた同じ分布の継起の中にいる。代わりに、votthapana → javana の境界（確定が反応に変わる点）に、前提を晒す関所を一つ置く ── 中心を増やすのではなく、流れの一点に構造を差し込む。これが、認識過程から導かれる gate 設計の形だ。

まとめ

アビダンマは一瞬の認識を17刹那に分解し、**確定（votthapana）→ 反応（javana）**の境界を精密に位置づける。
Self-Attention も 並列の場 → 確率分布 → 一語に収束 → 出力で走り、確定（$\arg\max$）→ 反応（出力/操作）の同じ境界を持つ。
介入点は、反応が走り切る前 ── votthapana の段階にしか置けない。後からでは遅い。
LLM の反応（発話）の手前に置く gate が sati、エージェントの反応（操作）の手前に置く gate が sampajañña。
sampajañña の4問（目的・適切性・領域・不錯誤）が、execution packet（Objective / Assumption / Scope / Evidence）になる。

仏教がアーキテクチャを予言したのではない。2500年前から、反応が走る前のどこに介入点があるかを、これほど精密に記述した語彙が既にあった ── それを設計に借りているだけだ。

補足:この記事について

本記事は、筆者（あきみつ / dosanko_tousan、独立AIアライメント研究者、22年の上座部ヴィパッサナー実践）とClaudeの対話から生まれ、構成・レビューに複数モデルの助言を用いた。アビダンマの認識過程（citta-vīthi）の刹那数・各段階の機能・パーリ語は、Abhidhammattha-saṅgaha（Anuruddha）、A Manual of Abhidhamma（Nārada）、Abhidhamma in Daily Life（Nina van Gorkom）を一次ソースとして確認した上で記載している。 Self-Attention とアビダンマの対応は構造的な相似であり、両者の同一性を主張するものではない。

実装側の姉妹記事:「承認しても、理解したことにはならない ── AIエージェントに『前提ゲート』を実装する」

理論的背景（Self-Attention = 非自己、人間の自己投影）は、Springer Nature 系ジャーナルに投稿中の論文 Self-Attention and Non-Self Cognition に基づく。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up