複素波埋め込みによる意味検索手法「ResonanceDB」

Posted at 2025-12-09

Wave-Based Semantic Memory

背景

意味検索では、多くのシステムがembeddingを保存し、cosine similarityによって検索対象との距離を測ってきた。
この方式は高速で計算資源の節約にも優れる。しかし以下の問題がある。

意味が持つ否定や強調といった変化が数値空間上で潰れる
not happy が happy の近くに配置され、極性が区別されにくい
文脈変化を方向ベクトルだけで表すため、意味操作が失われる

この問題に対し、本研究は次の視点を導入する。

意味は点ではなく、揺らぎ（波）として扱う方が、言語的差異を適切に表現できる。

提案手法 Wave-Based Semantic Memory は、埋め込みを複素数の波に変換し、
波同士の干渉の強さを用いて類似度を評価する。
これにより、従来埋もれていた「否定の効果」「強弱の差」「文脈シフト」を数値として表現できる。

提案手法

Wave-Based Semantic Memory の中心は、WavePattern 表現と Resonance Score による検索で成立している。

WavePattern の全体像

埋め込みベクトルの各次元 (x) を以下の複素波形として扱う。

$\psi(x) = A(x)e^{i\phi(x)}$

Amplitude (A(x)) : 意味の強さ
Phase (ϕ(x)) : 文脈や極性の方向性

図1：WavePattern Schema（page 2）

上段：Amplitude（意味の強度）
中段：Phase（否定や文脈のずれを示す）
下段：両者を合わせた複素平面上での波形

注目点

従来の実数ベクトルが無視していた符号や意味操作を、そのまま状態として保持できる
“not” の効果は、位相の反転として自然に定義できる
意味間の差は「距離」ではなく「波の重ね合い」の強さで決まる

Resonance-Based Retrieval

提案手法は、二つの波形がどれだけ強く共鳴（干渉）するかで意味の近さを評価する。

$S(\psi_1, \psi_2) =
\frac{1}{2}
\cdot
\frac{\sum_x \left|\psi_1(x) + \psi_2(x)\right|^2}
{\sum_x \left(|\psi_1(x)|^2 + |\psi_2(x)|^2 \right)}
\cdot R$

ここで (R) は強度バランスの調整項。
直感的には次のように解釈できる。

位相一致 → 強く重なる → 高スコア
位相反転 → 打ち消し合う → 低スコア

図2：位相差と共鳴強度の関係（page 3）

位相差 δ が 0 → 共鳴が最大
位相差 δ が π → 共鳴が最小

注目点

cosine similarity では反意語を分離できない
resonance では否定・逆方向性を強く区別できる
「真逆」が数学的に自然に現れる

実験結果

提案手法は 否定（NEG）、文脈シフト（SHIFT）、**強調/弱化（INT_UP / INT_DOWN）**を加えた語群を対象に比較を行った。
比較対象は cosine similarity。

図3：距離分布比較（Figure 4, page 4）

各操作語の距離分布を示すヒストグラム
左が cosine、右が resonance

注目点

cosine は全てが同程度の距離 → 意味操作の違いを区別できていない
resonance は操作ごとに帯域が分離 → 否定と強調を識別可能
NEG が最も離れ、SHIFT が中間に位置する
人間が感じる意味差と整合

図4：語群の構造比較（Figure 5, page 5）

語間距離のヒートマップ
cosine（左）は一様
resonance（右）はブロック構造が出現

注目点

意味操作ごとに固有の群が生まれる
逆位相語が独立した領域を形成
分類や検索が行いやすい空間が得られる

従来手法との違い（まとめ）

観点	cosine similarity	resonance-based retrieval
表現単位	実数ベクトル	複素数波形
否定（極性）	区別困難	位相反転で明確
強弱	距離変化に埋没	振幅で直接表現
文脈変調	捉えにくい	位相差で表現可能
類似度定義	幾何的距離	干渉エネルギー

論文に基づく今後の展望

実装は CPU 完結で動作し、今後 SIMD により高速化可能
RAG（検索拡張生成）との統合で効果が期待できる
位相推定手法の改善により精度向上が見込まれる

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up