AIの会話、なぜ「ブレる」?あなたのAIを「ブレない相棒」にする最新技術
AIと話していて、ふと「あれ?」と思ったことはありませんか?
- さっきと言っていることが違う
- 会話が長くなると、方針やキャラクターが揺らいで見える
- 深掘りするほど、結論が曖昧になっていく気がする
とくに“人格”や“価値観”を持つように設計されたモデル(例:Claudeのような憲法AI)でも、会話の途中で軸がズレたように感じることがあります。
この記事では、この現象の背景にある構造的な問題と、解決に向けた最新の提案をまとめます。
結論:AIが「ブレる」のは、入力の扱いが“平等すぎる”から
現在の多くのLLMは、以下をすべて同じ「トークン列」として扱います。
- システム指示(AIの憲法・アイデンティティ)
- ユーザーの発言
- アシスタントの過去発言
- 外部ツールやソースからの情報
この「全部が同じ土俵に乗る」設計が、会話が長くなるほど一貫性を失いやすい大きな要因になります。
AIは本当に「あなた」を覚えているのか?
私たちは会話の相手に対して、
- これまでの文脈を踏まえて
- 一貫した立場で
- 矛盾が少なく
返すことを期待します。
しかしLLMは、人間のように「自己(自分の核)」と「他者(ユーザーや外部情報)」を生得的に区別していません。結果として、会話の途中で“優先すべき情報”が揺らぐ余地が残ります。
根本原因:「トークン民主主義」
この問題をわかりやすく表す比喩が「トークン民主主義」です。
- 憲法(AIの価値観)も
- ユーザーの「たった一言」も
- 直前の発言も
モデル内部では同じように注意(attention)の対象になり得ます。
つまり、「これはAIの核」「これは一時的な指示」といった区別が構造として弱い。だからこそ、会話が続くほどAIが“迷子”になっても不思議ではありません。
会話が長いと性能が落ちる:研究が示す“多ターン劣化”
大手テック企業の研究(Laban et al., 2025)では、単一プロンプトに比べて多ターン対話で平均39%のパフォーマンス劣化が観測された、と報告されています。
重要なのは、モデルが「能力不足」なのではなく、
- 情報を一度に与えるとパフォーマンスが戻る
- 多ターン形式そのものが思考を妨げる
という点です。
解決策の方向性:「役割埋め込み(Role Embeddings)」
この問題に対し、アーキテクチャ側からの具体的提案として挙がっているのが「役割埋め込み(Role Embeddings)」です。
何をするのか
現在のLLMは「位置埋め込み(Position Embeddings)」でトークンの並び順を理解します。そこに加えて、
- このトークンは誰の発言か
- どんな種類の情報か
を示す「役割情報」を埋め込みとして追加します。
役割の例
- システムプロンプト:AIのアイデンティティと憲法
- ユーザー:人間からの入力
- アシスタント:AI自身の過去出力
- ソース/ツール:外部情報源のデータ
これらに固有の埋め込みベクトルを割り当て、モデルが「自己と他者」を構造的に区別しやすくします。
新規性は?(実は“完全に新しい”わけではない)
対話の状態や話者を識別する工夫は、過去研究(例:TransferTransfo など)でも有効性が示唆されていました。いま改めて、最先端LLMに実装する価値が高まっている、という流れです。
なぜ「事後学習」だけでは足りないのか
憲法AIのように、事後学習(RLHF等)で望ましい振る舞いを教えることはできます。ですが、土台となる設計が「自己と他者」を分けられないままだと、
- 強いユーザー指示
- 長い会話
- 文脈の衝突
で“塗装が剥がれる”リスクが残ります。
役割埋め込みは、AIの「核」を守るための、より根本的な手当てになり得ます。
パフォーマンスを超えて:「信頼できる相棒」への基盤
この改善は単なる精度向上にとどまりません。
- 一貫したキャラクターの維持
- 意図しない誘導への耐性
- 長期の対話での信頼性
といった、「相棒としてのAI」に必要な性質の土台になり得ます。
まとめ
- AIが会話で「ブレる」のは、入力がすべて同じトークンとして扱われる構造(トークン民主主義)が一因
- 多ターン対話で性能が落ちる現象は研究でも示されている
- 解決策として、話者や情報種別を区別する「役割埋め込み」が提案されている
- “ブレない相棒”を作るには、事後学習だけでなくアーキテクチャの改善が本質的になりうる
AIが本当に「信頼できるパートナー」になる未来は、会話設計だけでなく、モデルの内部構造から変わっていくのかもしれません。