はじめに
はじめまして、Orbitics株式会社データサイエンス部の上野です。
本記事では、生成AI、特に RAG(Retrieval-Augmented Generation)モデル における「参照ドキュメントへの依存度」について解説します。
以前の記事では以下のような内容を扱いました:
- RAGの基礎を理解する Part1:RAGの基本概念
- RAGの基礎を理解する Part2:RAGシステムの品質評価
本記事では、RAGにおける ハルシネーションの抑制 と 回答の柔軟性 というトレードオフを軸に、依存度の分類とそれぞれに対応するプロンプトの設計方法を紹介します。
参照ドキュメントへの依存度レベルの分類
RAGの挙動は、プロンプトでどのように依存度を指示するかによって大きく変化します。本記事では、依存度を以下の3レベルに分類します:
- レベル1:柔軟性重視
- レベル2:バランス重視
- レベル3:ハルシネーション抑制重視
レベル1:柔軟性重視(最も自由度が高い)
概要
このレベルでは、参照ドキュメントを単なる参考情報として扱い、AIの知識や推論を最大限に活用します。単なる要約や事実の抽出にとどまらず、AIが持つ一般的な知識(技術トレンド、ユーザー需要など)との組み合わせを促すことで、新しいアイデアやコンセプトの提案を期待する点が特徴です。
プロンプト例
あなたは次世代スマートデバイス開発におけるプロダクトマネージャーです。
以下の[参照ドキュメント]は、既存製品「Alphaシリーズ」の仕様と特徴を記載した資料です。
この情報を参考にしつつ、あなたが持つ技術トレンド、ユーザー需要、マーケット知識を活用して、
「次世代Alphaシリーズの新モデル(仮称:Alpha X)」の製品コンセプトを提案してください。
具体的には以下の点を含めてください:
1. 主要な機能や特徴(ユーザーベネフィットに着目)
2. 想定ユーザー層と使用シナリオ
3. 競合製品との差別化ポイント
[参照ドキュメント]
- Alphaシリーズは高性能AIチップを搭載したスマートフォン。主な特徴は以下の通り:
- 5G対応
- 120Hz有機ELディスプレイ
- 1億画素カメラシステム
- バッテリー持続時間:24時間
- カラーバリエーション:ブラック、ホワイト、シルバー
※あくまで架空の内容です。
特徴
- ハルシネーション抑制:★☆☆(低)
- 回答の柔軟性:★★★(高)
- ユースケース:アイデア出し/ブレインストーミング/創作支援
レベル2:バランス重視(主要情報源を尊重)
概要
このレベルでは、参照ドキュメントの内容を第一の情報源としつつ、AIの一般知識による補完も許容します。ドキュメントに記載されている事実を優先し、より分かりやすい解説や、ドキュメントにない補足情報を柔軟に提供させたい場合に有効です。
プロンプト例
あなたは公式製品サポートチャットボットです。
以下の[参照ドキュメント]は製品「Alpha」の公式仕様書からの抜粋です。
ユーザーからの質問に回答する際は、まず[参照ドキュメント]にある情報を優先してください。
ただし、記載がない場合や、より分かりやすい説明のためには、あなたの持つ一般的な知識を補完的に使用しても構いません。
質問:この製品の希望小売価格と、どの販売チャネルで購入可能か教えてください。
[参照ドキュメント]
- Alphaは高性能AIチップを搭載したスマートフォン。主な特徴:
- 5G対応
- 120Hz有機ELディスプレイ
- 1億画素カメラシステム
- バッテリー持続時間:24時間
- カラーバリエーション:ブラック、ホワイト、シルバー
※あくまで架空の内容です。
特徴
- ハルシネーション抑制:★★☆(中)
- 回答の柔軟性:★★☆(中)
- ユースケース:FAQ/チャットボット/サポート応答
レベル3:ハルシネーション抑制重視(厳格依存)
概要
このレベルは、ハルシネーションを徹底的に抑制するための最も厳格な設計です。AI自身の知識や推論を一切排除し、参照ドキュメントに記載されている情報のみで回答することを強制します。もしドキュメントに回答がない場合は、「記載がありません」と明確に答えることで、誤った情報を伝えてしまうリスクを最小限に抑えます。法務や医療など、正確性が最優先される分野で非常に重要です。
プロンプト例
あなたは社内規定に関する質問に回答するAIアシスタントです。
以下の[参照ドキュメント]に記載されている情報のみに基づいて質問に回答してください。
参照ドキュメントに記載のない内容は、たとえ一般的な知識として知っていたとしても一切含めないでください。
もしドキュメントに回答がない場合は、「記載がありません」と明確に答えてください。
あなたの知識や学習済みデータは使用禁止です。
質問:会議室Aは土日に使用できますか?使用料金はかかりますか?
[参照ドキュメント]
- 会議室Aの利用規約:
- 利用時間:平日9:00~17:00
- 予約は前日までにオンラインシステムから行うこと
- 飲食可(ゴミは持ち帰ること)
- プロジェクターとホワイトボードは無料で利用可能
※あくまで架空の内容です。
特徴
- ハルシネーション抑制:★★★(高い)
- 回答の柔軟性:★☆☆(低)
- ユースケース:法務/医療/契約説明など、誤情報が許されない領域
依存度レベル比較表
項目 | レベル1:柔軟性重視 | レベル2:バランス重視 | レベル3:ハルシネーション抑制重視 |
---|---|---|---|
ドキュメントの扱い | 参考情報として使用 | 主要な情報源として優先 | 記載情報のみに厳格依存 |
AIの知識・推論の活用 | 最大限使用 | 一部補完に使用可 | 一切使用しない |
ハルシネーション抑制 | ★☆☆(低) | ★★☆(中) | ★★★(高) |
回答の柔軟性 | ★★★(高) | ★★☆(中) | ★☆☆(低) |
想定ユースケース | アイデア創出/創作/思考支援 | FAQ/サポート/製品説明 | 法務/医療/契約対応 |
まとめ
RAGシステムにおける「参照ドキュメント依存度」は、ハルシネーションのリスクと回答の柔軟性を制御する重要な設計要素です。
戦略 | 効果 |
---|---|
依存度を下げる | 回答は柔軟になるが、ハルシネーションのリスクが上がる |
依存度を上げる | 回答は正確になるが、柔軟性が下がる |
✅ システム設計のポイント
- 利用目的(例:顧客対応 vs 法的回答)
- ユーザーの期待値(正確性か創造性か)
- 安全性の担保が必要な領域の有無
適切な依存度レベルとプロンプト設計を選ぶことで、RAGシステムの品質と実用性を大きく向上させることができます。
本記事がプロンプト設計やRAG活用の一助となれば幸いです。