2. RAG fundamentals — Databricks Generative AI Cookbook [2024/6/20時点]の翻訳です。
本書は著者が手動で翻訳したものであり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
Databricks生成AIクックブックのコンテンツです。
このガイドのセクション1では、RAGを紹介し、機能をハイレベルで説明し、LLM単体に対する利点をハイライトしました。
このセクションでは、非構造化データに対するRAGアプリケーションを開発する際のキーコンポーネントや原則をご紹介します。特に以下を議論します:
- データパイプライン: RAGアプリケーションのデータパイプラインを用いて、PDFのコレクションのような非構造化文書を収集に適したフォーマットに変換します。
-
収集、拡張、生成(RAGチェーン): ステップのシリーズ(チェーン)は以下を実行するために呼び出されます:
- ユーザーの質問の理解
- サポートデータの収集
- ユーザーの質問とサポートデータに基づいたレスポンスを生成するためのLLMの呼び出し
- 評価: あなたのビジネス要件を満たすように、RAGアプリケーションの品質/コスト/レーテンシーを評価します。
- ガバナンス & LLMOps: データリネージとガバナンス(アクセスコントロール)を含む、それぞれのコンポーネントのライフサイクルを追跡、管理します。
- 目次
- 前のセクション: 1. RAGの概要
- 次のセクション: 2.1. データパイプライン