Step 5: Identify the root cause of quality issues — Databricks Generative AI Cookbook [2024/6/25時点]の翻訳です。
本書は著者が手動で翻訳したものであり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
Databricks生成AIクックブックのコンテンツです。
ステップ5: 品質問題の根本原因の特定
想定時間: 60分
要件
- MLflowであなたのPOCの評価セットが利用できる
- これまでのステップを実行しているのであれば当てはまっています!
- 以前のステップの全ての要件
概要
根本原因の主要な2つのカテゴリーは収集と生成です。最初にどこにフォーカスすべきかを特定するために、あなたのアプリの品質にインパクトを与える最頻出の根本原因を特定するために、以前のステップで実行したMosaic AI Agent EvaluationのLLM審判のアウトプットを活用します。
あなたの評価セットのそれぞれの行は以下のようにタグ付けされることになります:
手順
このアプローチは、expected_response
に格納されている質問に対する正解のレスポンスがあなたの評価セットに含まれているかどうかに依存します。expected_response
が利用できる場合には、以下の最初の表を使ってください。そうでない場合には、2番目の表を使ってください。
-
B_quality_iteration/01_root_cause_quality_issues
ノートブックを開きます。 -
expected_response
があるか無いかに応じて、あなたのユースケースに適したセルを実行します。 - あなたのアプリケーションで際頻出の根本原因を特定するために出力テーブルをレビューします。
- それぞれの根本原因に対して、さらにデバッグを行い、潜在的な修正案を特定するために以下のステップに従ってください。
利用可能な正解データを用いた根本原因分析
注意
それぞれの質問で収集されるべきドキュメントを示す人間によってラベル付けされた正解データがある場合には、オプションとしてretrieval/llm_judged/chunk_relevance/precision/average
をretrieval/ground_truth/document_recall/average
で置き換えることができます。
利用可能な正解データを用いない根本原因分析
- 目次
- 前のセクション: ステップ4: POCの品質の評価
- 次のセクション: 収集品質のデバッグ