Step 1: Clone code repo & create compute — Databricks Generative AI Cookbook [2024/6/24時点]の翻訳です。
本書は著者が手動で翻訳したものであり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
Databricks生成AIクックブックのコンテンツです。
ステップ1: コードレポジトリのクローンと計算資源の作成
実装セクションは、Databricksで動作するように設計されたサンプルコードのレポジトリとセットになっています。
お使いのDatabricksワークスペースにサンプルコードをロードし、アプリケーションのグローバル設定を行うためにこれらのステップに従ってください。
要件
- サーバレスとUnity Catalogが有効化されているDatabricksワークスペース
- 以下のいずれかのMosaic AI Vector Searchエンドポイント:
- 既存エンドポイント
- 新規エンドポイントを作成する権限 - setupノートブックがこの作業を行なってくれます
- パース/チャンクされたドキュメントのアウトプットDeltaテーブルと、Vector Searchのインデックスが格納されるUnity Catalogのスキーマ:
- 既存のUnity CatalogとSchemaへの書き込み権限
- 新規Unity Catalogとスキーマを作成する権限 - setupノートブックがこの作業を行なってくれます
- インターネットにアクセスできるDBR 14.3+が稼働しているシングルユーザークラスター
- これらのチュートリアルでは、機械学習ランタイムでは競合するPythonパッケージを使用します
- 必要なPythonやシステムパッケージのダウンロードにインターネットアクセスが必要です
手順
-
Gitフォルダーを用いて、ワークスペースにレポジトリをクローンします。
-
rag_app_sample_code/00_global_config
ノートブックを開き、設定を調整します。# The name of the RAG application. This is used to name the chain's UC model and prepended to the output Delta Tables + Vector Indexes RAG_APP_NAME = 'my_agent_app' # UC Catalog & Schema where outputs tables/indexs are saved # If this catalog/schema does not exist, you need create catalog/schema permissions. UC_CATALOG = f'{user_name}_catalog' UC_SCHEMA = f'rag_{user_name}' ## UC Model name where the POC chain is logged UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}" # Vector Search endpoint where index is loaded # If this does not exist, it will be created VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search' # Source location for documents # You need to create this location and add files SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
-
01_validate_config_and_create_resources
ノートブックを開きます。
POCのデプロイステップに進みます。
- 目次
- 前のセクション: 前提条件: 要件の収集
- 次のセクション: ステップ2: ステークホルダーのフィードバックを収集するPOCのデプロイ