LoginSignup
0
0
生成AIに関する記事を書こう!
Qiita Engineer Festa20242024年7月17日まで開催中!

Databricks生成AIクックブック - ステップ1: コードレポジトリのクローンと計算資源の作成

Last updated at Posted at 2024-06-24

Step 1: Clone code repo & create compute — Databricks Generative AI Cookbook [2024/6/24時点]の翻訳です。

本書は著者が手動で翻訳したものであり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

Databricks生成AIクックブックのコンテンツです。

ステップ1: コードレポジトリのクローンと計算資源の作成

実装セクションは、Databricksで動作するように設計されたサンプルコードのレポジトリとセットになっています。

お使いのDatabricksワークスペースにサンプルコードをロードし、アプリケーションのグローバル設定を行うためにこれらのステップに従ってください。

コードレポジトリ
こちらからこのセクションで参照しているすべてのサンプルコードにアクセスすることができます。

要件

  1. サーバレスとUnity Catalogが有効化されているDatabricksワークスペース
  2. 以下のいずれかのMosaic AI Vector Searchエンドポイント:
    • 既存エンドポイント
    • 新規エンドポイントを作成する権限 - setupノートブックがこの作業を行なってくれます
  3. パース/チャンクされたドキュメントのアウトプットDeltaテーブルと、Vector Searchのインデックスが格納されるUnity Catalogのスキーマ:
    • 既存のUnity CatalogSchemaへの書き込み権限
    • 新規Unity Catalogとスキーマを作成する権限 - setupノートブックがこの作業を行なってくれます
  4. インターネットにアクセスできるDBR 14.3+が稼働しているシングルユーザークラスター
    • これらのチュートリアルでは、機械学習ランタイムでは競合するPythonパッケージを使用します
    • 必要なPythonやシステムパッケージのダウンロードにインターネットアクセスが必要です

手順

  1. Gitフォルダーを用いて、ワークスペースにレポジトリをクローンします。

  2. rag_app_sample_code/00_global_configノートブックを開き、設定を調整します。

    # The name of the RAG application.  This is used to name the chain's UC model and prepended to the output Delta Tables + Vector Indexes
    RAG_APP_NAME = 'my_agent_app'
    
    # UC Catalog & Schema where outputs tables/indexs are saved
    # If this catalog/schema does not exist, you need create catalog/schema permissions.
    UC_CATALOG = f'{user_name}_catalog'
    UC_SCHEMA = f'rag_{user_name}'
    
    ## UC Model name where the POC chain is logged
    UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}"
    
    # Vector Search endpoint where index is loaded
    # If this does not exist, it will be created
    VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search'
    
    # Source location for documents
    # You need to create this location and add files
    SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
    
  3. 01_validate_config_and_create_resourcesノートブックを開きます。

POCのデプロイステップに進みます。

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0