このチュートリアルでは、Alibaba Cloud Model Studio、Compute Nest、および AnalyticDB for PostgreSQL を使用して、検索拡張生成 (RAG) サービスを構築する方法について詳しく説明します。 Model Studio を使用すると、Qwen などの上位層の生成 AI モデルを活用して AI アプリケーションを簡単に開発、デプロイ、管理できます。 このサービスを構築することにより、企業内での安全で効率的なデータ処理が保証され、AI 機能が強化され、シームレスな自然言語クエリが可能になります。
はじめに
Alibaba Cloud Model Studio は、生成 AI アプリケーションを開発するための包括的なプラットフォームです。 Compute Nest と AnalyticDB for PostgreSQL を使用すると、安全で効率的な検索拡張生成 (RAG) サービスを作成して、企業内の AI 機能を強化できます。
Alibaba Cloud Model Studio の概要
Model Studio とは
Alibaba Cloud Model Studio は、生成 AI モデルの開発、デプロイ、管理を簡素化することを目的としたエンドツーエンドのプラットフォームです。 Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen 2 シリーズなど、業界をリードする基盤モデルにアクセス可能な Model Studio には、モデルのファインチューニング、評価、デプロイ、およびエンタープライズシステムとの統合のためのツールが用意されています。
Model Studio の主な機能
1. 主要な基盤モデル (FM) に簡単にアクセス:
- Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen 2 シリーズなどのモデルは、拡張された AI 機能でアプリケーションを強化します。
2. 組み込みのモデル推論および評価ワークフロー:
-
教師ありファインチューニング (SFT) および低ランク適応 (LoRA) がサポートされています。
-
モデル圧縮、推論アクセラレーション、および多次元評価ツールを備えています。
-
ワンクリックでモデルをデプロイできます。
3. 生成 AI アプリケーションの開発を簡素化:
-
視覚的なワークフローでアプリケーションを開発できます。
-
テンプレートを用いてプロンプトエンジニアリングを実行できます。
-
ビジネスシステムと統合するための、豊富な API が用意されています。
4. 広範なセキュリティ対策:
-
分離された VPC ネットワークでデータが保護されます。
-
責任ある AI を確実に実践するためのコンテンツガバナンスとヒューマンインザループ介入のためのツールが用意されています。
5. サードパーティのモデル:
- Q&A、執筆、NL2SQL (自然言語から SQL への変換) 機能などで使用される Tongyi などのサードパーティモデルがサポートされています。
6. データ管理:
-
データセットのクレンジングと管理を実行できます。
-
検索拡張生成 (RAG) で検索とデータアクセスを強化できます。
7. 業界特化型モデル:
- ヘルスケア、金融、法律サービスなど、各業界向けののカスタムモデルが用意されています。
8. API と SDK:
- 迅速な統合とエージェント開発のためのアシスタント API と SDK 一式が用意されています。
前提条件
開始前に、以下の事項を確認してください。
-
Alibaba Cloud アカウントが作成済みである必要があります。
-
クラウドサービスと AI モデルについての知識が必要です。
ステップ 1:Alibaba Cloudアカウントのセットアップ
Alibaba Cloud アカウントの作成が済んでいない場合は作成します:アカウントを作成する
ステップ 2:Compute Nest にアクセス
Compute Nest に移動して、生成 AI 用のサービスを確認します: Compute Nest
ステップ 3:インスタンスとパラメーターの設定
インスタンスに対して必要なパラメーターを設定します。
-
サービスインスタンス名:分かりやすいインスタンス名を指定します。
-
Elastic Computing Services (ECS) パラメーター:ドキュメント処理を高速化するには、
ecs.c6.2xlarge
を選択することを推奨します。 -
インスタンスパスワード:インスタンス用に安全なパスワードを作成します。
ステップ 4:AnalyticDB for PostgreSQL のセットアップ
AnalyticDB for PostgreSQL インスタンスを設定します。
-
インスタンス仕様:データ量に基づいて適切な仕様を選択します。
-
セグメントストレージサイズ:必要に応じて調整します。
-
DB ユーザー名:デフォルトは
kbsuser
です。独自のユーザー名も選択できます。 -
DB パスワード:強力なパスワードを作成します 。記号 (@ など) は使用しないでください。
ステップ 5:WebUI 資格情報の設定
RAG サービスを管理し、サービスと対話するための Web UI 資格情報を設定します。
-
ユーザー名:デフォルトは
admin
です。別のユーザー名も選択できます。 -
パスワード:強力で安全なパスワードを作成します。
ステップ 6:Model Studio API キーの追加
サービス間の通信を認証し、容易に実行するために、Model Studio API キーを追加します。
API キー:Model Studio のセットアップから取得した API キーを入力します。
Model Studio API キーを取得する方法はこちらをご参照ください。
ステップ 7:ネットワーク設定
安全で信頼性の高い接続を確保するために、適切なネットワーク設定を選択します。
既存のインフラストラクチャ設定の選択
1. 新しい VPC (Virtual Private Cloud) を作成するか、または既存の VPC を使用するかを選択します。
-
WhetherCreateVpc:新しい VPC が必要な場合は、
[作成]
を選択します。
2. VPC ID:既存の VPC の ID を入力するか、または新しい VPC を作成します。
- VPC の作成:新しい VPC を作成する場合は、「Alibaba Cloud VPC 作成ガイド」に従います。
3. VSwitch ID:既存の vSwitch の ID を選択するか、または新しい vSwitch を作成します。
- vSwitch の作成:手順は「vSwitch作成ガイド」で確認できます。
4. タグとリソースグループ:
-
タグ:作成したリソースに付加されているタグを指定します。
-
タグキー:タグキーを選択します。
-
タグ値:タグ値を選択します。
-
リソースグループ:作成したサービスインスタンスが属するリソースグループを選択します。
-
リソースグループの作成:「リソースグループの作成」の手順に従います。
設定後、[次へ:注文の確認] をクリックします。
これらの手順に従うことにより、Alibaba Cloud Model Studio RAGサービスを効果的にサポートするために、WebUI の資格情報とネットワーク設定を正しく設定できます。
パラメーターの設定後、[次へ:注文の確認] をクリックします。
ステップ 7:Gradio for Web UI の統合
Gradio を使用して、サービスと対話するための Web インターフェースを作成します。
-
Gradio の設定:インストールと設定については、Gradio のドキュメントに従ってください。
-
サービスの統合:Gladio をバックエンドサービス (Model Studio API エンドポイントおよび AnalyticDB for PostgreSQL) に接続します。
ステップ 8:RAG サービスのデプロイ
すべての設定項目を確認し、利用規約に同意します。 [今すぐ作成] をクリックして、RAG サービスをデプロイします。
RAG サービスの使用
一般的な質問への回答
ユーザーは Gradio Web インターフェース経由で質問をすることができ、Model Studio API は入力に基づいて応答を返します。
検索拡張のためのドキュメントのアップロード
ユーザーは、ベクトルデータベースに保存されるドキュメントをアップロードして、モデルの検索機能を強化できます。
サービスの変更
許可されたユーザーは、ECS インスタンスにアクセスして、サービスに必要な変更や更新を加えることができます。
追加リソース
RAG サービスをさらに理解して最適化するには、以下のリソースをご確認ください。
関連チュートリアル:
-
独自の AI チャットバディのデプロイ- Hugging Face を使用した Qwen チャットモデルのデプロイガイド
-
会話を一段上のレベルへ:カスタマイズ可能で高い費用効果を発揮する、Alibaba Cloud での LLM + VectorDB
結論
このチュートリアルでは、Alibaba Cloud Model Studio、Compute Nest、AnalyticDB for PostgreSQL を使用して、検索拡張生成 (RAG) サービスを構築するプロセス全体について説明しました。 Qwen を含む Model Studio の強力な生成 AI モデルを活用することで、自社での AI アプリケーションの開発、デプロイ、管理を合理化できます。 今回のようなサービスを構築することより、自然言語クエリからドキュメント検索の拡張まで、安全でスケーラブル、かつ効率的な対話が保証されます。 これらの手順に従うことで、高度な AI 機能を利用できるようになり、組織内でのデータ管理と利用を変革できます。 継続的な最適化とサポートについては、追加のリソースと関連チュートリアルをご参照ください。
この記事は英語から翻訳されました。 元の記事はこちらで確認できます。