NTTデータ先端技術株式会社の原田です。
Microsoft Ignite 2023 Opening keynote の感想 を書き終わりセッション見ていこうと言うところで、対象の絞り込みに Azure OpenAI Service を使ってみようと思いつきました。
やりたいことは On Your Data でセッション資料を食べさせたモデルを構築してチャットしてみると言うものです。
を参考に進めていきます。
掲載しているスクリプトやコマンドの実行については自己責任でお願いします。
セッション資料のダウンロード
ともあれまずはセッション資料のダウンロードから、こちらの Powershell スクリプトを使用します。
スクリプトを適当なフォルダに配置して実行コマンドは下記の書式です。
.\Get-EventSession.ps1 -Event Ignite2023 -NoVideo -DownloadFolder "資料ダウンロード先フォルダ"
Ignite 2023 では 70 ファイルで 6.08GB の資料がダウンロードされました、すべて PowerPoint でしたので データ形式とファイルの種類 は満たしています。
ここから OpenAI Service のクォータと制限 に記載の、
リソースあたりの最大ファイル数 : 30
リソースあたりのすべてのファイルの合計サイズ : 1 GB
アップロードごとのすべてのファイルの最大サイズ : 16 MB
に沿って適当にフィルターして使用します。(実はこの制限を見た時点で期待値ダウン)
OpenAI Service
既存の eastus (米国東部) の OpenAI Service では GPT-4 モデルがデプロイできませんでしたので、新たに eastus2 (米国東部 2) でリソースを作成しています。
-
GPT-4 モデルのデプロイ
GPT-4 の対応リージョンは こちら をご参照ください。
AI Search (Cognitive Search)
Blob Storage
-
CORS の有効化
OpenAI Service に対して CORS を有効化する必要があるとのことです。
この値はこの後のデータソースの追加作業の中で Azure が埋めてくれるものですが、オリジンやヘッダーはもう少し絞り込めると思います。
RBAC 設定
RBAC については こちら ご参照ください、今回↓の設定を行ってます。
リソース | ロール | メンバー |
---|---|---|
Azure OpenAI Service | Cognitive Services OpenAI Contributor | Azure AI Search のマネージド ID |
Azure AI Search | 検索インデックス データ閲覧者 | Azure OpenAI Service のマネージド ID |
Azure AI Search | Search Service 共同作成者 | Azure OpenAI Service のマネージド ID |
Blob Storage | ストレージ BLOB データ共同作成者 | Azure OpenAI Service のマネージド ID Azure AI Search のマネージド ID |
データソースの追加
これで前提条件が揃いましたので最後にデータソースの追加を行います。
Azure OpenAI Studio のチャット プレイグラウンドからデータ ソースの追加をクリックして、
パラメータを埋めて、
無事データの追加が完了しました。
おわりに
環境構築が完了して切りも良いところですので第1回はこのあたりで。
次回はもう少し資料を追加してチャットしてみるところから進めたいと思います。