はじめに
この投稿は AI-102: Microsoft Azure AI エンジニア の学習をした内容のメモです。
投稿の一覧は以下のリンク先にあります。
前の投稿
Azure AI Search
Azure AI Search を利用すると、任意のデータソースに対して検索インデックスを作成して、検索クエリで情報を取得したり、生成 AI から RAG として利用することができます。
Azure Portal で Azure AI Search リソースを作成し、実際に利用してみます。
Azure AI Search リソースを作成する
Marketplace から [Azure AI Search] を検索します。
各情報を入力します。ここでは [価格レベル] として 50 MB のストレージ制限がある無償版 (Free) を選択します。
レプリカとパーティションの数を指定します。今回は Free なので両方とも既定の 1 のままにします。
| 名前 | 説明 |
|---|---|
| レプリカ | 検索サービスのインスタンス数です。各インスタンスは同一のインデックスをもち、負荷分散に利用されます。 |
| パーティション | 検索サービスのストレージ数です。インデックスは各ストレージに分散して保持され、並列に検索が行われます。 |
データソースを作成する
次にデータソースを追加します。
今回は Azure Blob Storage をデータソースとして追加してみます。
インデックスを作成する
次にデータソースにインデックスを作成します。
インデックスの目的に応じて、インデックスの属性を設定します。
| 名前 | 説明 |
|---|---|
| 取得可能 | ユーザーが結果を表示できる |
| フィルター可能 | ユーザーがフィルタで指定できる |
| ソート可能 | ユーザーがソートで指定できる |
| ファセット可能 | ファセットクエリ (※) から参照できる |
| 検索可能 | ユーザーが検索できる |
※ ファセットクエリ
検索結果にカテゴリ別のヒット数を表示したり、検索結果をカテゴリごとに絞り込むときに利用します。
スキルセットを定義する
スキルセットを利用することにより、検索の際に OCR によってドキュメントからテキストを抽出したり、ドキュメントを翻訳することができます。
初めから用意されている組み込みスキルと、ユーザーが独自に作成するカスタムスキルがあります。
インデクサーを作成し実行する
以下のようにインデクサーを作成し実行すると、作成したインデックスを使用して検索クエリが実行できるようになります。
構文、並べ替え、フィルター処理、ワイルドカードなどを含むインデックスのクエリを実行する
[検索エクスプローラー] から実際にインデックスを使用して検索を行うことができます。
また、以下の [デモ アプリの作成] から、インデックスを使用して検索を行う Web アプリケーションをダウンロードすることができます。
類義語マップの追加
類義語マップを作成すると、設定した類義語に基づいてドキュメントを検索することができます。
例:
- 類義語マップ
- "dog", "canine", and "puppy"
- 検索結果
- "canine" で検索すると "dog" を含むドキュメントがヒットする
次の投稿













