LoginSignup
65

Azure Cognitive Search にベクトル検索機能が搭載されプライベートプレビューが開始

Last updated at Posted at 2023-05-23

はじめに

ついにこの時が来ましたね。

Azure Cognitive Search にベクトル検索機能が実装され、近似最近傍探索(ANN)が可能になります。これによって、Azure OpenAI Serivce の Embeddings API で生成したベクトルの永続的なフルマネージドベクトルデータベースとして利用できるだけでなく、既存の BM25 ベースの全文検索とのハイブリッド検索が可能になります。

002.png

7/18 パブリックプレビューが開始されました!

どなたでもお使いいただけます。

ポイント

  • ベクトルデータベース
    Azure OpenAI の Embeddings モデル text-embedding-ada-002(1,536 次元) や Computer Vision (Vectorize Image API) で生成した画像ベクトルなどの保管先にできる
  • ハイブリッド検索
    キーワード検索とベクトル検索を組み合わせた検索ができる。
  • セマンティックハイブリッド検索
    Microsoft の Turing モデルを利用した Re-ranker で結果を並べ替えることでさらに精度が高まります。
  • フィルタリング
    ベクトル検索を行う前にドキュメント検索をフィルタリングできるので、カテゴリーを絞ったり、ユーザーに応じてドキュメントを出し分けたりすることができます。パフォーマンス面での利点もあります。
  • Azure AI Studio との統合
    Build 2023 で Azure AI Studio と統合され、Grounding のデータソースとして選択できるようになりました。
  • ChatGPT Retrieval Plugin との統合
    ChatGPT の Plugin として Azure Cognitive Search のベクトルインデックスを呼び出せます。さらにハイブリッド検索やセマンティックハイブリッド検索も使用できます。
  • LangChain の Vectorstore に追加
    LangChain の Vectorstore から Azure Cognitive Search のベクトルインデックスに対してベクトル検索やハイブリッド検索を実行できます。

※Azure Cognitive Search で使用する「セマンティック検索」という用語は既存の Microsoft Turing モデルによって実現される Re-ranker とセマンティックキャプション、セマンティックアンサー等の機能のことを指し、今回の新機能を「ベクトル検索」と表現して区別します。

アーキテクチャ

001.png

Azure Cognitive Search がベクトルデータベースになったことで、Azure Cognitive Search を組織内のナレッジベースとしたシンプルなアーキテクチャが実現。単一のインデックスに対してユーザーのドキュメントの性質に応じた柔軟なクエリーの使い分けが可能になりました。

条件

  • Basic 以上のレベル (SKU) のAzure Cognitive Search の価格プラン
  • セマンティックハイブリッド検索の利用には Standard レベル (S1、S2、S3) およびストレージ最適化 (L1、L2) が必要となります

プレビュー制限事項

  • 保存できる最大次元数: 2,048
  • プレビュー機能は、サービスレベル契約なしの追加使用条件の下で提供され、本番ワークロードには推奨されません。

他にも制限事項がありますので、Docs を参照してください

ベクトル検索手順解説

インデックスの作成

ベクトルフィールド

インデックスにベクトル用フィールド Collection(Edm.Single) が追加されました。また、dimensions フィールドと vectorSearchConfiguration フィールドが必要になります。

{
            "name": "contentVector",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": true,
            "dimensions": 1536,
            "vectorSearchConfiguration": "vectorConfig"
}

ベクトル検索構成

vectorSearch 構成にはアルゴリズムを定義します。このプレビューでは hnsw アルゴリズムのみがサポートされています。Hierarchical Navigable Small World(HNSW) を使用した効率的で堅牢な近似最近傍検索の実装です。これによりクエリーベクトルをインデックス内のすべてのベクトルと比較する必要がなくなります。

"vectorSearch": {
        "algorithmConfigurations": [
            {
                "name": "vectorConfig",
                "kind": "hnsw"
                "hnswParameters": {
                    "m": 4,
                    "efConstruction": 400,
                    "efSearch": 500,
                    "metric": "cosine"
                }
            }
        ]
    },

セマンティック検索設定

さらに、Azure Cognitive Search の既存機能であるセマンティック検索と組み合わせる場合、semantic.configurations を追加します。

ドキュメントのアップロード

プレビュー版ドキュメントの追加 REST API または Python/.NET SDK がベクトルフィールドに対応しているためこれを使用して直接ドキュメントをプッシュします。埋め込みがデータを最大限にカバーできるように、データをチャンク化することをお勧めします。

私がデモに使っている戦国武将の Wikipedia をチャンク化して Embeddings に変換して Azure Cognitive Search のベクトルインデックスに登録するサンプルノートブックを置いておきます。

クエリの実行例

ベクトル検索の追加によって、以下の検索が可能になります。

  • 単一ベクトル検索
  • フィルターを使用した単一ベクトル検索
  • シンプルなハイブリッド検索
  • フィルターを使用したシンプルなハイブリッド検索
  • セマンティックハイブリッド検索
  • フィルターを使用したセマンティックハイブリッド検索

フィルターを使用した単一ベクトル検索

このようにベクトルクエリーとフィルターを組み合わせることで、クエリー実行前にカテゴリなどの分類で検索対象を絞ることができます。ベクトル検索すべきドキュメントをユーザーごとに出し分けるセキュリティフィルターとしても利用できます。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version={{api-version}}
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vector": {
        "value": [
            -0.009154141,
            0.018708462,
            ... 
            -0.02178128,
            -0.00086512347
        ],
        "fields": "contentVector",
        "k": 10
    },
    "select": "title, category",
    "filter": "category eq 'Databases'"
}

シンプルなハイブリッド検索

ハイブリッド検索は、検索インデックスのベクトルインデックスと BM25 インデックスの両方を検索するように指示します。ハイブリッドクエリーは、インデックスにベクトルフィールドと通常の検索フィールド(文字列、数値データ、地理座標など)の両方が含まれている場合に機能します。

検索スコアによる上位 10 件が含まれます。ベクトルクエリとテキストクエリの両方に検索スコアが割り当てられます。2 種類の異なるスコアは Reciprocal Rank Fusion (RRF) を使用してマージされ、ランク上の位置の逆数で各ドキュメントに重み付けされます。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version={{api-version}}
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vector": {
        "value": [
            -0.009154141,
            0.018708462,
            ...
            -0.02178128,
            -0.00086512347
        ],
        "fields": "contentVector",
        "k": 10
    },
    "search": "what azure services support full text search",
    "select": "title, content, category",
    "top": "10"
}

セマンティックハイブリッド検索

セマンティック検索を有効にしており、インデックス定義にセマンティック構成が含まれている場合、ベクトル検索に加えて、セマンティック ランキング、キャプション、回答、スペル チェックを使用したキーワード検索を含むクエリを作成できます。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version={{api-version}}
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vector": {
        "value": [
            -0.009154141,
            0.018708462,
            ...
            -0.02178128,
            -0.00086512347
        ],
        "fields": "contentVector",
        "k": 10
    },
    "search": "what azure services support full text search",
    "select": "title, content, category",
    "queryType": "semantic",
    "semanticConfiguration": "my-semantic-config",
    "queryLanguage": "en-us",
    "captions": "extractive",
    "answers": "extractive",
    "top": "10"
}

Azure Cognitive Search の機能を総動員した検索クエリーです。ハイブリッド検索結果をセマンティック検索による Re-ranker で結果を並び変えます。さらに、セマンティックキャプションセマンティックアンサーを用いた抽出的要約を検索結果に付加します。

ベクトル検索対応 UI

Web UI から検索クエリをテストする場合はこちらを利用できます。

ChatGPT Retrieval Plugin との統合

ChatGPT 規格のプラグインである ChatGPT Retrieval Plugin に Azure Cognitive Search が統合され、ブラウザ版 GPT-4 や様々な Copilot から呼び出せるようになりました。

お願い

プレビューに参加していただいたエンジニアの皆様には、この期間に様々な検証を実施いただき、問題点等をフィードバックいただけると幸いです。

さいごに

今回待望のベクトル検索機能が実装されただけではなく、Azure AI Studio と統合されたことで、Azure Cognitive Search の利用がさらに活発になると期待しています。

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
65