象使いのための pgvector 入門 (2)

Last updated at 2024-05-19Posted at 2023-12-03

これは PostgreSQL Advent Calendar 2023 シリーズ 2 の 4 日目の記事です。

同・アドベントカレンダー 2 日目の記事の続きです。

pgvector の用途・Docker での起動・テーブル作成・検索・インデックス作成については↑をご覧ください。

検索（探索）負荷を下げるには？

↑の記事で触れたとおり、ベクトル検索は 「精密な検索をしようとするとテーブル内の全行に対して距離を計算し比較する必要がある」 ので、通常のデータ行以上に検索（探索）負荷に配慮する必要があります。

検索（探索）負荷を下げ性能を上げる方法はいくつかあります。

例えば FAQ を RAG で構築する場合に質問カテゴリを指定して検索させるようなケースでは、

SELECT * FROM items WHERE category_id = 123 ORDER BY embedding <-> '[3,1,2]' LIMIT 5;

のような形で事前に絞り込んでおくとベクトル検索の対象行を減らすことができます。

全文検索など、ベクトル以外の検索によってあらかじめ絞り込んだ行をベクトル検索する方法をハイブリッド検索と呼びます。

README の Hybrid Search で示された SQL 文の他に、例えば PGroonga のような全文検索エンジンを使うことも考えられます。

絞り込みにキーワードを使うため、ベクトル検索より厳密な検索が行われる一方で、関係のありそうな文書を取りこぼす可能性は高くなります。

データやインデックスがメモリ上のバッファ（共有バッファまたは OS のキャッシュ）に載った状態にしておくと、検索時の I/O 負荷を下げ、検索が速くなります。

例えば、拡張機能 pg_prewarm を、

CREATE EXTENSION pg_prewarm;

で有効化しておき、

SELECT pg_prewarm(’【テーブル名】’, 【オプション】);

でベクトルデータが入ったテーブルを暖機します。

オプションにはbuffer（共有バッファ）またはread（OS キャッシュ）を指定します。

README の FAQ 内や、先の記事でリンクした石井さんのスライド資料 37 ページに記されているとおり、

です。また、インデックスについては、

です。

つまり 検索精度と性能はトレードオフの関係 になります。

必要な検索精度を確保しつつ、なるべくデータサイズを抑えて性能も確保します。

データサイズを抑えるためには、ベクトルの次元数を削減（圧縮）する方法もあります。

ここからは 完全に私見 です。

現状、RAG を構成する際の Vector Store には、

が選択される傾向にあるように思います。

「RDBMS 上の蓄積データをそのままベクトル検索に使いたい」または「RDBMS 上のデータを連携する形でベクトル検索したい」という、より複雑（または大容量が必要）なニーズが出てきたときにはじめて PostgreSQL + pgvector が選択肢として浮上してきそうです。

一方で、pgvector 自体もまだ「バージョン 0.5.1」が示すとおり発展途上です。

なので現状は、以下のようなスタンスで良い気がします。

変化の激しい世界、すぐ別の技術に取って代わられる可能性もあります。

それを踏まえて、当面は

いざ「RDBMS でベクトル検索したい」というニーズが出てきたときに、本当に RDBMS でベクトル検索するのが良いか他の技術を併用するのが良いか、見極められるようにしておく

のが良いのではないでしょうか。

2024/5/19 追記：
続編を公開しました。