今日はベクトルストアについて紹介したいと思います。
ベクトルストアとはデータをベクトル化(数字リスト)して保存、検索するデータベースのことです。
RAGのデータ元もベクトルストアです。
ベクトルストアはたくさんありますが、よく使われているのはFaiss,Chroma,LanceDB,Qdrantの4つです。
それぞれの特徴などを簡単に説明します。
①Chroma
一番有名な軽量VBで、構築は非常に簡単なので、VBのチュートリアルコードにはよく使われてるいるようなイメージです。
②Qdrant
だいぶ前からあったVBですが、性能とスピードが良いので人気です。こちらも他の人のコードによく見てた記憶があります。多分使っている人一番多いかもしれません。
③Faiss
Facebookが開発した大規模データ向けのVBです。特徴としては検索スピードが非常に速いです。
④LanceDB
マルチモダール特化のVBなので、画像とか検索する場合は他のVBより精度高いです。
私が使った経験だと、検索ロジックはほぼ一緒ですので、精度の差はあまり大きくないです。基本速いものを使うのがベストだと思います。(並行処理のデザインは違うためにスピードは結構違います。)
なので、Faissおすすめです。私もいつもFaiss使ってます。
ベクトルストアに興味ある方⇩まとめ記事