S3 Vectorsを使えば、ナレッジベースの艦隊運用のハードルが下がり、ナレッジベースの階層構造が実現しやすくなりそう

Posted at 2025-11-02

概要

現在、AWS上で一般提供（GA）されているナレッジベース向けサービスには、OpenSearch や Aurora（PostgreSQL）などがあります。
しかし、これらを本番環境レベルで運用しようとすると、ナレッジベース1つあたりでも月に数万円規模のコストが発生してしまいます。
また、1つのナレッジベースにあらゆる情報を詰め込む構成では、余計な情報まで探索してしまい小回りが利きません。
一般的にも、ナレッジベースに限らずですが、生成AIは取り扱う情報を細かく分けたほうが精度が上がるとされています。
とはいえ、大規模システムでもない限り、複数のナレッジベースを“艦隊運用”のように運用するのはナレッジベース1つあたり月数万円かかってしまうため、そう易々と実行できるものではないかなと考えています。

しかし、S3 Vectorsを利用することで、複数のベクトルDBを艦隊のように運用しても低コストで実現できるような未来が見えてきました。
艦隊のように運用できることで、S3のフォルダ単位でナレッジベースを構築できるようになり、階層構造の表現がぐっと容易になります。
これにより、特定の領域に特化したナレッジとのやり取りもスムーズに行えるようになります。

そこで、この記事ではS3 Vectorsを活用し階層構造を意識したアーキテクチャの構築にチャレンジしてみます。

構成図

今回構築する構成図とアプリでの利用イメージです。
今回は最近行われたプロ野球のドラフトを題材にしてます。

AWS構成図

アプリでの利用イメージ

実践

1. S3の用意

構成図に沿ってS3のフォルダ構成を作成します。

2. 各球団のフォルダにドラフトの結果を格納

各球団ごとのフォルダに下記のようなドラフトの結果をテキストファイルで格納します。
※ 今回は、こちらのサイトを参考にさせていただきました。

Hanshin-draft-2025.txt

阪神タイガース（支配下5名・育成2名）
順位	選手名	守備	所属
1位	立石正広	内野手	創価大
2位	谷端将伍	内野手	日本大
3位	岡城快生	外野手	筑波大
4位	早瀬朔	投手	神村学園高
5位	能登嵩都	投手	オイシックス新潟
育成1位	神宮僚介	投手	東農大北海道オホーツク
育成2位	山崎照英	外野手	KDL兵庫
補強ポイント：大学No.1スラッガーの立石選手を獲得し、内外野のバランス良い補強に成功。投手も高校生から社会人まで幅広く指名し、若手育成と即戦力の両面を強化。