S3VectorでAIエージェントの運用コスト削減できないか検証する

Posted at 2025-11-16

きっかけ

Bedrockを利用したAIエージェントの開発で、
利用していたOpenSearchServerlessを削除し忘れた結果、
AWSの請求額でチーム内トップになってしまう事態が発生しました。

OpenSearchは高性能ですが、

という性質があり、サービス運用していくうえですごく高コストだという意識が強くなりました。

この経験から、
「もっと安価で使えるRAG構成はないかなぁ」
という課題感が生まれていました。

2025年7月にプレビュー提供が開始された新サービスです。

既存のベクトルDB（OpenSearchやAuroraなど）とは運用モデルが根本的に異なり、
ドキュメントをベクトル化したデータを、DBではなくストレージに保存するのが大きな特徴です。

そしてとにかく安い。

特に大きい違いはコストです。

OpenSearchはインスタンスが常時稼働するため、
使っていなくても料金がかかるのが最大のネックです。

一方でS3Vectorは
「ストレージ料金＋ベクトル検索をしたときだけ課金」
という運用モデルで、低頻度アクセスのRAGに非常に適しています。

以下の条件で、両者を公平に比較しました。

どちらも、ドキュメントをしっかり引っ張ってこれていて、いい感じです。
ただこれだけだと、差がよくわかりません。。

正確性と、有用性を実際に社内で使用されていたテストデータを利用し、
AWS Bedrock Evaluationで定量評価しました。

※ オフラインRAGで実施（オンライン評価は未実施）

正確性においてはOpenSearchのほうが上の結果がでました。
おそらく、ハイブリッド検索の検索精度の差が影響しているのだと考察します。

ただ、有用性においてはS3もOpensearchと同等の回答品質が期待できそうです。

このクオリティで90%以上のコスト削減を達成できるので、かなりのインパクトです。

FAQチャットボット＝“キーワード検索（全文検索）” と
“意味検索（ベクトル検索）” の両方が必要になることが多いので、
S3 Vector（ベクトルのみ）では要件を満たしきれない可能性があり、すべての置き換えは難しそうです。

ただ、AWS公式でも推奨されている通り、ドキュメントが大規模になってきた場合、

のようなハイブリッド構成でコストの削減を図るのは一ついい方法だと考えました。

正式リリース後は、RAG構築プロジェクトでユースケースによって候補になるのではないかと考えています。

同僚のとてもわかり易く解説している記事を参考にさせていただきました🙇‍♀️