2025/06/26 追記 実際のコストを確認できたので追記いたしました。
誰かが言った──
AWSでRAGシステムを構築するのは比較的安価になったと──
世はRAG時代──
未知の知識を探求する時代──
※『トリコ』島袋光年/集英社 からの引用・パロディ
はじめに
本日、AWS Summit Japan に参加してきました。
その際、とある方にBedrock利用の相談をさせていただきました。
私「RAGシステムをAWSで組んでみたいんですが、従量課金が気になってローカルLLMを使った実装にとどまってしまっているんですよね...」
とあるBedrockerさん「気持ちはわかりますが、アップデートが入って、意外と気にならないくらいになってると思いますよ」
私「本当ですか!?ありがとうございます!また試してみたいと思います!」
...ということで、先ほど帰宅してお風呂から上がったばかりですが、試しに簡単なRAGシステムを構築してコストを確認してみたいと思います。
本記事では、そもそものRAGについて・システムの構築についてはお話ししたい部分ではないので省略します。機会があれば改めてお話ししたいと思います。
結構勢いで記事の執筆をしているため、間違いなどありましたらご指摘いただけると幸いです。
とりあえず作ったもの
以下の通り、とてもシンプルです。S3に置いた文書データをベクトル化し、Amazon Aurora PostgreSQL Serverless をベクトルDBとして利用します。
なお、以下のモデルを利用しています。
- 埋め込みモデル:Titan Text Embeddings v2
- 推論モデル:Claude 3.5 Sonnet
お試し用の文書データについて
Claude Codeに作ってもらいました。以下のような一覧になっているそうです。(すべてmarkdown形式です)
中を見てみると、1ファイル100行程度~500行程度になっていました。
作成したファイル一覧:
1. AWS主要サービス概要
2. 機械学習基礎概念
3. ビジネス戦略策定ガイド
4. クラウド分析プラットフォーム製品仕様書
5. Python開発ベストプラクティス
6. 財務分析手法
7. React開発ベストプラクティス
8. データサイエンス・パイプライン構築ガイド
9. プロジェクト管理フレームワーク
10. サイバーセキュリティ・ガイドライン
(余談)特に細かい指示を出していなかったので、気づいたら20個近くファイルを生成しておりとても怖かったです。(ちゃんと指示しないと暴走しますよねという話)
実際に使ってみる
実際にテストしてみます。
ひとまずうまくいってそうですね。(というかめちゃくちゃお手軽に作れますね)
推論コストの概算
Bedrockのログを有効化(S3)して、適当にCloudshellからコマンドを叩いて実行した結果からコストを概算してみます。
具体的なログ取得方法はいったん省略いたします。
埋め込み
- 入力トークン:34
- 入力トークン 1,000 あたり USD 0.00002
- (34 ÷ 1,000) × 0.00002 = $0.0000068
推論
- 入力トークン:5,618トークン
- 入力トークン 1,000 あたり 0.003 USD
- (5,618 ÷ 1,000) × 0.003 = $0.016854
- 出力トークン:285トークン
- 出力トークン 1,000 あたり 0.003 USD
- (285 ÷ 1,000) × 0.015 = $0.004275
合計
- 0.0000068 + 0.021129 + 0.004275 = $0.0254108
- 約3.8円
計算の結果によると比較的コストは高くないのかなと感じました。
(おまけ)Auroraの設定を確認
念のため今回作られたAuroraの設定も確認しておきます。
色を付けた部分が示すように、一定時間(今回は3時間)で、停止するように設定されていると思います。(以下リンクの通り、ストレージ費用は掛かるようです。)
(追記)概算の答え合わせ
翌日確認したところ、計$0.08でした。確か2,3回試したので、概算通りだったと思います。
おわりに
とてもあっさりではありますが、勢いでRAGシステムを構築しコストを確認してみました。とあるBedrockerさんのおっしゃる通り、個人利用の範囲ではそこまでコストがかからないであろうことがわかりました。
意外といけるのがわかったので、今後は少しずつAWSの方でも、Bedrockなどいろいろ遊んでみたいと思います。
ありがとうございました。
参考
構築までの手順は以下記事を参考にさせていただきました。ありがとうございました。



