背景
会社でRAGシステムの導入を検討中。
Azureを使って構築予定だが、RAGに詳しくない上にAzureにも詳しくない…
→一旦AWSで作ってみよう!
という背景になります。
ユーザのフロー概要
①参照したいドキュメントをアップロード
②画面から質問
③裏処理でドキュメントを参照、回答を返す
①ベクトル化処理
ドキュメントをS3にアップロード(/uploadフォルダ)
→アップロード検知でLambdaキック、parse処理、jsonに変換してS3にアップロード(/parsed)
→アップロード検知でLambdaキック、ベクトル化、OpenSearchへ取り込み(モデルはBedrodckのものを利用)
②API呼び出し
httpsでPOST処理呼び出し
→API Gatewayで検知、Lambda呼び出し
→Lambda内部でベクトル検索、Bedrockで回答生成、返却
→回答返却
③画面呼び出し
ユーザがWeb画面から入力
→バックエンド処理でAPI Gatewayへアクセス(POST)
※画面についてはDjangoで実装予定