はじめに
Bedrock Data Automation(BDA) をナレッジベースで使ってみました.
https://aws.amazon.com/jp/bedrock/bda/
前回に引き続き, 今回も画像を解析してもらいます.
やってみる
データソースを設定
パーサーとしての Amazon Bedrock データオートメーションを選択します.
データソースバケットは前回と同じもので, 中身もコーギーとアメショの2枚です.
データストレージと処理を設定
確認して作成
同期
ナレッジベースが作成されたら, 同期ボタンを押してデータソースとナレッジベースとを同期させましょう.
テストしてみる
最後に
使い分けを脳みそにインデックス化したいので下記個人的なメモ.
もし RAG ドキュメントに画像, グラフ, 表, 図などが含まれており
それらを検索可能にしたい/説明を付けたい場合は, 基盤モデル or BDA を使用する.
基盤モデルを使用する場合はシステムプロンプトを指定できる(BDA は不可).
図のラベル, 表の注記, 細かい文脈情報などをなるべく損なわずに保持したいなら
基盤モデルを使用する方が柔軟にプロンプト制御できる点で有利な可能性がある.
BDA は, プロンプト指定せずうまくやっといてほしい場合に使う感じでしょうか?
細部レベルでの情報は不要な, 標準的な抽出・説明タスク向けとして認識しておく.
料金に関しては,
基盤モデルは解析時の入出力トークン消費量, BDA は解析処理した画像枚数(画像の場合).