一気に大量のデータを同期したため、2日間位同期処理が終わらずCohere Embed Modelの利用料が$30位行ってしまいました
手順
下記同期の箇所です。
①Lambda用のIAMロールにbedrock:StartIngestionJob
を追加
②Lambdaを作成
import boto3
def lambda_handler(event, context):
client = boto3.client('bedrock-agent')
response = client.start_ingestion_job(
knowledgeBaseId='ナレッジベースID',
dataSourceId='データソースID'
)
③EventBridgeでLambdaを定期実行
差分データ
同期は増分であるため、前回の同期以降に追加、変更、または削除されたドキュメントのみを処理します。