Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

This article is a Private article. Only a writer and users who know the URL can access it.
Please change open range to public in publish setting if you want to share this article with other users.

AWS Certified AI Practitioner(AIF)対策:Bedrockの呼び出し(バッチ推論・ストリーミング)

Last updated at Posted at 2024-12-06

Bedrockの呼び出し設定

バッチ推論

大量のデータを一度に処理する場合に使用されます。

ストリーミング

長い応答をリアルタイムで少しずつ受信することを可能にするため、チャットボットやユーザー体験が重要なシナリオに適しています。

バッチ推論

大量データの効率的な処理
企業の顧客レビューのように、一度に大量のプロンプトを処理できます。

結果の保存
推論結果はS3に保存され、後で簡単にアクセスして分析が可能です。

非同期処理
処理がリアルタイムで行われる必要がない場合に最適です。例えば、夜間にバッチジョブを実行して結果を翌日利用するなどの運用が可能です。

バッチ推論ジョブの作成ステップ

  1. バッチ推論に使用する入力データをS3バケットにアップロードする。
  2. S3バケットに入力データを用意した後、推論に使用するモデルやその他の設定をBedrockで構成し、バッチジョブを開始する。

クロスリージョン推論

Bedrockにおいて、複数のAWSリージョン間でトラフィックを分散させることで、需要のピーク時に高いスループットと耐障害性を実現する機能です。

これにより、計画外のトラフィックバーストをシームレスに管理し、サービスの安定性を向上させることができます。

0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?