Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

This article is a Private article. Only a writer and users who know the URL can access it.
Please change open range to public in publish setting if you want to share this article with other users.

AWS Certified AI Practitioner(AIF)対策:Bedrock 評価・プレイグラウンド

Last updated at Posted at 2024-12-17

Bedrock 評価

『基盤モデルを評価し、性能を比較するための機能』

複数の基盤モデルを同じ基準で評価し、性能を比較できます。

この機能を活用することで、企業はニーズに最適なモデルを選定し、実運用前に問題を特定することが可能です。

評価には、2種類があります。

自動評価

プロンプトと期待される応答を設定することで、モデルのパフォーマンスを自動的にテストできます。

  • 組み込みのデータセット
  • 独自のデータセット

の両方を使用できます。

ヒューマンレビューとの組み合わせ

自動評価に加えて、必要に応じてヒューマンワーカーによる応答の質的な評価も実施可能です。

  • 独自のデータセット

のみ使用できます。

Bedrock プレイグラウンド

AWS Management Console 内で提供されている ビジュアルインターフェイス で、さまざまな基盤モデルを使用して推論を実行し、設定を調整しながら実験を行うことができます。

これにより、アプリケーションに統合する前にモデルの応答をテストし、最適な設定を見つけることが可能です。

0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?