2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Databricks AI/BI Genieのベンチマーク機能

Last updated at Posted at 2024-09-25

Genieの精度をベンチマークできる機能がパブリックプレビューで公開されました。

想定質問を事前に準備しておき、期待した回答をしているのかどうかを評価することができます。上のマニュアルではこの想定質問をベンチマーク質問と呼んでいます。また、質問に対する回答をSQLで定義することができます。これをSQL回答と呼びます。SQL回答を設定しておくことで、回答の良し悪しを自動で評価することができますので推奨となっています。

早速試してみます。私がよく使っているCOVID-19の感染者数データを使います。Genieスペースにアクセスすると、画面左にBenchmarksアイコンが追加されています。
Screenshot 2024-09-25 at 9.57.28.png

評価タブと質問タブがあります。質問タブをクリックします。
Screenshot 2024-09-25 at 10.01.48.png

こちらでベンチマーク質問を追加します。ベンチマークを追加をクリックします。
Screenshot 2024-09-25 at 10.03.00.png

ここで、質問とSQL回答(オプション)を指定します。
Screenshot 2024-09-25 at 10.03.30.png

以下のように質問と回答をセットで追加していきます。プレビューでSQLを実行することも可能です。
Screenshot 2024-09-25 at 10.04.00.png
Screenshot 2024-09-25 at 10.04.34.png

質問を追加したら、右上のベンチマークを実行をクリックします。
Screenshot 2024-09-25 at 10.05.10.png

ベンチマークが実行されます。
Screenshot 2024-09-25 at 10.06.09.png

回答が設定されていない質問に関しては、手動でのレビューが必要です。
Screenshot 2024-09-25 at 10.06.09.png

回答が設定されている場合は自動で評価されます。
Screenshot 2024-09-25 at 10.07.14.png

質問を変えながらベンチマークを繰り返すことも可能です。
Screenshot 2024-09-25 at 10.08.41.png

また、回答に対するフィードバックを踏まえて、ベンチマーク質問を見直すことも有益だと思います。
Screenshot 2024-09-25 at 10.09.09.png

これによって、Genieの精度を維持・改善することができます。是非ご活用ください!

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?