1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

はじめに

過去の記事で Azure Prompt Flow を使って RAG を評価する手順を記載しましたが、評価する際にいくつか躓きポイントがあったので、Azure Prompt Flow 側への要望込みでご紹介したいと思います。

Azure Prompt Flow は 2023/10/27 時点でプレビュー段階にあり、今回ご紹介する内容も今後改善される可能性があります(改善されることを期待しています)。

一括テストの進捗状況がわからない

一括テスト(Batch run & Evaluate)で多数のテスト項目を実行中、進捗状況が知りたい場合があると思いますが、Overview 画面には表示されません。フローや Jobs の一覧の _pf_.lines.completed など、実施済の項目数が表示される箇所はあるのですが、実行中には表示されないようです。
Overview 画面ですぐ確認できると便利と思います。

私の場合は、フローの Details ボタンから遷移した先にある Logs タブで進捗を確認していました。
ログを確認すると

[Lines] [Finished: 実施済件数] [Processing: 処理中件数] [Pending: 未実施件数]

の形式でログ出力されている箇所があります。
どの項目を実行中かも次行に表示されるので、長時間完了していないテストがないかを確認することもできます。

スクリーンショット 2023-10-27 184624.png

モデルのクォータ制限でエラーが頻発する

前述のログにもActive threads: 16 / 16といったログが出力されていますが、私が利用した環境では、16 スレッドでテストが並列処理されているようです。
フローで Azure OpenAI Service のモデルを利用している場合、クォータ制限によってモデルの呼び出しでエラーが頻発する事象が発生しました。
私の場合はリトライとウェイトを設けることで回避しましたが、並列度数も制御できた方が調整がしやすいように思います。

評価結果を一括エクスポートできない

各テスト項目の出力と評価結果を確認する場合、Details 画面の Outputs タブからエクスポートが可能なのですが、これが下記の 2 択となっています。

  1. Download current page
  2. Download data export script

スクリーンショット 2023-10-27 190552.png

前者は CSV でエクスポートできるのですが、表示しているページ単位でしかエクスポートできません。1 ページあたりの項目数は 25 個で固定となっているため、項目数が多いと非常に手間がかかります。
後者は全ての項目をエクスポートできますが、script(Python)でダウンロードした後でこれを実行する必要があります。また、Windows で実行する際は、encoding を指定しないとエラーとなるようです。

with open(csv_path, "w", newline="", encoding="UTF-8") as csv_file:

ワンクリックで全項目をエクスポートできるようにしていただきたいところです。

最後に

細かい改善要望を記載していますが、リリース当初から UI も改善されてきており、便利になってきていると感じています。最後の一括エクスポートについても、リリース当初は「Download current page」の機能しかなく、一括エクスポートができたことでかなり手間は削減されました。
今後の改善に期待しています。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?