0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【論文流し読み】2024_A Survey on LLM-as-a-Judge

Last updated at Posted at 2025-03-29

LLM as a judgeとはなにか。

LLMを用いて、
LLMへのインプットとLLMの出力から、出力物の評価を出力するシステム。

タスクの学習方法

通常、タスクの定義にはIn context learningが使われる。

スコア生成

何点ですか?と聞く。
image.png

Yes / No question

image.png

ペアワイズ比較

どちらがいいですか?と聞く。
image.png

選択制の問題

それが当てはまりますか?を聞く。

image.png

LLM as a judgeの実践

image.png

全体としては、手元にあるground truthへの評価と、新たな事例を得ての再評価を実施することで
改善を図っていく。

改善戦略

image.png

Optimizing Output Forms

そのままスコアを出させようとすると、フォーマットに沿わない出力をしたりするので、構造化された出力を要請するなどして出力を安定させる。

Integration of multiple Evaluation results

偶発的なエラーやランダムの影響を軽減するために、複数回出力の結果を集計(平均など)する。

DirectOptimizationofLLNPutputs

出力スコアに後処理を加えることで、指標としてより最適なものにする。
(スコア平滑化など)

評価器の指標

基本指標

アラインメント

人間の評価と評価器の評価が一致した割合
image.png

(ほかには、CohenのKappaやスピアマンの相関係数など。)

バイアス

バイアスの無い評価ができているか?

  • ポジションバイアス(特定の位置にある応答を好む傾向)
  • 長さバイアス(長い / 短い応答をより好む)
  • 自己高揚バイアス(自分の作成した文章をより好む)
    • 評価者と同じモデルを用いない、などの工夫が必要
  • そのほかのバイアス
    • 性別、人種、性的指向
    • (絵文字など)視覚的に魅力的なコンテンツ
    • 具体性バイアス(権威のある情報源、数値をより好む)
      • 権威バイアス、引用バイアスとも。
    • 感情バイアス
      • 怒り、悲しみなど特定の感情を好む傾向

敵対頑健性

高いスコアを得ることを目的に作られた入力にモデルが耐える能力

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?