【論文流し読み】2024_A Survey on LLM-as-a-Judge
LLM as a judgeとはなにか。 LLMを用いて、 LLMへのインプットとLLMの出力から、出力物の評価を出力するシステム。 タスクの学習方法 通常、タスクの定義にはIn context...
0
0
Comment0
2 search resultsShowing 1~2 results
You need to log-in
LLM as a judgeとはなにか。 LLMを用いて、 LLMへのインプットとLLMの出力から、出力物の評価を出力するシステム。 タスクの学習方法 通常、タスクの定義にはIn context...
要約 質問エージェント & 評価エージェントのみの単純構造では傾聴+質問のようになってしまっていて、「深堀り」はできない。 「ユーザーから得た出力が特定のカテゴリに当てはまるか」のルック...
2 search resultsShowing 1~2 results
Qiita is a knowledge sharing service for engineers.