LLMは味覚を理解できるか?新ベンチマーク「カレーベンチ」
記事の要点 既存のLLM評価手法は、味覚のような官能的・創造的領域を十分にカバーできていない。 新ベンチマーク「カレーベンチ」は、レシピ生成能力と味覚推論能力を実食により評価する。 モデル間で性...
1
0
Comment1
1 search resultsShowing 1~1 results
You need to log-in
記事の要点 既存のLLM評価手法は、味覚のような官能的・創造的領域を十分にカバーできていない。 新ベンチマーク「カレーベンチ」は、レシピ生成能力と味覚推論能力を実食により評価する。 モデル間で性...
1 search resultsShowing 1~1 results
Qiita is a knowledge sharing service for engineers.