【一言で言うと】
少数かつ短文の文書集合に対するトピックモデリングにおいて、大規模言語モデル(GPT-3.5, GPT-4)は、既存のトピックモデルよりも優れた性能を発揮し、実用上の懸念点(例えばhallucination)は無視できる程度であることを示した
【タイトル/URL】
大規模言語モデルによる少数かつ短文の文書に対するトピックモデリング
https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/A5-3.pdf
【まとめ】
・トピックの品質評価に標準的な指標(Coherence, Diversity)だけでなく、新しい指標(Document Coverage, Factuality)を導入している
・GPT-3.5とGPT-4は既存のトピックモデルに比べて高品質なトピックを出力でき、出力安定性についても実用的に十分である
【感想】
トピックモデリングは医療カウンセリングでも有用と感じた。クライエント都の対話文からトピックを抽出するには長文の文章集合が必要か。