Rustで学術論文からテキストを抽出する #20 応用編 - arXiv論文収集システム構築⑧ 論文要約のプロンプトチューニング (2)

Last updated at Posted at 2024-12-19


  • サーベイ論文を参考にプロンプトチューニングの主要な手法を試す
    • 参考文献情報を外部知識として与えて論文の要約をブラッシュアップ
前回:Rustで学術論文からテキストを抽出する #19


今回は,プロンプトの技術を軽くレビューし,今回のシステムに取り込めそうなものを組み合わせてプロンプトversion 1.0を実装します.



スクリーンショット 2024-12-18 22.54.38.png

今回のシステムで利用したいのは,Reduce HallucinationおよびUnderstanding User Intentあたりの手法でしょうか.


Category Method
Reduce Hallucination Retrieval Augmented Generation (RAG)
Reduce Hallucination ReAct Prompting
Reduce Hallucination Chain-of-Verification (CoVe) Prompting
Reduce Hallucination Chain-of-Note (CoN) Prompting
Reduce Hallucination Chain-of-Knowledge (CoK) Prompting
Understanding User Intent Active Prompting


Chain-of-Noteはノイズや未知の質問が多いケースに対応するために,質問に関する外部情報 (Note) を作成してそれを参照する形で事実誤認を防ぐ手法です.


version 0.8

テキスト抽出した結果をそのまま使っているので,参考文献でない情報 (ノイズ) も混ざっていますがそのまま与えてみます.

        ###### 指示 ######
            1. この論文はサーベイ論文ですか? [is_survey] 
            2.この論文のリサーチクエスチョンは何ですか? この論文がどんな既存研究を背景にしているかという点も合わせて記述してください. [research_question]
            3. この論文のコントリビューションは何ですか? [contributions]
            4. この論文で使用されているデータセットは何ですか? [dataset]
            4. この論文で提案されている手法やアプローチはどのようなものですか? [proposed_method]
            5. この論文実験結果はどのようなものですか? [experiment_results]
            6. この論文の関連研究との比較はどのようなものですか? できる限り既存研究を参照しながら説明してください. [comparison_with_related_works]
            7. この論文で解決されていない問題は何ですか? [future_works]

        ###### 参考文献リスト #######
        ###### 論文 ######
    "dataset":"この論文で使用されたデータセットは、WMT 2014 English-GermanおよびEnglish-French翻訳タスクにおける約450万の文ペアと3600万の文で構成されている。",
    "experiment_results":"実験結果として、TransformerはWMT 2014 English-German翻訳タスクで28.4 BLEUを達成し、WMT 2014 English-Frenchタスクで41.0 BLEUという新たな単一モデルの最先端スコアを樹立した。これらのモデルは、従来の最良モデルに比べてトレーニングコストが大幅に低く、数日間でトレーニングされた。",

要約の大枠は変わっていませんが (変わっていたら困る!),データセットや参考研究への言及がより詳細になりました.

version 1.0

rsrppでは,セクションごとにテキストを抽出することができるので,Referenceセクションの内容を事前にOpenAI APIに与えて,参考文献リストとして構造化しておきます.

        ###### 指示 ######
            1. この論文はサーベイ論文ですか? [is_survey] 
            2.この論文のリサーチクエスチョンは何ですか? この論文がどんな既存研究を背景にしているかという点も合わせて記述してください. [research_question]
            3. この論文のコントリビューションは何ですか? [contributions]
            4. この論文で使用されているデータセットは何ですか? [dataset]
            4. この論文で提案されている手法やアプローチはどのようなものですか? [proposed_method]
            5. この論文実験結果はどのようなものですか? [experiment_results]
            6. この論文の関連研究との比較はどのようなものですか? できる限り既存研究を参照しながら説明してください. [comparison_with_related_works]
            7. この論文で解決されていない問題は何ですか? [future_works]

        ###### 参考文献リスト #######
        <Title>Layer normalization</Title>
            <Name>Jimmy Lei Ba</Name>
            <Name>Jamie Ryan Kiros</Name>
            <Name>Geoffrey E Hinton</Name>
        <Title>Neural machine translation by jointly learning to align and translate</Title>
            <Name>Dzmitry Bahdanau</Name>
            <Name>Kyunghyun Cho</Name>
            <Name>Yoshua Bengio</Name>

        ###### 論文 ######
    "dataset":"実験には、WMT 2014 English-Germanデータセット(約450万文ペア)およびWMT 2014 English-Frenchデータセット(約3600万文)を使用している。",
    "experiment_results":"Transformerの実験結果は、WMT 2014 English-German翻訳タスクで28.4 BLEU、WMT 2014 English-French翻訳タスクで41.0 BLEUという新しい状態の最先端スコアを達成しており、以前のモデルよりも計算コストが大幅に削減されている。",

出力内容はversion 0.8とあまり変わりませんね...




次回:Rustで学術論文からテキストを抽出する #21

  1. Sahoo, Pranab, et al. "A systematic survey of prompt engineering in large language models: Techniques and applications." arXiv preprint arXiv:2402.07927 (2024).


