Summary
- arXiv論文収集システムの完成型と運用イメージの紹介
crate | GitHub |
---|---|
rsrpp | rsrpp |
rsrpp-cli | rsrpp |
arxiv-tools | rs-arxiv-tools |
ss-tools | rs-ss-tools |
keyword-tools | keywords |
openai-tools | rs-openai-tools |
- | rs-notion-tools |
前回までのあらすじ
前回まででシステムのパーツの実装が完了しました.
今回はパーツを繋ぎ込んだ後の完成型と運用のイメージを紹介します.
システムの完成型
改めて今回のシステム開発の目的を振り返っておくと,今回実装したarXiv論文収集システムの目的は,日々arXivに上がってくる数百本の中から自分にとって重要な論文を効率的に仕分けすることでした.
そこで,①〜⑥を繋ぎ込んだ上で,日次でバッチ処理を実行し,毎日Notionのデータベースに論文が登録されるようにします.
各レコードにはStatus
を割り振っていて,登録されたばかりの論文はReady
となるようにします.
日々の論文チェックでは,Ready
となっている論文を順番にチェックしていって,興味の対象外の論文はComplete
に,後から詳しく確認したい論文はDeep Dive
というステータスに割り振るようにしています.
これまでは,Notionに論文を手動で登録⇨論文の確認が追いつかずに積読が増えていく...という悪循環でしたが,今回のシステムが回り始めれば論文の確認は飛躍的に楽になる...ハズ.
運用イメージ
Notionでは,データベースに対してViewを設定することができるので,日々の論文確認用のViewを作成してできる限り高速に論文をチェックできるようにします.
試しに設定してみているViewが以下.
確認には基本的にタイトルとカテゴリ,リサーチクエスチョンがあれば十分なので,それ以外のデータはパッと見で表示されなくても問題ありません.
画像のような形式で論文のリストが表示されていれば,リサーチクエスチョンに軽く目を通すだけでよく,必要な論文かどうかは数秒で簡単に判別ができます.
一本ずつAbstractを読み込んでいた時代に比べると天国のような環境です...!
日々の論文チェックでは興味対象外の論文の方が数が多いので,興味がある論文以外はまとめて選択してComplete
に放り込むようにしました.
結果残っているDeep Dive
の論文だけをじっくりとチェックすればよくなったので,重要な論文だけに集中することができるようになります.
2025年からはこのシステムをフル活用して,論文を効率的に読んでいこうと思います!
ちなみにパーツのつなぎ込みのところはローカルな実装なので公開していないのですが,これはこれで楽しかったので,機会があればまたどこかのブログで内容を紹介しようと思います.
次回
残りの2回は,実装を紹介する中で説明を端折っていた部分をAppendix的に紹介していこうかなと思います.