0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Rustで学術論文からテキスト抽出するクレートを実装するAdvent Calendar 2024

Day 23

Rustで学術論文からテキストを抽出する #23 応用編 - arXiv論文収集システム構築11 - システム完成

Last updated at Posted at 2024-12-24

Summary

  • arXiv論文収集システムの完成型と運用イメージの紹介
crate GitHub
rsrpp rsrpp
rsrpp-cli rsrpp
arxiv-tools rs-arxiv-tools
ss-tools rs-ss-tools
keyword-tools keywords
openai-tools rs-openai-tools
- rs-notion-tools

前回までのあらすじ

前回:Rustで学術論文からテキストを抽出する #22

image.png

前回まででシステムのパーツの実装が完了しました.
今回はパーツを繋ぎ込んだ後の完成型と運用のイメージを紹介します.

システムの完成型

改めて今回のシステム開発の目的を振り返っておくと,今回実装したarXiv論文収集システムの目的は,日々arXivに上がってくる数百本の中から自分にとって重要な論文を効率的に仕分けすることでした.

そこで,①〜⑥を繋ぎ込んだ上で,日次でバッチ処理を実行し,毎日Notionのデータベースに論文が登録されるようにします.

各レコードにはStatusを割り振っていて,登録されたばかりの論文はReadyとなるようにします.
日々の論文チェックでは,Readyとなっている論文を順番にチェックしていって,興味の対象外の論文はCompleteに,後から詳しく確認したい論文はDeep Diveというステータスに割り振るようにしています.

スクリーンショット 2024-12-25 2.09.24.png

これまでは,Notionに論文を手動で登録⇨論文の確認が追いつかずに積読が増えていく...という悪循環でしたが,今回のシステムが回り始めれば論文の確認は飛躍的に楽になる...ハズ.

運用イメージ

Notionでは,データベースに対してViewを設定することができるので,日々の論文確認用のViewを作成してできる限り高速に論文をチェックできるようにします.

試しに設定してみているViewが以下.

確認には基本的にタイトルとカテゴリ,リサーチクエスチョンがあれば十分なので,それ以外のデータはパッと見で表示されなくても問題ありません.
画像のような形式で論文のリストが表示されていれば,リサーチクエスチョンに軽く目を通すだけでよく,必要な論文かどうかは数秒で簡単に判別ができます.
一本ずつAbstractを読み込んでいた時代に比べると天国のような環境です...!

スクリーンショット 2024-12-25 2.13.44.png

日々の論文チェックでは興味対象外の論文の方が数が多いので,興味がある論文以外はまとめて選択してCompleteに放り込むようにしました.

結果残っているDeep Diveの論文だけをじっくりとチェックすればよくなったので,重要な論文だけに集中することができるようになります.

2025年からはこのシステムをフル活用して,論文を効率的に読んでいこうと思います!

ちなみにパーツのつなぎ込みのところはローカルな実装なので公開していないのですが,これはこれで楽しかったので,機会があればまたどこかのブログで内容を紹介しようと思います.

次回

残りの2回は,実装を紹介する中で説明を端折っていた部分をAppendix的に紹介していこうかなと思います.

次回:Rustで学術論文からテキストを抽出する #24

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?