はじめに
自分は読んだ論文をまとめる際にGitHubを用いています。この記事ではちょっとしたTipsをいくつか共有しようと思います。
自分がやっている方法
- サーベイしたい分野のためのGitHubリポジトリを作成する
- イシューテンプレートを作成する
- 読みたい論文を見つける
- Issueを立てる
- 『落合フォーマット』で論文をまとめる
- 3に戻る
GitHubリポジトリで論文をまとめるメリット
単純な好みです。色々と論文管理アプリはありますが、エンジニアとして慣れ親しんでいるGitHubを用いるのが手に馴染みました。また色々とカスタマイズ性が高いことも良いです。マークダウン記法を用いることができて、スクショで画像を簡単に貼り付けられる点が気に入っています。
『落合フォーマット』を用いる理由
一言で表すと、読む → 理解する → 活用する の流れがスムーズになります。自分は論文を読んで、その後何かに活かすことを意識しています。その際に、『落合フォーマット』が非常に有益でした。論文を読むという活動を、行動レベルに落とし込める点が気に入っています。また、フォーマットを決めておくことで、見返した際に何がどこにあるかがすぐにわかります。
『落合フォーマット』については下記のスライドの65ページをご確認ください。
イシューテンプレートについて
自分は下記のイシューテンプレートを用意しています。論文をまとめる方法として人気の『落合フォーマット』をテンプレートとして用意します。Issueを立てると、自動的にテンプレートが挿入されます。ちょっとしたTipsですが、論文を読むハードルを下げる効果があります。
# 0. Paper
- paper: [link]()
# 1. これは何?
# 2. 先行研究と比べて優れているところは?
# 3. コアとなる技術や工夫は?
# 4. どのように評価している?
# 5. 議論はある?
# 6. 次に読むべき論文は?
# 7. その他
空のIssueを防ぐ設定(blank_issues_enabled: false)もしておくと良いと思います。
リポジトリにIssue テンプレートを設定する方法は、下記の公式ドキュメントをご確認ください。
リポジトリを分ける粒度について
一つのリポジトリに論文をまとめ続けると量が多くなり過ぎるので、サーベイしたい分野ごとにリポジトリを分けています。Kaggleに参加している場合は、そのコンペのために論文調査リポジトリを作成します。実際の開発リポジトリとは分けて作成するようにしています。
翻訳ツールについて
ChatGPTやNotebookLMなどのチャットAIツールを使うことで論文についての翻訳と内容に関する質問を同時に行うことができます。
単純な翻訳性能に関して言うと、最近リリースされたPLaMo™翻訳のPDF翻訳機能が最も高性能だと思います。
参考にしたもの
