GeminiのAPIがタダなので、論文をたくさんダウンロードしてスクリプトを回しておけば、事前に設定したプロンプトで論文の内容を説明してくれるやつをやりました。
自分はmain.pyのpath/to/pdfにwindowsのCドライブのDownloadsまでのパスを入れていて、ネットサーフィンしてダウンロードした論文たちをDownloads配下のフォルダにまとめて --batch [dir_name]を指定して、帰る前にmain.pyしています。
"path/to/pdf" -> "/mnt/c/Users/username/Downloads/"
論文をダウンロードするときにDownloadsがデフォルトになっているのでここにしています。
/mnt/c/Users/username/Downloads/article.pdfを説明させるときは
python main.py -i article.pdf
複数のpdfをbatchという名前のフォルダに入れて/mnt/c/Users/username/Downloads/batch/の中のpdfを全て説明させるときは
python main.py -b batch
みたいな感じです。
Gemini 1.5 proは2 rpmと書いていますがtime.sleep()を適当に挟んでもなぜかrate limitのエラーが出るので基本Gemini Flashの方しか使っていません。が、一応-pを入れれば最新版の1.5 proを指定できるようにしています。