概要
この記事では、ユーザーが入力したキーワードを元にPubMedで医学生物学論文を検索し、その論文に関する情報をエクセルにまとめる方法について解説します。また、抽出したAbstractは日本語に翻訳します。
手順まとめ
- 「胃癌 手術 栄養」などの検索キーワードをユーザーが入力する
- キーワードを元に医学生物学論文検索サイトPubMedで検索し、関連度の高い論文をピックアップする(最大10個)
- Abstractを翻訳する
- リンク、タイトル、年、著者、Abstract、翻訳したAbstractをエクセルにまとめる
手順1: キーワードの入力
まず、ユーザーが「胃癌 手術 栄養」などの検索キーワードを入力します。このキーワードは、検索したい論文の内容に関連するものを選びます。
入力されたキーワードが日本語の場合は、英語に自動変換します。この変換は、翻訳AI(Pythonのgoogletransライブラリ)を用いて行われます。
手順2: PubMedでの検索
変換したキーワードを元に、医学生物学論文検索サイトPubMedで検索を行います。このとき、関連度の高い論文を最大10個ピックアップします。
- 検索ワードによってはあまり論文がヒットせず10個に満たないことがあります。
- 上手く著者情報などが取得できない場合があります。
手順3: Abstractを翻訳する
次に、Pythonのgoogletransライブラリを用いてAbstractを翻訳します。
手順4: エクセルへのまとめ
最後に、ピックアップした論文のリンク、タイトル、発行年、著者、Abstract、Abstractの翻訳をエクセルにまとめます。シート名はユーザーが入力した検索ワードとしています。
- エクセルの仕様として、シート名が32文字以上となる場合、31文字で収まるように文字が切り詰められます。
- 複数回実行した場合は、paper.xlsxにシートが追記されていきます。上書きされることはありません。
お知らせ💡
Streamlitを用いて簡易ウェブアプリにしました!
ソースコード一覧
ソースコード一覧は下記のGitHubをご覧ください。
まとめ
以上が、キーワードを入力すると、論文の一覧を抽出して、翻訳して、エクセルにまとめるコードです。このコードを用いることで、論文を効率よく探し出してまとめることができれば嬉しいです。ぜひお試しください!
参考文献
この記事は以下の情報を参考にして執筆しました。