4
7

More than 1 year has passed since last update.

キーワードを入力すると、論文の一覧を抽出して、翻訳して、エクセルにまとめるコード

Last updated at Posted at 2023-05-23

概要

この記事では、ユーザーが入力したキーワードを元にPubMedで医学生物学論文を検索し、その論文に関する情報をエクセルにまとめる方法について解説します。また、抽出したAbstractは日本語に翻訳します。

手順まとめ

  1. 「胃癌 手術 栄養」などの検索キーワードをユーザーが入力する
  2. キーワードを元に医学生物学論文検索サイトPubMedで検索し、関連度の高い論文をピックアップする(最大10個)
  3. Abstractを翻訳する
  4. リンク、タイトル、年、著者、Abstract、翻訳したAbstractをエクセルにまとめる

image.png

手順1: キーワードの入力

まず、ユーザーが「胃癌 手術 栄養」などの検索キーワードを入力します。このキーワードは、検索したい論文の内容に関連するものを選びます。

入力されたキーワードが日本語の場合は、英語に自動変換します。この変換は、翻訳AI(Pythonのgoogletransライブラリ)を用いて行われます。

image.png

手順2: PubMedでの検索

変換したキーワードを元に、医学生物学論文検索サイトPubMedで検索を行います。このとき、関連度の高い論文を最大10個ピックアップします。

  • 検索ワードによってはあまり論文がヒットせず10個に満たないことがあります。
  • 上手く著者情報などが取得できない場合があります。

手順3: Abstractを翻訳する

次に、Pythonのgoogletransライブラリを用いてAbstractを翻訳します。

手順4: エクセルへのまとめ

最後に、ピックアップした論文のリンク、タイトル、発行年、著者、Abstract、Abstractの翻訳をエクセルにまとめます。シート名はユーザーが入力した検索ワードとしています。

  • エクセルの仕様として、シート名が32文字以上となる場合、31文字で収まるように文字が切り詰められます。
  • 複数回実行した場合は、paper.xlsxにシートが追記されていきます。上書きされることはありません。

image.png

お知らせ💡

Streamlitを用いて簡易ウェブアプリにしました!

image.png

ソースコード一覧

ソースコード一覧は下記のGitHubをご覧ください。

まとめ

以上が、キーワードを入力すると、論文の一覧を抽出して、翻訳して、エクセルにまとめるコードです。このコードを用いることで、論文を効率よく探し出してまとめることができれば嬉しいです。ぜひお試しください!

参考文献

この記事は以下の情報を参考にして執筆しました。

4
7
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
7