想定読者
- 論文サーベイ時などで、英語PDFを概要をさっと把握するために機械翻訳をかけて母語で大量に流し読みしたい人
- 開発者向けAPIをとりあえず使えればOKの人。※この記事は開発者向けではない
これは何
DeepL のAPIでPDFファイルを翻訳する最低限の手順が書かれているもの
実行可能なColaboratoryつき
https://colab.research.google.com/drive/1pa66KsBYggvNuZNWXYY2xkgwcT1xJcD0?usp=sharing
前提
DeepLの無料アカウント(ブラウザ版)では、月に翻訳可能なファイル数が3つまで。有償アカウントにしても750円のプランでは5つまで、2500円でようやく20まで。5000円で100ファイルまで可能
https://www.deepl.com/ja/pro?cta=header-pro-button/
一方の開発者向けAPIでは、500,000文字まで無料とファイル数とは違う数え方をしている。非常に気合の入ったサーベイ論文でもない限り、3ファイルで500,000文字はいかないので、こっちのほうが翻訳可能な量が多い。さらに有償版でも月630円+1文字あたり0.0025円とブラウザ版よりも小回りがきいて使い勝手が良さそう
ちなみにブラウザ版と開発者APIを併用(ログインするとAPI,ログアウトするとブラウザ版)もできるので、500,000文字+3ファイルは無料で試せる。大変太っ腹でありがたい
事前準備
開発者カウントの無料登録を行う。本人名義でのクレジットカード登録が必要なので手元に用意しておく
https://www.deepl.com/ja/pro#developer
登録後、アカウントページでDeepL APIで使用する認証キーを入手する
https://www.deepl.com/ja/pro-account/summary
翻訳の設定でPDFの翻訳をONにする
https://www.deepl.com/ja/pro-account/translationSettings
翻訳したいファイル(pdf)をダウンロードしておく
実行
Colaboratoryのサンプルを開き、自分のGdriveにコピーしておく(重要)
https://colab.research.google.com/drive/1pa66KsBYggvNuZNWXYY2xkgwcT1xJcD0#scrollTo=4sOxFnCQwQeT
一番上のセルを実行する(再生ボタンをクリックすればOK)。最初だけちょっと時間がかかる()
するとテキスト入力フォームが出てくるので、DeepL APIで使用する認証キーを入力する
左のフォルダアイコンをクリックするとColaboratoryにファイルアップロードできる画面が開く。ここにダウンロードしておいたPDFファイルをアップロードする(ドラッグすればOK)。初回アップロード時は警告がでるが気にせずOKを押す。
アップロードしたファイルにカーソルをあわせると3点リーダーが出現し、そこをクリックするとパスをコピーという表示が出てくる。そこをクリックするとこのファイルのColaboratory上のファイルパスがコピーされる
2番目のセルを実行する。するとまたテキスト入力フォームが出てくるので、さきほどコピーしたファイルのパスを入力する。
3番目のセルを実行する。でDeepL APIが正常に実行できたかを確認。document_idとdocument_keyが表示されればOK
数分から10分くらい待ってから、4番目のセルを実行。実行後にファイルの箇所の更新っぽいアイコン(下の図の中段の真ん中のアイコン)をクリックすると、元のファイル名 + translate.pdf というファイルができる。このファイルを3点リーダーからダウンロードをクリックすると翻訳済みにPDFがダウンロードできる
もしダウンロードしたPDFがひらけない場合は5番目のセルを実行。まだ翻訳中の場合や、翻訳可能文字数上限にひっかかっていた場合にそのことがわかる
文字数上限に引っかかった&もっとDeepLを使いたい人は有償版の利用を検討するのが良いと思います。
上記のColaboratoryを有償版でも使う場合はURLを変更する必要がある点にご注意を