0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

DeepL 無料版を活用する ... PDF ファイルの翻訳を中心に

Last updated at Posted at 2021-12-01

WEBで無料で使える翻訳ソフトはいろいろあって Goole、DeepL が代表的なものかと思う。私の愛用は DeepL ほんとうに自然な翻訳で早いし申し分ない。ここ Qiita に来るような皆様は当然使っていることと思うが、備誌録も兼ねて無料版活用メモを記しておく。

アプリのインストール

私は PC に余計なソフトをインストールしたくない方針なので DeepL アプリをインストールせずに DeepL のホームページ にアクセスして所定の Window にテキストやファイルを貼り付けたりして翻訳させてた。WEB のページを読みながら翻訳したりするときに TAB を切り替えたりするのが面倒になりアプリをインストールした。今は2画面ディスプレイを使用していることもあり、使いよいと思う。

PDFコピペ時の改行の削除

いろいろなところで話題にされているが、PDF ファイルのから英文をコピーして DeepL に貼り付けて翻訳する際に不要な改行が入ってしまって正確に翻訳されない。
こんなふうに改行を文の終わりと判定して翻訳してしまう。
DeepLNG.jpg
不要な改行を消して翻訳すると
DEEPLOK.jpg
きれいに翻訳される。改行を取り除くにいくつか方法があるようでアプリも発表されている。アプリをインストールしないで使うには、こちらの WEB
[ Shaper] (https://dream-exp.net/shaper/)
にアクセスしてテキストコピペすると改行を削除ししたテキストを生成してくれる。それをそのまま DeepL に翻訳することもできるようになっている。他にも Crome を PDF Reader として使うとコピペしても余分な改行が生成されないようである。
 Qiita の記事 [PDFの英語論文をコピペして翻訳するときに改行を簡単に取り除く方法] (https://qiita.com/Kyou13/items/87285426b13e3969ecb7)
にくわしい。

PDFファイル一括翻訳の活用

DeepL では WORD、PowerPoint、PDF のファイルであればファイルごと一括して翻訳することができる。論文や資料などは PDF形式 となっていることが多い。PDF ファイルを翻訳させてみると画像、図表などもとの文書の形式を保ったまま翻訳されるので読みやすい。
WEB のページを翻訳するときには PDF にプリントして翻訳すると便利である。Windows10 では 標準で PDF プリンタがあるのでそれを使う。WEB のページをプリントする際に「ページを単純化」指定を行うと本体のみを印刷してくれる。通常の印刷だとフレームも印刷して邪魔だが、
20211230201803.jpg
「ページを単純化」指定すると
20211230202227.jpg
WEB の作りにもよるが、このように記事の本体がきれいにプリントされ、ファイルサイズも小さくなる。
WEB のページをプリントする際にリンクの階層(?)をたどって全部プリントできると良いが、広告があったりして余計なものをプリントしてしまうので、個別にプリントしてファイルを結合するのが良い。もう少し便利な TOOL があれば良いのだが。

無料版の制限

アプリや WEBの画面でテキストをペーストして翻訳するときは 5000 字となる。WORD、PowerPoint、PDF ファイルの一括翻訳は、月3ファイルまでで WEB では明示されていないが1ファイルあたり 10万字以下となっている。いろいろやってみると PDF ファイルでは 50~60 ページ程度であった。ためしに 150 ページのファイルを翻訳させるとこのように表示される。
ScreenshotDeepL.png

小さいファイルは結合して翻訳する

WEB ページを PDF でプリントしたものや、小さな論文・資料などはテーマごとにまとめてファイルを結合して翻訳する。

大きいファイルは分割して

当然のことであるが大きなファイルは無料版の制限に合うように 50~60 ページに分割する。Free の PDF 操作ソフトでは、分割・結合できないのも多い。私はこれだけのために Acrobat の古いバージョンを後生大事に使っている

実際に翻訳させてみると

もとの PDF のフォーマットを維持したままきれいに翻訳されるが、数式を無理やり翻訳してしまう。
こんな数式が
nmrE.png
このように全く意味をなさない形に翻訳されてしまう。
nmrJ.png
これを避ける方法は無いようで、しいてあげれば元の文書から画像としてコピーして貼り付けるくらいだろうか。私は無理せずに元の文書を参照するようにしている。
雑誌の記事などで広告があるとこのようにテキストとして抽出できるところは、やはり無理やり翻訳してしまう。
DeepADplus.jpg

追記

翻訳された PDF ファイルは、編集・印刷ができないようになっている。前述のように無理やり翻訳された数式の箇所にオリジナルからコピーして貼り付けようとしてもできない。以前に翻訳したファイルを確認すると編集・印刷ができるので、これが無料版の制限なのかどうかは分からない。

有料版へ変更しようか

有料版の一番安い Starter 月750円  では
・コピペで翻訳する字数の制限なし
・ファイルの大きさが MAX 10MB、5ファイル
までとなっている。無料と比較するとそんなに増えた感じはしないが、PDF 1ファイルあたり 100万字とのことなので 500 ページの文書が翻訳できることになり、本をまるごと翻訳できそうである。前述のファイルをまとめて翻訳させるということを活用すると 月750円 という有料版も視野に入れるべきかとも思う。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?