はじめに
論文や報告書のような巨大なPDFを翻訳したい。しかし、DEEPLやGoogle翻訳では巨大なファイルの翻訳は有料であったりできない。
今回の実行するMega-Gorilla/Index_PDF_Translationは巨大なPDFも無料で翻訳することができる。このリポジトリのWindowsでの実行メモである。
実効方法
PowerShellを開いてリポジトリをダウンロードする。
git clone https://github.com/Mega-Gorilla/Index_PDF_Translation.git
仮想環境を作成して仮想環境の有効化。
python -m venv venv
.\venv\Scripts\Activate.ps1
依存関係をインストール。
pip install -r requirements.txt
python -m spacy download en_core_web_sm
python -m spacy download ja_core_news_sm
リポジトリのプログラムをインストールする。
pip install .
カレントディレクトリに翻訳したいinput.pdfを配置してコマンドを実行して翻訳。
translate-pdf input.pdf
おわりに
PDFを翻訳することができた。レイアウトも崩れていない。