最終的にやりたいこと
こういうことをしたいです。
1. pdf を手動でコピペする
2. Shaper で整形する
このような神 Web アプリがあります。
整形されます。
そのまま「DeepL で翻訳」ボタンを押します。
3. DeepL で翻訳
DeepL で翻訳します。すごい勢いで翻訳枠を食っていくので、無課金の民は気をつけましょう。実際、Google 翻訳や他の翻訳アプリでも差し支えない気がします。
4. ゆっくりムービーメーカーで字幕をつける
ゆっくり解説動画でおなじみの「ゆっくりムービーメーカー」を使います。私は持っているバージョンが 3 だったので 3 を使いましたが、最新版は 4 なので、4 を使うのがよいかもしれません。とりあえず以下の実例は 3 です。
知らない方に説明すると、テキストを入れるとゆっくり音声と字幕と(必要であればアニメーション)を生成してくれるという、解説動画を作ることに特化した神動画作成アプリです。
デフォルトの設定(いわゆる「ゆっくり霊夢」)では少し遅い気がするので、好みの設定にしてプリセットキャラクターを作ります。上の図では「論文読み上げちゃん」と名付けて、速度を少し上げています。ここら辺は好みでどんどん調整してしまっていいと思います。
プリセットを「論文読み上げちゃん」にして、テキストをコピペしてエンターキーを押すと、
このように字幕の動画オブジェクトが生成されます。テキストによっては、特殊な文字が入っているせいか、短いオブジェクトになってしまいますが、音声自体は最後まで生成されているので、そういう場合はマウスで末尾を調整すれば大丈夫です。
後は、この動画(≒音声)を流しながら論文の該当箇所を読めば、まるでゆっくり音声で丁寧に解説してもらっているかのような錯覚に陥り、疲労が少なくなるとともに読解力が爆上がりします。
Limitations and Future Work
このワークフローにおいて、人間の負担を拭い去れていない点はいくつかあります。
- pdf からのコピペ
- いくつかのクリック
- ブラウザのタブ間、またはブラウザとゆっくりムービーメーカーとの行き来
- それらの往復を何回も繰り返すこと
このあたりをうまく自動化できたら、pdf を読み込ませたら自動的に(疑似)解説音声を生成してくれるようなスクリプトが出来て、更に生産性が上がるかもしれません。