この記事を読んでできるようになること
Couseraで公開されている日本語字幕のないコースを日本語で履修できるようになります。
※DeepLPROを利用する場合最低月額750円かかります。
スムーズな翻訳には有料のPROがおすすめです。
画像はBuild a Modern Computer from First Principles:
From Nand to Tetris (Project-Centered Course)より
Couseraとは?
""コーセラ(英名:Coursera)は、スタンフォード大学コンピュータサイエンス教授Andrew NgとDaphne Kollerによって創立された教育技術の営利団体である。世界中の多くの大学と協力し、それらの大学のコースのいくつかを無償でオンライン上に提供している。""
簡単に言えばめちゃくちゃクォリティの高い授業を無料で受けられる場所です。
お金を払えばスタンフォード大学の修了証が発行されたりとニヤニヤできる特典もあります。
Couseraでありがちなこと
・翻訳してもミニプレーヤーになってしまって見にくい
・Google翻訳が微妙でよくわからない
・動画と一緒に字幕が表示された方が絶対にわかりやすいのに・・・
・しょうがないのでデュアルモニタで翻訳文と一緒に動画を再生している
VLC+DeepLPROの組み合わせで解決する
Couseraの字幕ファイルは「vtt」という形式で管理されています。
下記のサンプルを見たらわかるように、何分何秒まではこの字幕だよ!と書いているだけです。
時間の下が字幕本文というわけです。
サンプル
1
00:00:02.716 --> 00:00:04.516
This is a pen!
2
00:00:04.516 --> 00:00:10.660
English is difficult.
3
00:00:10.660 --> 00:00:15.090
I want to translate.
4
00:00:15.090 --> 00:00:18.430
Yeah!
5
00:00:18.430 --> 00:00:22.890
This is cool!
Couseraでは動画の他にこの「vtt」ファイルもダウンロードできるので、vttファイルをDeepLで翻訳してやろうというわけです。
また、VLCプレイヤーという動画再生プレイヤーはデフォルトでvttファイルに対応しています。
動画を再生しながらvttファイルをドラッグ&ドロップしてあげるだけで、日本語字幕付き動画として再生できるのです。
翻訳クォリティについて
素の状態ではB-くらいの印象です。
これはCouseraで公開されている文章が、DeepLにとって読みにくい状態だからです。
例えば、This is a pen or cat. It's so cool.という文章があった時、字幕ではこうなっていることがあります。
00:00:15.090 --> 00:00:18.430
This is a pen
5
00:00:18.430 --> 00:00:22.890
or cat. It's
6
00:00:22.890 --> 00:00:22.999
so cool
こうなると「これはペンです」「もしくは猫。それはそうです」「かっこいい」のような字幕が表示されてしまうわけです。
とはいってもないよりはマシです。
翻訳クォリティアップの手段2選
①シェルスクリプトで「.」で区切ることを前提に字幕文章を組み立て直し、DeepLにかける。
文章の始まりの時間と「.」があった時間を記録しておく。
該当する場所にスクリプトで字幕を挿入する。
こんな感じの実装が1番スムーズそう。
調べてみると実際に似たようなことを他の方も行っていました。
https://qiita.com/kitakitash/items/df808c010639ea1ff0f1
②txt形式のファイルをダウンロードし、補助教材として使う。
txt形式でも字幕文は公開されています。
こちらの方が「.」の位置が正しい位置にあることが多く、翻訳がより自然でした。
わかりにくい部分をtxt形式の翻訳で見返すというのが一番簡単ですが、少しめんどくささが残ります。
感想
有名大学の授業を月額750円で学習可能になるDeepLつよい。