英語でのオンラインミーティングの機会が多く、リアルタイム自動字幕生成があると便利だと考えて環境をセットアップしてみました。
使用OSはWindowsになります。
Macの方は、既に投稿された記事があるのでそちらを参照してください。
[Macの仮想音声デバイスを使って音声認識でオンラインミーティングの自動字幕作成]
(https://qiita.com/tttamaki/items/a6cf6e9d88c121a91c70)
概要
otter.aiにアカウントを作成しブラウザでアクセスすることで、オーディオ入力からリアルタイムで文字起こしをすることが可能です。
(下図参照)
そこで、オーディオ出力を分岐させ、片方を通常出力し、もう片方をオーディオ入力に接続することで、otter.aiの機能を使ってリアルタイム文字起こしを実現できます。(下図参照)
なお、補足情報ですがotter.aiは1カ月で600分まで無料で利用できるとのことです。
Otter Plans
準備
- 仮想オーディオミキサーVoiceMeeterBananaのインストール
https://www.vb-audio.com/Voicemeeter/banana.htm - 仮想オーディオデバイスVB-CABLEのインストール
https://www.vb-audio.com/Cable/ - 自動英語字幕作成サービス otter.ai
アカウント作成しておく
仮想オーディオミキサーVoice Meteer Bananaの設定
- サウンドの出力を仮想オーディオミキサーVoice Meeter Bananaに設定
出力デバイスを下記の図のように**VoiceMeeter Input(VB-Audio VoiceMeeter VAIO)**に設定してください。
(VoiceMeeter Aux Input(VB-Audio VoiceMeeter AUX VAIO)もあるので注意してください。)
![soundoutput.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F57937%2F0795ca8c-abaa-6bbf-34c9-f35cc40d2d58.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=eafc415d4644bac7e627b9ffed22ca8c)
- Voice Meeter Bananaの起動と設定
Voice Meeter Bananaを起動して、青色の枠で囲われた左側のVIRTUAL INPUTSの設定のA1,A2を有効にしてA1とA2に出力します。
また、右上のA1,A2を選択して、A1を通常のオーディオ出力デバイス、A2をCABLE Input(VB-Audio Virtual Cable)に設定してください。(下図参照)
こうすることで、オーディオ出力を分岐させ、片方を通常出力し、もう片方を仮想オーディオデバイスVB-CABLEに接続できました。
なお、Voice Meeter Bananaの設定が終わっても、Voice Meeter Bananaは終了させないでください。Voice Meeter Bananaを終了させてしまうとどこからも音が出力されなくなってしまいます。
![vmbanana02.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F57937%2F23b16873-eb4c-4fa2-6b5c-24649fbc3243.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=18feb70bf96a206434c620a3340c6440)
仮想音声デバイスVB-CABLEの設定
- VB-CABLEの出力設定
上記Voice Meteer Bananaの設定で、既にVB-CABLEとオーディオ出力が接続されていますので、下図のようにサウンドの入力にCABLE Output(VB-Audio Virtual Cable)を設定することでVB-CABLEとオーディオ入力が接続されます。
![soundinput.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F57937%2F231d0437-86bf-3146-7cb7-6af84a952f0a.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=cc294198eaed46ac7a0a7577fc7737fc)
otter.aiで書き起こし
otter.aiでの書き起こしは、otter.aiにブラウザでアクセスし、オーディオ入力からのリアルタイム書き起こしをスタートさせるだけで下記の図のように書き起こしが可能になります。下記は、Youtubeの動画の書き起こしをしていますが、他のアプリでも同様の処理が可能です。
参考ページ
[Windowsで writer-app + VB-Audio Virtual Cableを使った完全自動文字起こしの方法]
(https://popcorns.jp/blog/writerapp/auto-transcription-with-windows/)