英語でのオンラインミーティングの議事録を作るのが面倒なので,オンラインミーティングの音声を,自動字幕生成の入力にしてしまい,発言をリアルタイム自動字幕で残すことを考える.
準備
- 仮想音声デバイスBlackHoleのインストール
- https://github.com/ExistentialAudio/BlackHole
- 以前にはsoundflowerがあったがもう開発されてない
- 自動英語字幕作成サービス otter.ai
- アカウント作成しておく
- 日本語の音声認識ならGoogle DocでもOK
BlackHoleのインストール,設定
- githubのreleasesからBlackHole.vx.x.x.pkgをダウンロード,インストール
- githubの説明に従って複数デバイス作成 https://github.com/ExistentialAudio/BlackHole/wiki/Multi-Output-Device
- 参考:[Mac] 仮想オーディオデバイス BlackHole Virtual Audio Driver
こうなればOK
![スクリーンショット 2020-03-19 14.28.37.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F44835%2F91fab1e2-c31c-1dc6-bea0-2982700852b1.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=c8345b36549641b56549e21b097953d0)
サウンドで出力先を,作成した「複数出力装置」に設定
![スクリーンショット 2020-03-19 14.30.06.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F44835%2Faf30c562-768e-5616-0c50-ce55ebbc19f7.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=168f9d05c308c30290c32bcd7ee2ce71)
音声の入力先はBlackHole.
![スクリーンショット 2020-03-19 14.30.14.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F44835%2F01540ced-8505-85d4-2887-1476c1f495d2.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=2f00a9919b22342484b7baf0b63cd812)
なにか動画を再生して,
- 内蔵スピーカーから音が出る
- サウンドの入力レベルが動く
ならOK
otter.aiで自動字幕
オンラインミーティングの代わりにyoutubeの動画を再生して,その音声に自動字幕をつけてみる.
![スクリーンショット 2020-03-19 14.32.41.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F44835%2F0c54a6da-9f1d-5117-06d4-6ca25314fafb.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=3c1c66af436200769c860daec222634f)
動画は,OxfordSparksのWhat is Machine Learning?.ライセンスはCreative Commons.英語字幕がもともと付いているので,自動字幕と比較ができる.
以下がotter.aiの自動字幕.きれいな動画音声なので,ほぼほぼ正確.
![スクリーンショット 2020-03-19 14.32.21.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F44835%2F4d44ea2e-3557-4e2a-7ebf-39b8503c5c0e.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=5eb577935a0c9da1c1ded3cfb2c48997)
終了
使い終わったら入力・出力デバイスを内蔵デフォルトに戻しておく.
![スクリーンショット 2020-03-19 14.32.56.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F44835%2F4e48fc19-a416-a92e-d244-405640290c44.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=ad25a10318ceff1d7039e7c1eaedcd28)
![スクリーンショット 2020-03-19 14.33.02.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F44835%2Fa8d7d76d-7873-224c-7f62-dea0572e0117.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=79fb7341e7d8b1c30e07b3d8b393183b)
問題
- たまに音が聞こえない.何度かデバイスを切り替えるとなぜかできる...
- たぶんマイクの音を拾わないので,聞いているだけのミーティングならOK.発言する場合には,別デバイスを使うのが早い(設定すればできそうだけど).
misc
- macの音声認識に流すときにサウンドが消えないようにする How to keep sound from muting while using dictation?