LoginSignup
0

posted at

updated at

Organization

Zoom Meeting SDKでアバターにいろいろしゃべらせる

はじめに

ZoomがSDKを提供しはじめたということで盛り上がりを見せている昨今ですが、Qiitaでも盛り上げイベントが開催されています。SDKでいろいろ遊ばせてもらえる上に、アイテムもゲットできるかも、ということで参加するしかないですね。

ということで、これを機にいろいろ実験してみたのですが、面白そうなことがたくさんできそうだったので、いくつか連投する予定です。ご興味を持たれましたら、後続の投稿もご覧ください。

第1回の記事はこちら⇒Zoom Meeting SDKでタイムキーパーちゃんを作る
第2回の記事はこちら⇒Zoom Meeting SDKでアバターにいろいろしゃべらせる ←本記事
第3回の記事はこちら⇒Zoom Meeting SDKをつかって会議にアバターで参加する
第4回の記事はこちら⇒Zoom Meeting SDKでなんちゃってボイスチェンジャー
番外編の記事はこちら⇒Zoom Meetingにアバターで参加するぞ。番外編
第5回の記事はこちら⇒Zoom Meeting SDKとVosk browserでZoom会議のリアルタイム文字起こし

今回は、タイムキーパーちゃん改め時報ちゃんにいろいろとしゃべらせてみようと思います。出来上がりはこんな感じです。

英語だとこんな感じ。

とりあえず、Dockerイメージにしているので、ダウンロードして使ってみてください。
なお、音声はVoiceVoxOpenTTSを使わせていただいています。この二つも起動してください。VoiceVoxは、無料とは思えない高品質でかわいい声ですね。びっくりします。OpenTTSもおそらく、英語は良い発音なのだと思いますが、よくわかりません(笑い)。

$ docker run -p 8888:8888 dannadori/zoom-meeting-plus:v02
$ docker run --rm -it -p '127.0.0.1:50021:50021' voicevox/voicevox_engine:cpu-ubuntu20.04-latest
$ docker run -it -p 5500:5500 synesthesiam/opentts:en

http://localhost:8888/ にアクセスすれば使えるようになります。
なお、httpで起動しているのでローカルで使用する必要があります。

操作は次の通りです。
image

構成

前回のブログでご紹介したタイムキーパーの構成とほぼ同じです。タイムキーパーの時は音声が、終了時間通知の音声で固定されていました。今回は、ユーザが入力するテキストを音声データに変換してストリームに流します。テキストから音声データへの変換は、日本語はVoiceVoxを使用させていただいています。これだけの品質で無料というは驚異的ですね。その他の言語はOpenTTSを使用させていただいています。

image

デモ

記事の冒頭で示した通りです。

リポジトリ

ここで紹介したデモは次のリポジトリで公開しています。
https://github.com/w-okada/zoom-meeting-plus

どんどんアップデートしていくので最新版は安定しない可能性があります。
次のタグでcloneして使ってください。

$ git clone https://github.com/w-okada/zoom-meeting-plus -b v02

宣伝

弊社 FLECT は、Salesforce を中心に AWS, GCP, Azure を用いたマルチクラウドシステムの提案、開発を行っております。 また、ビデオ会議システムについては、Zoom SDK, Amazon Chime SDK, Twillio など各種ビデオ会議用 SDK を用いたシステムの開発しており、サービス化の実績も多数あります。 ご興味をお持ちいただけたら是非ご相談ください。

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
0