はじめに
以前、Amazon Kinesis Video Streams WebRTC(以後 KVS WebRTC)を調べてみましたが、1対1か、1対nを前提にしていて、複数人の双方向ビデオチャットのような仕組みは対象にしていないことが分かりました。
できないと言われるとやりたくなるのが人のサガなので、あえて多人数のビデオチャットを作ってみました。
KVS WebRTCの通信形態
以前の記事でも書いたように、KVS WebRTCではマスター(Master)1つと、複数のビューワー(Viewer)が通信することができます。図にすると次のような形です。
このままではViewer同士は通信できません。そこでMasterが仲立ちをして、すべてのViewerの映像を合成して返す形にすれば、Viewer同士で全員の映像を見ることができます。
MCUをブラウザで
先ほどの合成する形態はMCU(Multi-point Control Unit)と呼ばれる方式で、ビデオ会議システムでは以前から利用されてきた仕組みです。サーバーとしてMCUを用意するのが一般的ですが、CPU負荷が重くサーバー費用が高くつくことが難点です。
このMCUをWebブラウザで手軽に作れるライブラリを作ったことを思い出して、今回KVS WebRTCと組み合わせてみました。
- Browser MCU Core ... GitHub
- ブラウザの映像/音声処理を活用した、MCUライブラリです
- WebRTC でやり取りする MediaStream を扱うために作成されています
- シグナリングや PeerConnection の処理は、Browser MCU Core には含まれていません
- Browser MCU with KVS WebRTC example ... GitHub
- Browser MCU Coreを使ったサンプル
- シグナリング処理はKVS WebRTCのWeb用 SDKを利用
- RTCPeerConnectionはSDKのサンプルを参考に自分で実装
サンプルを動かす
GitHub Pagesで公開しているので、すぐに試すことができます。サンプルはChrome 80で動作確認しています。
事前準備として、KVS WebRTCのシグナリングチャネルを作成しておく必要があります。
- ブラウザでラウンチャーページ を開く
- パラメータを指定する
- Region ... シグナリングチャネルを作成したリージョン
- ARN ... 作成したシグナリングチャネルのARN
- AccessKeyId ... 割り当てたIAMのアクセスキーID
- AccessSecretKey ... 割り当てたIAMのシークレットアクセスキー
- Masterを起動
- [open MCU master]ボタンをクリック
- 開いたウィンドウ/タブが開き、ボタンの横に" setup KVS done."と表示されれば初期化完了
- 開いたウィンドウ/タブで、[Connect]ボタンをクリック
- "-- signaling client open --" と表示されれば、KVS シグナリングチャネルに接続成功
- ※Masterのウィンドウ/タブは、完全に隠れてしまわないよう、別ウィンドウにしてどこかに表示しておく必要あり
- 完全に隠れてしまうと、画面更新(動画の描画)がポーズしてしまうため
- 最初のViewerを起動
- [open MCU member(viewer)]ボタンをクリック
- ※その時のURLを別マシンで開いてもOK
- 開いたウィンドウ/タブで、[start MCU member(offer)]ボタンをクリック
- カメラ/マイクへのアクセス許可を求められたら、許可
- 自分の映像と、MCU masterが合成した映像(最初は1人)が映ったら接続成功
- [open MCU member(viewer)]ボタンをクリック
- 2つ目以降のViewerを起動
- 1つ目と同様、合成した映像の人数が増えていく
- Viewerの切断
- [stop MCU member]ボタンをクリック
- Masterの切断
- [Disconnet]ボタンをクリック
サンプルを編集する
サンプルをクローンして編集すれば、ARNやシークレットキーを利用者が入力しないで使えるようになります。
- レポジトリをクローン
- git clone --recursive https://github.com/mganeko/kvs_webrtc_example.git
- kvs_keys.js を編集
- AWS_CHANNEL_ARN ... シグナリングチャネルのARNを指定
- AWS_ACCESS_KEY_ID ... ユーザーのアクセスキーIDを指定
- AWS_SECRET_ACCESS_KEY ... シークレットアクセスキーを指定
- Webサーバーにhtml, jsファイルを配置
- ※ローカルホストでない場合は、https通信が必要です
内部の仕組み
Master(MCU)での映像合成
こちらのスライド(WebRTC Build MCU on browserにあるように、Canvasを使って映像を合成しています。
- Videoタグから、Canvasタグに描画
- これをrequestAnimationFrame()を使って連続的に実行
- Canvasタグでは、captureStream()を使ってMediaStream(映像)を取得
Master(MCU)での音声合成
先ほどのスライド(WebRTC Build MCU on browserにあるように、WebAudioを使って映像を合成しています。
実は映像よりも音声のほうが厄介です。音声は自分の声を除外した他の全員の声を合成して返します。したがって3人の参加者がいたら3通り(n人の場合はn通り)の合成を行う必要があります。
- MediaStreamから、MediaStreamAudioSourceNodeに変換
- 複数のAudioSourceNodeをMediaStreamDestinationNodeに接続
- ここで音声合成が行われる
- MediaStreamDestinationNodeから、MediaStreamを取得
ChromeではWebAudioの処理の前にユーザージェスチャーが必要になったので、過去のMCU Browserのサンプルとは初期化のタイミングを変えて、ユーザーがボタンをクリックしてから音声合成のための処理を行っています。
Masterでの複数PeerConnection管理
RTCPeerConnectionを、ViewerのClinetIDをキーにしたハッシュ(連想配列)に格納して管理しています。雑なコードですが、こちらのファイルにまとめています。
- [js/mcu_peer.js](https://github.com/mganeko/browser_mcu_kvs/blob/master
/js/mcu_peer.js)
またPeerConnectionで発生したイベントを処理するためのコールバック関数をあらかじめセットしておくことで、KVSのシグナリングチャネル経由でSDPやICE candidateを送信するようにしています。
Viewer側
Viewer側はMasterとだけ双方向通信しているので、1対1の通信の場合と同様です。
- 参考:Viewerの処理(Qiita)
おわりに
一番身近な映像/音声処理装置としてブラウザを利用することで、KVS WebRTCでも多人数でのビデオ会議ができるようになりました。実用性は??ですが、工夫次第で制約は乗り越えらえる、ということですね。
あらためて利用上の注意
映像合成を行っているMasterのウィンドウ/タブが完全に隠れてしまうと、requestAnimationFrame()のイベントが発火せず合成動画が止まってしまいます。絵が出ない/動かない、というケースでは念のためご確認ください。