こんにちは、AWAでAndroidアプリ開発をしている佐藤です!
このたび、AWAで音声配信機能がリリースされました
AWAの音声配信は自前で全て実装しているわけではなく、 Agora.io を使って実現しています。
そこで、Agora.ioを使って音声配信機能を実現する上での簡単なサンプルと、いくつかのハマりどころについて記載しようと思います。
前置き
- 使用するバージョンは
io.agora.rtc:voice-sdk:3.5.0
です - 音声配信のみです。動画配信はしていません
- Agora.ioへのユーザ登録は既に済ませているものとします
実装する上で
Agoraはとてもサンプルが充実しており、日々アップデートされています。そのため、まずはサンプルを使って出来ることを把握しつつ、アプリに取り込む作業を行っていくと良いと思います。Androidのサンプルは以下にまとまっているので確認してみてください。
サンプルアプリはUseCaseごとに画面を分けている作りになっていて、とりあえず音声配信を試したいのであれば Audio live streaming を参考にすると良いです。
簡単なサンプル
RtcEngineを作成して、joinChannelすることで音声配信が始まります。簡単ですね。
音声配信時になにか起きると作成時のパラメータである IRtcEngineEventHandler
にイベントが飛んでくるので、適宜処理を行いましょう。
val engine = RtcEngine.create(context, applicationId, iRtcEngineEventHandler).apply {
// 音声配信を聞くだけなら CLIENT_ROLE_AUDIENCE でもよい
setClientRole(IRtcEngineEventHandler.ClientRole.CLIENT_ROLE_BROADCASTER)
}
val option = ChannelMediaOptions().apply {
autoSubscribeAudio = true
autoSubscribeVideo = false
}
engine.joinChannel(
token,
channelName,
"Extra Optional Data",
userId,
option
)
Agoraに接続するためのTokenについて
AgoraのTokenはクライアントではなくサーバで発行しなければなりません。Tokenの発行方法については以下のリンクが参考になります。
func generateRtcToken(int_uid uint32, channelName string, role rtctokenbuilder.Role){
...
}
AccessTokenは発行時に指定されたUserId、ChannelName、roleでしか使用することができません。注意しましょう。
音声配信をとりあえず試したいと言うのであれば、TemporaryTokenを発行することもできます。ここにTokenの発行方法が記載されていますが、Channel名さえ決めてしまえば簡単に発行することができます。ただし、注意書きにもある通り本番環境で使うことはできませんので、本番環境で使う場合はちゃんとToken発行用のサーバを作りましょう。
ハマりどころをいくつか
上記のサンプルでも分かる通り、Agora.ioで音声配信を行うのは非常に簡単です。しかし、簡単と言いつつもいくつかハマってしまったポイントがあったため、備忘録の意味を込めて記載しておきます。
UserIdが負の値になる
Agora.io上で管理されているUserIdは uint32
ですが、Javaには unsigned
という概念が存在しません。なので、AndroidのAgoraSDKで使用されるUserIdは Int
に変換された値が使われます。正の値の場合は問題ありませんが、負の値の場合はどこかで変換して上げる必要があるので注意しましょう。私はまんまとハマりました。
ちなみに、以下のリンクに書かれている通り、まだβ版ではありますがUserIdに文字列を使うこともできます。β版を本番環境で使うのはちょっと怖いですし、正式対応が早くされないかなと心待ちにしています。
音声配信者の音量の取得方法
音声配信者の誰が喋っているのかがわかるようなUIを作ろうとすると誰が喋っているかをリアルタイムに知る必要があります。Agoraにはリアルタイムで音量を通知してくれるイベントが存在するので、簡単に実装することができます。詳しくは ここ に記載されています。
private val iRtcHandler = object : IRtcEngineEventHandler() {
override fun onAudioVolumeIndication(
speakers: Array<out AudioVolumeInfo>?,
totalVolume: Int
) {
Timber.v("volumes: $volumes")
}
}
val engine = RtcEngine.create(context, applicationId, iRtcEngineEventHandler).apply {
enableAudioVolumeIndication(interval, smooth, isReportVad)
}
前述している通りAgora.ioで管理されているUserIdは uint32
ですが、通知されるUserIdは uint32
を Int
に変換した値となります。サービス上のUserIdとAgora.io上のUserIdの紐付けには注意しましょう。
音声配信を行っている自分のボリュームを取得したい場合は isReportVad
を true にします。自分の音量通知はAgora.io上のUserIdではなく、0
で通知されます。詳しくは ここ に記載されています。
音声配信のボリューム
音声配信で使用される端末のvolumeは、メディアvolumeと通話volumeの2種類を選ぶことができ、ProfileのScenarioによって決まります。詳しくは ここ に記載されています。
val engine = RtcEngine.create(context, applicationId, iRtcEngineEventHandler).apply {
setAudioProfile(
Constants.AUDIO_PROFILE_MUSIC_HIGH_QUALITY,
Constants.AUDIO_SCENARIO_GAME_STREAMING
)
}
シナリオによってはBroadcasterとAudienceで使用されるVolume設定が違うことがあります。そのため、つなぐチャンネルでRoleが変わると使用されるVolume設定が変わってしまうことがあり、いきなり爆音で音声配信が流れたりします。注意しましょう。
音量が小さく感じる
まずやるべきはSpeakerPhoneが使われるように変更することです。
val engine = RtcEngine.create(context, applicationId, iRtcEngineEventHandler).apply {
setDefaultAudioRoutetoSpeakerphone(true)
}
それでもだめな場合はボリューム調整関数によって Input / Output の音量を調整してみましょう。音量を大きくしすぎるとすぐに音割れが起こってしまうため慎重に調整する必要があるようです。
val engine = RtcEngine.create(context, applicationId, iRtcEngineEventHandler).apply {
// Input Volume
adjustRecordingSignalVolume(RECORDING_VOLUME)
// Output Volume
adjustPlaybackSignalVolume(PLAYBACK_VOLUME)
}
QAにも記載されている一般的な問題なようですが様々な原因が考えられるので一言で答えるのは難しいようです。音声配信に使用している端末にもよるようなので、サポートデスクに対して直接問い合わせてみるほうが良いかもしれません。
まとめ
何点かハマりどころ(僕が勝手にハマっただけかもしれません)はありましたが、Agora.ioを使ったことでとても少ない工数でAWAに音声配信を組み込むことができました。また、困ったときに日本語で問い合わせることが出来るサポートがあるところも非常に助かりました。
簡単な音声配信機能を既存アプリへ組み込むだけであれば数日で実装することができましたし、アプリに音声配信機能をお試しで組み込みたい場合にはおすすめできると思います。