この記事はagora.io Video(Voice)SDK 3.3.0以降を対象とした高音質オーディオ体験の紹介になります。
CONTENTS
1.高音質なオーディオ体験
2.リアルタイム美声化技術と音響効果
3.超低遅延による In-ear モニタリング
4.高音質デモンストレーション
高音質なオーディオ体験
フルバンドサンプリング
人の声は0〜20kHzの周波数をもっています。Agora(*)はサンプリングレート48kHzまでサポート。
(電話の場合は4kHzの為、高周波の部分がロストする場合も)
*コーデックはOPUS
HQ Audio
Agoraの高音質オーディオは MOS(*)値4.7。
従来の電話による通話音質はおよそ 3.5 から 4.2 とされています。
- MOS(Mean Opinion Score):主観的な意見の平均点。国際的な基準では、MOSスコアは5段階評価で1が最低、5が最良としています。
劣悪なネットワーク環境下でも安定したパフォーマンス
競合他社と比べ、劣悪なネットワーク環境下でも安定したパフォーマンスが得られます。
安定したユーザー体験の実現
卓越したVoice/Music分析能力
ユーザーシナリオを判断し、VoiceとMusicが交互に流れるようなシナリオにおいてもユーザ体験の品質を向上可能です。シナリオ指定も可能です。
ダブルトーク検出(DTD)
ダブルトークシーンの中断を減らし、聴取者の聞き心地を向上させます。
エコーパス推定アルゴリズム
遅延推定値を1秒以下にすることで、エコー経路が変化しても間に合うように対応。エコー収束までの時間を大幅に短縮し、又、様々なエコー効果を吸収し。ユーザー体験を向上させることができます。
独自開発したAIによるハウリング防止メソッド
近接音響エコーパスとゲインによるハウリングを解決します。
様々なデバイスへの対応
全てのiOSデバイスおよび、6000種類以上のAndroidデバイスをカバーします。MacOSやWindowsもカバーしています。
AIによるノイズ除去
SDK3.3.0からAIによるノイズ除去が追加されました。
既存の仕組みでは除去できなかった音(キーボード音や環境音)もAIでは除去可能です。
録音側のデバイスで処理を実施します。
音声の美化とエフェクト
Agoraは、高額なハードウェア(サウンドカードなど)とプロのチューナーによって実現されている伝統的なオフライン音声美化と同等の機能を、オンラインユーザーに提供します。
これにより、ハードウェアの制限を取り払い、使用の敷居を下げ、ユーザー体験を向上させ、オンラインでのユースケースをより楽しませてくれます。
音声美化技術
人間の声の音色、音色、ダイナミクス、リズム、空間効果を協調的に調整することで人間の声の美化を実現し、同時に1つ以上の周波数帯のゲインまたは減衰をサポートすることで、人間の声の音色を調整する目的を達成します。
Chat beautifier
ビデオ通話に最適です。高品質のオーディオ体験を損なうことなく、また、元の音声を認識以上に変更することなく、音声美化を実現します。
Singing beautifier
歌唱のユースケースに最適です。高品質のオーディオ体験を損なうことなく、歌声を強化するために多次元の調整が行われています。
Ultra-high quality
よりクリアで豊かな高音質効果、より汎用性が高く様々なシーンに対応し、音の時間周波数分布を調整して体験価値を高めます。
Timbre transformation
ビデオ通話と歌唱の両方のユースケースで、声の音色をユーザーの好みに応じて特定の方法で変更することができます。ユーザーは自分の声に最も適した効果を選択することができます。
豊富なエフェクト
Agora のリアルタイム音色変換は、人間の声の音色を変化させたり、強化したりすることができます。
適用シナリオ:オーディオストリーミング、共同ホストオーディオストリーミング、音声のみのPKホスティング、ボイスチャットルーム、ボイスデート、ゲームチャットルーム、オンラインKTV、FMラジオなど、すべての歌と音声をベースにしたオーディオとビデオのシナリオ。
超低遅延のイヤホンモニタリング機能
Agora SDKは、超低遅延のイヤホンモニタリング機能のAPIを提供します。
オンラインKTVやライブストリーミングアプリのためのイイヤホンモニタリング機能は、
様々なスマフォデバイスに適応することができます。
Unified adaptation
多数のスマホ機種に超低遅延でインイヤーモニタリングの適応を最適化。オンラインKTVやライブストリーミングアプリは、機種ごとに適応させる必要はありません。
Ultra-low latency
主流の携帯電話メーカーと技術的に協力し、カラオケ時のインイヤーモニターのレイテンシを50ms以内に抑えることに成功しました。
Ultra-low noise
業界をリードするAIオーディオノイズリダクション技術を提供し、バックグラウンドノイズを自動的に除去し、ユーザーがバックグラウンドミュージックをより明確に聞き取れるようにします。
extreme sound effects
耳内モニタリングでは、Voice Beautifier、Voice Effects、Voice Changer Effects をサポートしています。
インイヤーモニターを使用して、ユーザーは優れたオンライン歌唱体験を持つことができます。
HQ Audio Demo
Webページでデモを体験できます。
https://www.agora.io/en/audio-demo/