Alibaba Intelligent Media ServicesのAIエージェントで音声対話できるのが出たらしい ので試してみる〜
まずはIMSにアクセス
シンガポールリージョン固定なんだね〜
アクティベートと権限付与して使う!
Real-time ConversationsのIntelligent Agent Managementでやるらしい
AgentはWorkflowに沿って動くのか〜
デフォルトでVoiceChatSystemWorkflowが用意されてたのでこれを設定する
ちなみにVoiceChatSystemWorkflowの中身をみてみると
基本的な流れのやつだ〜
ARTC Applicationってなんだろ?とおもったけどApsaraVideo Liveというのがあるのね
これもデフォルトのを設定しとく
Greetingをオンにして文言設定しておいてみる
作成!
できた〜
コールバックも設定できるみたい 今回はしない!
一覧に戻って、QR Code for Demoで試してみる
ここに載ってるQRコードからアプリいれて試す〜
日本語で挨拶したら中国語で返ってきたので、workflowを変えてみる〜
新規でworkflowを作って、Speech-to-textとLLMとText-to-speechをそれぞれ日本語にしてみた
Agentのほうで作ったworkflowを参照するようにしてsubmitする
アプリからもっかいつかってみる〜
おお〜できた!
全部日本語でやりとりできる〜!
まとめ
- 音声対話出来るの楽でよい
- Agentつくるのも、workflowつくるのもめっちゃ簡単でよい!
- 音声認識についてはもうちょっと正確だと使いやすいかも
- あとやっぱり日本語のやりとりに途中で中国語入ってきたりもするからモデルのアップデートに期待
おわり