※この記事は AltPlus Advent Calendar 2016 の3日目の記事です。
みなさんこんにちは。
AWS re:Invent 2016 では新しいサービスがたくさん発表されましたね!
この記事では「Amazon Polly で変換した音声で Siri に Get Wild をかけてもらう」をやってみたので書いていきます。
Amazon Polly で変換した音声で Siri に Get Wild をかけてもらう - Youtube
- デモ用のため、音楽が流れはじめてからの音声は消しています
- でかいボタンの箱の中にはラズパイが入っています
- iPhone 左にある猫の顔をしているのはスピーカーです
- 無事、"OK, playing 'Get Wild' by TM NETWORK..." と表示され、再生されました!
Amazon Polly
Amazon Polly はテキストを音声で読み上げるサービスで、47の男性・女性の声、日本語を含む24の言語をサポートしています。
今後追加予定の言語や声がロードマップにあります。
やったこと
- Siri に持ち主の声として、Polly で変換した次の声を用意、iPhone に設定
- Hey Siri.
- Hey Siri, How's the weather today?
- Hey Siri, it's me.
- ボタンが押されたらイベントを検知
- AWS CLI で Polly の SynthesizeSpeech API を呼び出し、Siri に伝えたいメッセージを mp3 ファイルに変換
- 作成された mp3 ファイルをスピーカーから再生
- Siri がメッセージを受けて、「Get Wild」を再生
API 呼び出しで実行しているコマンド
$ aws polly synthesize-speech \
--output-format mp3 --voice-id Joey \
--text "Hey Siri, play, Get Wild." \
getwild.mp3
注意点
- 単語の間にちょうどいい間ができるように "play" の後ろにカンマを入れた
- ラズパイのアナログ音声出力端子に接続したスピーカーからノイズ音が出ていたためか、Siri がうまく聞き取れない時があった
- PC にスピーカーを接続した時は音声がクリアでスムーズに反応した
おわりに
- 他にもいろんな文章からの音声変換を試してみましたが、本物そっくりの音声・表現に変換されていました
- 発音について情報を追加していくこともできるようなので、試してみたいと思います