Edited at
AltPlusDay 3

Amazon Polly で変換した音声で Siri に Get Wild をかけてもらう

More than 1 year has passed since last update.

※この記事は AltPlus Advent Calendar 2016 の3日目の記事です。

みなさんこんにちは。

AWS re:Invent 2016 では新しいサービスがたくさん発表されましたね!

この記事では「Amazon Polly で変換した音声で Siri に Get Wild をかけてもらう」をやってみたので書いていきます。



Amazon Polly で変換した音声で Siri に Get Wild をかけてもらう - Youtube


  • デモ用のため、音楽が流れはじめてからの音声は消しています

  • でかいボタンの箱の中にはラズパイが入っています

  • iPhone 左にある猫の顔をしているのはスピーカーです

  • 無事、"OK, playing 'Get Wild' by TM NETWORK..." と表示され、再生されました!


Amazon Polly

Amazon Polly はテキストを音声で読み上げるサービスで、47の男性・女性の声、日本語を含む24の言語をサポートしています。

今後追加予定の言語や声がロードマップにあります。


やったこと


  1. Siri に持ち主の声として、Polly で変換した次の声を用意、iPhone に設定


    • Hey Siri.

    • Hey Siri, How's the weather today?

    • Hey Siri, it's me.



  2. ボタンが押されたらイベントを検知

  3. AWS CLI で Polly の SynthesizeSpeech API を呼び出し、Siri に伝えたいメッセージを mp3 ファイルに変換

  4. 作成された mp3 ファイルをスピーカーから再生

  5. Siri がメッセージを受けて、「Get Wild」を再生


API 呼び出しで実行しているコマンド

$ aws polly synthesize-speech \

--output-format mp3 --voice-id Joey \
--text "Hey Siri, play, Get Wild." \
getwild.mp3


注意点


  • 単語の間にちょうどいい間ができるように "play" の後ろにカンマを入れた

  • ラズパイのアナログ音声出力端子に接続したスピーカーからノイズ音が出ていたためか、Siri がうまく聞き取れない時があった

  • PC にスピーカーを接続した時は音声がクリアでスムーズに反応した


おわりに


  • 他にもいろんな文章からの音声変換を試してみましたが、本物そっくりの音声・表現に変換されていました

  • 発音について情報を追加していくこともできるようなので、試してみたいと思います


参考