Myuon Corp. Advent Calendar 2016 16日目です。
2016年の一番の驚きは SMAP の解散だよね。悲しいねー。 それはさておき本題。
Amazon Polly は、AWS re:Invent 2016 で発表された新サービスで、24言語47音声に対応した テキストを自然な音声で読み上げる ことができます。
また、生成された音声はコンソールからダウンロードしたり、APIを使用してストリーミング配信することができます。
今回は、その Amazon Polly を実際に使用してテキストの読み上げてみたいと思います。
僕の今年の心情 「2016年の一番の驚きは SMAP の解散だよね。悲しいねー」を喋らせてみた
[その1] まずはコンソールで喋らせてみた
1. Amazon Polly の [今すぐ始める] をクリック
2. 再生したい文字を入力して [▶︎音声を聞く] をクリック
おお、再生された!
[その2] SSML を使って喋らせてみた
Amazon Polly では、W3C 勧告で定義された SSML 1.1 がサポートされています。
(一部サポートされていない要素があります。 「voice」 要素 使ってみたかった。残念)
読み上げ速度上げて 喋らせてみる
prosody 要素を使うことで喋るスピードを変更できます。
<speak>
<prosody rate="x-fast">2016年の一番の驚きは SMAP の解散だよね。悲しいねー</prosody>
</speak>
「SMAPの解散」を強調させて喋らせてみる
emphasis 要素を使用する。
<speak>
2016年の一番の驚きは<emphasis level="strong">SMAP の解散</emphasis>だよね。悲しいねー
</speak>
[その3] CLI から喋らせてみた
$ aws --version
aws-cli/1.11.30 Python/2.7.10 Darwin/16.1.0 botocore/1.4.87
$ aws polly synthesize-speech --text "2016年の一番の驚きは SMAP の解散だよね。悲しいねー。from command line" --voice-id Mizuki --output-format mp3 speech.mp3
まとめ
これを使えば、
- RSS で新しい記事が配信される
- Lambda でイベントをキャッチ
- Polly にテキストを投げる
- mp3 で iPhone にダウンロード
- 通勤中に iPhone で聴く
みたいなことができそうですね。
喋りとしては、かなり滑らかだなという印象。Siriとどっこいか、それ以上か。昔の「ワレワレ ハ ウチュウジン ダ」みたいな感じは全くないw
いろんな分野で活用できそうですね。今後の進化に期待。