More than 5 years have passed since last update.

Myuon Corp.Advent Calendar 2016

@RyoAbe(Ryo Abe)in

freee

新サービス「Amazon Polly」を使って、僕の今年の心情を読み上げてみた

Last updated at 2017-09-07Posted at 2016-12-17

Myuon Corp. Advent Calendar 2016 16日目です。

2016年の一番の驚きは SMAP の解散だよね。悲しいねー。 それはさておき本題。

Amazon Polly

Amazon Polly は、AWS re:Invent 2016 で発表された新サービスで、24言語47音声に対応した テキストを自然な音声で読み上げる ことができます。
また、生成された音声はコンソールからダウンロードしたり、APIを使用してストリーミング配信することができます。
今回は、その Amazon Polly を実際に使用してテキストの読み上げてみたいと思います。

僕の今年の心情「2016年の一番の驚きは SMAP の解散だよね。悲しいねー」を喋らせてみた

[その1] まずはコンソールで喋らせてみた

1. Amazon Polly の [今すぐ始める] をクリック

2. 再生したい文字を入力して [▶︎音声を聞く] をクリック

おお、再生された！

▶︎1. 再生してみる

[その2] SSML を使って喋らせてみた

音声合成マークアップ言語（SSML）バージョン1.1

Amazon Polly では、W3C 勧告で定義された SSML 1.1 がサポートされています。
（一部サポートされていない要素があります。 「voice」 要素使ってみたかった。残念）

読み上げ速度上げて喋らせてみる

prosody 要素を使うことで喋るスピードを変更できます。

SSML

<speak>
<prosody rate="x-fast">2016年の一番の驚きは SMAP の解散だよね。悲しいねー</prosody>
</speak>

▶︎2. 再生してみる

「SMAPの解散」を強調させて喋らせてみる

emphasis 要素を使用する。

SSML

<speak>
2016年の一番の驚きは<emphasis level="strong">SMAP の解散</emphasis>だよね。悲しいねー
</speak>

▶︎3. 再生してみる

[その3] CLI から喋らせてみた

$ aws --version
aws-cli/1.11.30 Python/2.7.10 Darwin/16.1.0 botocore/1.4.87

$ aws polly synthesize-speech --text "2016年の一番の驚きは SMAP の解散だよね。悲しいねー。from command line" --voice-id Mizuki --output-format mp3 speech.mp3

▶︎4. 再生してみる

まとめ

これを使えば、

RSS で新しい記事が配信される
Lambda でイベントをキャッチ
Polly にテキストを投げる
mp3 で iPhone にダウンロード
通勤中に iPhone で聴く

みたいなことができそうですね。

喋りとしては、かなり滑らかだなという印象。Siriとどっこいか、それ以上か。昔の「ワレワレハウチュウジンダ」みたいな感じは全くないw
いろんな分野で活用できそうですね。今後の進化に期待。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up