LoginSignup
5
6

More than 5 years have passed since last update.

新サービス「Amazon Polly」を使って、僕の今年の心情を読み上げてみた

Last updated at Posted at 2016-12-17

Myuon Corp. Advent Calendar 2016 16日目です。


2016年の一番の驚きは SMAP の解散だよね。悲しいねー。 それはさておき本題。

Amazon Polly
amazon_polly_top-shadow.png

Amazon Polly は、AWS re:Invent 2016 で発表された新サービスで、24言語47音声に対応した テキストを自然な音声で読み上げる ことができます。
また、生成された音声はコンソールからダウンロードしたり、APIを使用してストリーミング配信することができます。
今回は、その Amazon Polly を実際に使用してテキストの読み上げてみたいと思います。

僕の今年の心情 「2016年の一番の驚きは SMAP の解散だよね。悲しいねー」を喋らせてみた

[その1] まずはコンソールで喋らせてみた

1. Amazon Polly の [今すぐ始める] をクリック

amazon_polly_console-shadow.png

2. 再生したい文字を入力して [▶︎音声を聞く] をクリック

amazon_polly_say1-shadow.png

おお、再生された!

▶︎1. 再生してみる

[その2] SSML を使って喋らせてみた

音声合成マークアップ言語(SSML)バージョン1.1
SSML-shadow.png

Amazon Polly では、W3C 勧告で定義された SSML 1.1 がサポートされています。
一部サポートされていない要素があります。 「voice」 要素 使ってみたかった。残念)

読み上げ速度上げて 喋らせてみる

prosody 要素を使うことで喋るスピードを変更できます。

SSML
<speak>
<prosody rate="x-fast">2016年の一番の驚きは SMAP の解散だよね。悲しいねー</prosody>
</speak>

▶︎2. 再生してみる

「SMAPの解散」を強調させて喋らせてみる

emphasis 要素を使用する。

SSML
<speak>
2016年の一番の驚きは<emphasis level="strong">SMAP の解散</emphasis>だよね。悲しいねー
</speak>

▶︎3. 再生してみる

[その3] CLI から喋らせてみた

$ aws --version
aws-cli/1.11.30 Python/2.7.10 Darwin/16.1.0 botocore/1.4.87

$ aws polly synthesize-speech --text "2016年の一番の驚きは SMAP の解散だよね。悲しいねー。from command line" --voice-id Mizuki --output-format mp3 speech.mp3

▶︎4. 再生してみる

まとめ

これを使えば、

  1. RSS で新しい記事が配信される
  2. Lambda でイベントをキャッチ
  3. Polly にテキストを投げる
  4. mp3 で iPhone にダウンロード
  5. 通勤中に iPhone で聴く

みたいなことができそうですね。

喋りとしては、かなり滑らかだなという印象。Siriとどっこいか、それ以上か。昔の「ワレワレ ハ ウチュウジン ダ」みたいな感じは全くないw
いろんな分野で活用できそうですね。今後の進化に期待。

5
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
6