LoginSignup
6

More than 5 years have passed since last update.

posted at

updated at

Organization

新サービス「Amazon Polly」を使って、僕の今年の心情を読み上げてみた

Myuon Corp. Advent Calendar 2016 16日目です。


2016年の一番の驚きは SMAP の解散だよね。悲しいねー。 それはさておき本題。

Amazon Polly
amazon_polly_top-shadow.png

Amazon Polly は、AWS re:Invent 2016 で発表された新サービスで、24言語47音声に対応した テキストを自然な音声で読み上げる ことができます。
また、生成された音声はコンソールからダウンロードしたり、APIを使用してストリーミング配信することができます。
今回は、その Amazon Polly を実際に使用してテキストの読み上げてみたいと思います。

僕の今年の心情 「2016年の一番の驚きは SMAP の解散だよね。悲しいねー」を喋らせてみた

[その1] まずはコンソールで喋らせてみた

1. Amazon Polly の [今すぐ始める] をクリック

amazon_polly_console-shadow.png

2. 再生したい文字を入力して [▶︎音声を聞く] をクリック

amazon_polly_say1-shadow.png

おお、再生された!

▶︎1. 再生してみる

[その2] SSML を使って喋らせてみた

音声合成マークアップ言語(SSML)バージョン1.1
SSML-shadow.png

Amazon Polly では、W3C 勧告で定義された SSML 1.1 がサポートされています。
一部サポートされていない要素があります。 「voice」 要素 使ってみたかった。残念)

読み上げ速度上げて 喋らせてみる

prosody 要素を使うことで喋るスピードを変更できます。

SSML
<speak>
<prosody rate="x-fast">2016年の一番の驚きは SMAP の解散だよね。悲しいねー</prosody>
</speak>

▶︎2. 再生してみる

「SMAPの解散」を強調させて喋らせてみる

emphasis 要素を使用する。

SSML
<speak>
2016年の一番の驚きは<emphasis level="strong">SMAP の解散</emphasis>だよね。悲しいねー
</speak>

▶︎3. 再生してみる

[その3] CLI から喋らせてみた

$ aws --version
aws-cli/1.11.30 Python/2.7.10 Darwin/16.1.0 botocore/1.4.87

$ aws polly synthesize-speech --text "2016年の一番の驚きは SMAP の解散だよね。悲しいねー。from command line" --voice-id Mizuki --output-format mp3 speech.mp3

▶︎4. 再生してみる

まとめ

これを使えば、

  1. RSS で新しい記事が配信される
  2. Lambda でイベントをキャッチ
  3. Polly にテキストを投げる
  4. mp3 で iPhone にダウンロード
  5. 通勤中に iPhone で聴く

みたいなことができそうですね。

喋りとしては、かなり滑らかだなという印象。Siriとどっこいか、それ以上か。昔の「ワレワレ ハ ウチュウジン ダ」みたいな感じは全くないw
いろんな分野で活用できそうですね。今後の進化に期待。

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
6