こちらは「青空文庫 Advent Calendar 2017」の6日目の記事です。5日目は @myokoym さんの「青空文庫をNDC等で絞り込みつつ全文検索できるWebサイト『Aozorasearch』の紹介」でした。
RubyGems.org に hogelog さんが作った「aozora-polly」というものがあるので、今回はその紹介をします。
AozoraPolly とは
Amazon Polly を利用して、青空文庫のXHTMLをMP3に変換するRubyのライブラリです。
Amazon Polly とは
Amazon Polly のトップページから引用すると以下の通りです。
Amazon Polly は、文章をリアルな音声に変換するサービスで、話すことができるアプリケーションを作成でき、まったく新しいカテゴリの音声対応製品を構築できます。Amazon Polly は、高度なディープラーニング技術を使用したテキスト読み上げサービスで、人間の声のような音声を合成します。
AozoraPolly で音読MP3を生成する
$ gem install aozora-polly
$ aozora2mp3 http://www.aozora.gr.jp/cards/000035/files/1567_14913.html merosu.mp3
でいけるかと思いきやエラー。
E, [2017-12-07T01:27:19.793349 #37259] ERROR -- : unable to sign request without credentials set
このエラーを発生させているコードを辿るとAWS(アマゾンウェブサービス)のアカウントの設定が必要なのが分かりました。以下のコマンドでアカウントの設定をしてやるとうまくいきました。
$ pip install awscli
$ aws configure
# ここでAWSのアカウントの情報を入力
AWSのアカウント自体は持っていたので、セットアップと aws configure を以下を読んでやりました。
AozoraPolly(Amazon Polly)による音読
Aozora Polly(Amazon Polly)に音読させてみる(太宰治『女生徒』の冒頭) https://t.co/hFAC4b09bk @YouTubeさんから
— pawa@朗読部 (@_pawa_) 2017年12月6日
音読であって朗読にはならないのだと痛感させられました。
朗読例:萌えで読む!「女生徒」
まだまだ Advent Calendar への参加者を大募集中です!