More than 5 years have passed since last update.

高音質のCloud Text-To-Speechを使ってnode-red + Google Homeで読み上げる

Last updated at 2020-02-17Posted at 2018-07-24

はじめに

定番の、google-home-notifierを使ったGoogle Homeでのテキスト読み上げですが、話す速度が妙に遅いのが難点です。
Google Cloud Text-To-Speechを使えば解決できますが、無料を保証できないのと管理UIの敷居が高いのとで二の足を踏んでました。しかし、日本語でも最新のWaveNet音声が使える(女声、男声それぞれ二種類)というのを知り、モチベーションがあがったので Raspberry Pi + node-red を使って対応してみました。

今回は、インストールや設定方法をなるべく詳しく書くようにしています。

特徴

node-redのフローで読み上げ機能を提供
- 汎用的に使える
- 設定が比較的簡単
google-home-notifier自体を改良
- 指定した音量で読み上げが可能
- 読み上げリクエストが連続しても、取りこぼさずに読み上げ
Google Cloud Text-To-Speechで読み上げ (オプション)
- WaveNet音声を使って、より自然な読上げ
- 男声女声それぞれ二種類の指定が可能
- 読み上げ速度やピッチの指定が可能
- 認証エラーなどで Google Cloud Text-To-Speechのリクエストに失敗したら、従来の読み上げを行う。

まずはnode-redをインストール

本家に詳しく書いてあります。 Node-RED日本ユーザ会 : Running on Raspberry Pi

と思ったけど、自分はこちらを参考にしたかもしれません: Raspverry Pi にNode-RED をインストールする

google-home-notifierフロー

フローの内容

以前作ったフローベースで拡張しています。Google Cloud Text-To-Speechを使う設定になっている場合、パラメータをflow変数に保存してから http://<node-redのアドレス>/googlecloudtts のURLの音声ファイルを再生するように、Google Homeにリクエストします。

なお、もしGoogle Cloud Text-To-speechでの読み上げに失敗した場合、本来の読み上げ機能を使うリカバリー対応を入れておきました。

Google Cloud Text-To-Speechへのリクエスト代行

Google Homeが、http://<node-redのアドレス>/googlecloudtts に音声ファイルを取りに来るのでnode-redでCloud Text-To-Speechへのリクエストを代行します。各種パラメータは、flow変数経由で受け渡しています。JSONパラメータは、GoogleのデモサイトでShow JSON押すと出てくるのをみれば大体わかります。

まいったのが、JSONパラメータでCloud Text-To-Speechにリクエストした場合、MP3音声レスポンスをbase64エンコードしたJSON文字列で返すことです (意味あるんでしょうか？)。node-red-nodes-base64 を使ってデコードしています。JSONではなく、gRPCでのリクエストだとバイナリを返すようですが、残念ながらnode-redのgRPCプラグインはまだないようです。

フローのinstall方法

以下、node-redのインストールディレクトリが、/home/pi/.node-red であること前提です。

必要なnode-red plug-inをインストール

以下は、npmでインストールしていますが、node-redの設定 - パレットの管理 - ノードを追加で行う方法もありです。

cd /home/pi/.node-red
npm i node-red-contrib-hostip node-red-contrib-credentials node-red-node-base64
npm i node-red-contrib-semaphore

Raspberry Piの場合は、google-home-notifierのREADME.mdの"Raspberry Pi"にしたがって、以下の事前準備

sudo apt-get install git-core libnss-mdns libavahi-compat-libdnssd-dev

google-home-notifier改良版のインストール

cd /home/pi/.node-red
npm i https://github.com/tinoue/google-home-notifier.git

なお、この改良版はhorihiroさんのパッチ(PR#41)も含んでいて、オリジナルで必要だったbrowser.jsの編集が不要となってます。

改良版でなくてもたぶん動作すると思いますが、音量の設定と連続するリクエストの逐次読み上げが出来なくなります。

.node-red/setting.jsにgoogle-home-notifierの読み込みを追加


   functionGlobalContext: {
        googlehomenotifier:require('google-home-notifier') // 実際に追加するのはここの1行
        :
   },

ここまでの設定を反映させるために、node-redを再起動

node-red-stop && node-red-start

ブラウザのnode-red画面も、再読み込みしてください。

今回作成した以下のgoogle-home-notiferフローを「新規のタブ」としてnode-redにインポート

フローの設定

Javascriptコードを編集せずに設定出来るようにしてみました。

共通の設定
- "Set hostname/address of Google Home (optional)"
  - 通常は設定不要ですが、mDNSによるGoogle Homeデバイスの自動検出がうまくいかない場合は、ここでIPアドレスを設定。
- "Set params for google-home-notifier"
  - language: 日本語ならja
  - volume_default: 0から1の値。音量を変えないなら0を設定。
  - use_cloud_tts: Google Cloud Text-To-Speechを使用するならtrueにして、以下の設定も行う
Google Cloud Text-To-Speechを使う場合の設定
- Google Cloud Platformの利用登録。
  - 参考: Google Cloud Text-to-Speech の使い方日本語テキストを読み上げさせてみよう
  - 「APIとサービス」-「認証情報」からAPIキーを取得。Cloud Text-To-Speechしか使えないように制限しておく。
- "Set apikey of Cloud Text-To-Speech"
  - Goole Cloud Text-To-Speechのapikeyを設定
- "Set params for Google Cloud Text-To-Speech"
  - デモページで"Show JSON"を押せば、以下のパラメータの確認が出来ます。
  - languageCode: 日本語ならja-JP
  - voiceName: 日本語ならja-JP-Wavenet-A (B,C,Dもあります。A, Bが女声、C, Dは男声)
  - speakingRate: 0.25から4.0まで設定可能(1.0が標準)
  - pitch: -20から20まで設定可能(0が標準)

読み上げのテスト

「読み上げのテスト」と書いてあるinjectionノードの左ボタンをクリックすると、読み上げのテストが出来ます。

使い方

他のフローから、link出力ノードでメッセージを渡すことで読み上げを行います。読み上げだけでなく、MP3の再生も可能。

msg.payload: 読み上げテキスト
msg.audio: trueの場合はmsg.payloadはMP3データのURLを表す。
msg.volume (optional): 0-1の範囲で設定。設定しない場合はデフォルトの音量で再生。

Google Cloud Text-To-Speechの課金について

高音質のWaveNet音声でも、100万文字/月までは無料とのことなので、個人使用で課金が発生することは原則無いと思います。ただ、Google Cloud Platformでは課金上限を保証しての利用が出来ないため、APIキーを盗まれて青天井に課金される可能性が0ではありません。
Google Cloud Consoleの「お支払い」-「予算とアラート」を設定するとともに、APIキーの秘匿に注意してください。node-redを動かすマシンを、インターネットからはアクセスできないように運用するのが無難です。

ちなみに、IBMのtext to speechは、ライトアカウントで課金上限(無料ですが)が保障されるので安心です。ただし、デモで聞き比べる限りではGoogleのほうが自然な感じでした。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up