More than 5 years have passed since last update.

enebular Advent Calendar 2019

@kitazaki(Ayachika Kitazaki)in

IoTLT

Raspberry Pi Desktop へ enebular agent をインストールして sonospollytts ノードを使ってみた。

Last updated at 2019-12-15Posted at 2019-12-02

はじめに

Sonos を enebular (Node-RED) から操作するノードを調べていた時に Amazon Polly を利用する TTS (Text To Speech) ノードを見つけて、それを使用できるようにするメモです。

Sonos とは

米国サンタバーバラ生まれのワイヤレスホームサウンドシステムです。
https://www.sonos.com/ja-jp/home
Sonos を操作するツールを調べたメモ
https://qiita.com/kitazaki/items/ccde18e10f49fcbb9437

Amazon Polly とは

深層学習を使用して文章をリアルな音声に変換するサービスです。日本語は女性 (Mizuki) と男性 (Takumi) の声が用意されています。
https://aws.amazon.com/jp/polly/

環境

Sonos と同じネットワークに Raspberry Pi を接続して enebular agent をインストールすれば、sonospollytts ノードは問題なく使用できます。

動作概要

Amazon Polly サービスに対してテキスト文章を送信します。
テキスト文章から音声変換された mp3 ファイルをダウンロードします。
Raspberry Pi から Sonos へ mp3 ファイルを再生することを指示します。
Sonos から Raspberry Pi へアクセスし、mp3 ファイルを取得して再生します。

Raspberry Pi Desktop

ブラウザでアクセスするクラウド環境の enebular は Heroku へデプロイされるため使用できません。問題になるのは動作概要 2. で、ダウンロードされた mp3 ファイルは一時的にストレージ (デフィルトでは /tmp ディレクトリ) に保存される実装になっているため、エラーとなります。
Raspberry Pi が手元に無い場合、他の選択肢としては仮想環境で動作する Raspberry Pi Desktop へ enebular agent をインストールして使用する方法があります。

enebular editor

enebular editor はポート番号 1888 で起動する (Node-REDは通常、ポート番号 1880 で起動する) ため、sonospollytts ノードのポート設定を変更すれば動作します。(sonospollytts ノード Version 1.0.21 まで)
動作概要 2. で、ダウンロードされた mp3 ファイルは enebular editor を動作させている PC (今回は MacBookPro を使用) のストレージ (デフォルトでは /tmp ディレクトリ) に保存されます。

※2019/11/11 更新
sonospollytts ノードが 1.1.0 にバージョンアップされ、Node-RED の Webserver 機能の利用ではなく、sonospollytts ノード自体の Webserver 機能の利用に変更された (Sonos の HTTPS SSL certificate 問題の対策) ため、ポート番号が 1980 に変更されました。そのため、sonospollytts ノードのポート設定を変更する必要が無くなりました。

準備

MacBookPro (macOS Mojave 10.14.6)
VirtualBox (6.0.14)
https://www.virtualbox.org
Debian Stretch with Raspberry Pi Desktop (2019-04-11-rpd-x86-stretch.iso)
https://www.raspberrypi.org/downloads/raspberry-pi-desktop/

※ Debian Buster with Raspberry Pi Desktop (2019-09-25-rpd-x86-buster.iso) がリリースされていますが、enebular agent のサポート対象外なので、1つ前のリリースの Stretch で動作確認しました。

enebular-agent (2.8.0)
enebular editor (0.12.0)

Raspberry Pi Desktop のインストールと VirtualBox の環境設定

VirtualBox のインストール
VirtualBox をインストールします。合わせて拡張パック (Extension Pack) もインストールします。

Raspberry Pi Desktop のインストール
VirtualBox のメニューから「仮想マシン」→「新規」を選択して、新しい仮想マシンを追加します。
名前「(任意)」
タイプ「Linux」
バージョン「Linux 2.6 / 3.x / 4.x (64-bit)」
メモリーサイズ「2048MB」
仮想ハードディスク「VDI」「可変サイズ」「16.00GB」

VirtualBox のメニューから「仮想マシン」→「設定」を選択して、「ストレージ」の光学ドライブに Debian Stretch with Raspberry Pi Desktop の ISO イメージ (2019-04-11-rpd-x86-stretch.iso) を割り当てます。

Raspberry Pi Desktop の起動
VirtualBox のメニューから「仮想マシン」→「起動」を選択して、Raspberry Pi Desktop を起動します。起動後、Raspberry Pi Desktop のインストールを行います。

VirtualBox の環境設定
VirtualBox のメニューから「仮想マシン」→「設定」を選択して、「ネットワーク」→「アダプター 1」→「高度」で「ポートフォワーディング」の設定を行います。仮想マシンのネットワークアダプターは NAT で割り当てられているため、ホスト OS (今回は macOS) からゲスト OS (Raspberry Pi Desktop) への通信を転送する必要があります。

SSH (ホスト OS ポート番号:10022 → ゲスト OS ポート番号:22) と Node-RED (ホスト OS ポート番号:11880 → ゲスト OS ポート番号:1880) と sonospollytts (ホスト OS ポート番号:1980 → ゲスト OS ポート番号:1980) の転送設定を追加します。

enebular-agent のインストール
フローのデプロイが楽になるため、AWS IoT を利用して enebular-agent をインストールします。
(参考) Raspberry Pi を AWS IoT に繋いで enebular と連携
https://qiita.com/kitazaki/items/ffd50396cb09d6ab7050
(参考) enebular agentをバージョンアップ(2.5.0)してみた。
https://note.mu/kitazaki/n/n09fb4c73785f
フローのデプロイ
enebular web dashboard または enebular editor からフローをRaspberry Pi Desktop へデプロイします。

enebular editor の起動

enebular editor の場合は、インストールや設定の必要は無く、デスクトップモードでフローを起動すればOKです。

サンプルフロー

inject ノードと sonospollytts ノードを接続します。debug ノードは無くても動作には問題ありません。

inject ノードの編集を行います。ペイロードは「文字列」を選択し、値に発話させたい文章 (ここでは「こんにちは」 )を設定します。

sonospollytts ノードの編集を行います。
Polly Config は AWS IAM で作成した Polly Access key と Polly Secret key を設定します。
Polly Voice は日本語では Mizuki （女性）と Takumi （男性）から選択できます。
Sonos IP は Sonos に割り当てられた IP アドレスを設定します。
Sonos Hailing は Disable を設定します。
Node-Red IP はホスト OS に割り当てられた IP アドレスを設定します。ゲスト OS に割り当てられた IP アドレスは設定しません。

まとめ

Sonos の指定した mp3 を再生する機能と Amazon Polly を利用して Sonos から発話させてみました。
音楽を再生している途中で Sonos が突然しゃべり始めると、ちょっとビックリすると思います。(笑

良き Sonos ライフを！

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up