PDF資料はこちらからどうぞ。
http://seahorse-inc.com/QIITA/TJBot-1/STTセットアップ全手順_20170718.pdf
1. はじめに
TJBotは声を文字、文字を声にしたり、話しかけられた意図(意味)を理解してお話したり、色々な情報から欲しい情報を探してくれるといった、「IBM WatsonコグニティブAPI」をこれからやってみようという人にはうってつけのキットです。
厚紙や3Dプリンターでホディを作り、小さく低価格のコンピュータ(Raspberry PI)で頭脳を組み込みます。手を振ったり、LEDの色を変えたり、話しかけると答えてくれます。
機能的にはシンプルですが、反応してくれるとワクワクして楽しく、ボディは簡単に組み立てられるようになっています。
TJBotはすでに、色々な「IBM WatsonコグニティブAPI」を組み合わせた「レシピ」があります。
本投稿は、できあがっている「レシピ」を参考に、実際に作ってみた手順となっています。
使用するパーツなどの関係で、そのままの「レシピ」ではうまくいかないところや分からない点がありましたが、試行錯誤の末、ちゃんと動作することができました。
さらに、おまけとして日本語対応しました。
尚、厚紙でTJBotのボディ作成は割愛させていただきますが、下記URLを参考に作ってみてください。
https://www.youtube.com/watch?v=UEnuF--LA-0
https://www.instructables.com/id/Build-TJ-Bot-Out-of-Cardboard/
厚紙、3Dプリンター用の図面は下記URLです。
https://ibmtjbot.github.io/#gettj
ちなみに私は、A2サイズ2mmの厚紙にpdf印刷出力の図面を貼り、デザインナイフでカットしました。
デザインナイフでカットすると、かなり時間と労力を要しますので、レーザーカットをお勧めします。
レーザーカッターを時間制で使えるサービスもあるようです。
厚紙とRaspberry Pi、マイク、スピーカー、LED、モーターでTJBotを組み立て、Watson Cognitive APIを使って、色々なレシピが生まれています。
本投稿は、各レシピを実際に作成し、日本語化を行ってみた際の手順内容となっています。
2. TJBotについて
TJBotは、IBM ResearchのMaryam Ashooriによって、認知対象の設計と実装におけるベストプラクティスを見つけるための実験として作成されました。
https://www.ibm.com/blogs/research/2016/11/calling-makers-meet-tj-bot/
TJBotは、楽しい方法でWatsonサービスを理解するために生まれた、オープンソースプロジェクトです。
https://ibmtjbot.github.io/
3. 今回作成するレシピ
Watson 「Speech to Text」とRaspberry Piを使って、マイクに話しかけた内容で、LEDの色を変えます。たとえば、LEDの色を緑色に変更するには、「光を緑にする」と言います。
使用させていただいたレシピのサイト情報:
https://www.instructables.com/id/Use-Your-Voice-to-Control-a-Light-With-Watson/cm_mc_uid=10504612478614984670523&cm_mc_sid_50200000=1500263609
4. 材料
価格は変わる可能性があります。
厚紙は、ミューズ KMKケントボード SS-A22mm厚を使いました。
5. H/Wセットアップ
Raspberry Pi用のOS Rasbianのインストールは割愛させていただきます。
http://qiita.com/Mitsu-Murakita/items/90907782b6aec9959328
の「3. Raspbian関連のインストール」などを参考にしえください。
5-1. LED
スイッチサイエンス社 NeoPixel スルーホールLEDを使用しました。
LEDは平らにカットされている方から
1.--- 使用しない
2.--- GND ⇒ 6番ピン
3.--- +3.3V ⇒ 1番ピン
4.--- Data in ⇒ 12番ピン
になっています。
(注意!)RaspberryPiに接続する際は、2⇒4⇒3の順番に接続する
5-2. USBマイク
BU-Bauty PC Mac用USBマイク 超小型 超ミニ 22mmx18mmx5mmを使用しました。
USBマイクを接続してから、lsusbコマンドでデバイスが認識されているか確認します。
lsusb ⏎
この例では、“Bus 001 Device 004: ID 0d8c:0016 C-Media Electronics, Inc”で認識されています。
ハードウェアデバイスを調べます。
$ arecord –l ⏎
マイクの感度を調整します。(-cに続く番号はcard番号です)
$ amixer sset Mic 50 -c 1 ⏎
録音してみます。
$ arecord -D plughw:1,0 -d 10 -f cd test.wav ⏎
(plughw:1,0はarecoed –l のカード番号とデバイス番号です。生成する音声ファイルはtest.wav)
PCなどに転送して音を確認してください。
6. Watson「Speech to Text」サービスの作成
Bluemixにログイン
https://console.bluemix.net/
「username」「password」を後程使用しますので、メモ帳などにコピー保存してください。
7. Raspbianの最新化とNode.js、npm、サウンド関連のインストール
TeratermなどでSSH接続します。ID、パスワードの初期値は、
ID: pi
Password: raspberry です。
以下のコマンドを実行してください。
$ sudo apt-get update ⏎
$ sudo apt-get dist-upgrade ⏎
$ curl -sL https://deb.nodesource.com/setup_6.x | sudo -E bash - ⏎
$ sudo apt-get install -y nodejs ⏎
$ sudo apt-get install alsa-base alsa-utils libasound2-dev ⏎
8. コードのダウンロードとインストール
$ git clone https://github.com/ibmtjbot/tjbot.git ⏎
$ cd tjbot/recipes/speech_to_text ⏎
$ npm install ⏎
9. 「Speech to Text」構成情報の設定
ディレクトリを ~/tjbot/recipes/speech_to_text に移動します。
$ cd ~/tjbot/recipes/speech_to_text ⏎
インストールされたデフォルト構成ファイル「config.defaule.js」を「config.js」という名でコピーし、「config.js」を編集します。
$ cp config.default.js config.js ⏎
“【4】Watson「Speech to Text」サービスの作成”で取得した、「username」「password」を登録します。
ここではnanoエディターを使用しました。
$ sudo nano config.js ⏎
「password」「username」を登録し、Ctrl+x ⇒ y ⇒⏎で保存します。
10. LED 色指定の問題
LEDが指定した色で光るかを確認します。
確認用プログラムをインストールし、実行します。
$ cd ~/tjbot/bootstrap/tests ⏎
$ npm install ⏎
$ sudo node test.led.js ⏎
おそらく意図したように光らなかったと思います。
これは、LEDの色設定(Data in)のPWMモジュールがピン番号12(GPIO 18)を使用していますが、内臓のオーディオ出力も同じGPIO18を使用しているため、競合状態となる為です。
回避策として、内臓のオーディオジャック出力を止める方法があり、以下のコマンドでサウンドカーネルモジュールを無効します。
ただこの場合、オーディオ出力はHDMI、USB、またはBluetooth経由でスピーカーを接続する必要があります。
$ cd ~/tjbot/bootstrap ⏎
$ sudo cp tjbot-blacklist-snd.conf /etc/modprobe.d/ ⏎
$ sudo update-initramfs -u ⏎
$ sudo reboot ⏎
raspberryが再起動したら、確認用プログラムを試して、意図した通り色が光ることを確認してください。
$ cd ~/tjbot/bootstrap/tests ⏎
$ sudo node test.led.js ⏎
11. プログラムの実行
$ cd ~/tjbot/recipes/speech_to_text ⏎
$ sudo node stt.js ⏎
'turn the light red'
'change the light to green'
'turn the light off'
など話しかけてみてください。
LEDの色が変わります。
12. 日本語対応に変更
12-1. 変更点1:listenの言語を日本語に変更
~/tjbot/recipes/speech_to_text/node_modules/tjbot/lib/tjbotjs
tbot.jsの152行目
language: 'en-US' // see TJBot.prototype.languages.listen
⇒
language: 'ja-JP' // see TJBot.prototype.languages.listen
12-2. 変更点2:色情報を日本語に変更
~/tjbot/recipes/speech_to_text/node_modules/colornames/color.js
color.jsをcolor_org.jsにバックアップコピー
$ cp colors.js colors_org.js ⏎
colors.jsの内容を下記内容に置き換える
module.exports = [
{
"value":"#000000",
"name":"黒"
},
{
"value":"#808080",
"name":"灰"
},
{
"value":"#C0C0C0",
"name":"銀"
},
{
"value":"#FFFFFF",
"name":"白"
},
{
"value":"#0000FF",
"name":"青"
},
{
"value":"#000080",
"name":"ネイビー"
},
{
"value":"#008080",
"name":"青緑"
},
{
"value":"#008000",
"name":"緑"
},
{
"value":"#00FF00",
"name":"黄緑"
},
{
"value":"#00FFFF",
"name":"水"
},
{
"value":"#FFFF00",
"name":"黄"
},
{
"value":"#FF0000",
"name":"赤"
},
{
"value":"#FF00FF",
"name":"マゼンタ"
},
{
"value":"#808000",
"name":"オリーブ"
},
{
"value":"#000000",
"name":"黒色"
},
{
"value":"#808080",
"name":"灰色"
},
{
"value":"#C0C0C0",
"name":"銀色"
},
{
"value":"#FFFFFF",
"name":"白色"
},
{
"value":"#0000FF",
"name":"青色"
},
{
"value":"#000080",
"name":"ネイビー色"
},
{
"value":"#008080",
"name":"青緑色"
},
{
"value":"#008000",
"name":"緑色"
},
{
"value":"#00FF00",
"name":"黄緑色"
},
{
"value":"#00FFFF",
"name":"水色"
},
{
"value":"#FFFF00",
"name":"黄色"
},
{
"value":"#FF0000",
"name":"赤色"
},
{
"value":"#FF00FF",
"name":"マゼンタ色"
},
{
"value":"#808000",
"name":"オリーブ色"
},
{
"value":"#800080",
"name":"紫色"
},
{
"value":"800000",
"name":"茶色"
},
{
"value":"#FFFFFF",
"name":"オン"
},
{
"value":"#000000",
"name":"オフ"
}
]
12-3. 変更点3:stt.jsを日本語に変更
~/tjbot/recipes/speech_to_text/stt.js
12-3-1. 39行目あたり
console.log("I understand lots of colors. You can tell me to shine my light a different color by saying 'turn the light red' or 'change the light to green' or 'turn the light off'.");
⇒
console.log("私は、たくさんの色がわかります。「光を赤にする」、「光を緑に変える」、または「光をオフにする」、「光をオンにする」と言ってみて下さい。");
12-3-2. 53~57行目あたり
var containsTurn = msg.indexOf("turn") >= 0;
var containsChange = msg.indexOf("change") >= 0;
var containsSet = msg.indexOf("set") >= 0;
var containsLight = msg.indexOf("the light") >= 0;
var containsDisco = msg.indexOf("disco") >= 0;
⇒
var containsTurn = msg.indexOf("つける") >=0;
var containsChange = msg.indexOf("変える") >=0;
var containsSet = msg.indexOf("する") >=0;
var containsLight = msg.indexOf("光") >=0;
var containsDisco = msg.indexOf("ディスコ") >=0;
12-3-3. 64行目あたり
if (colors[word] != undefined || word == "on" || word == "off") {
⇒
if (colors[word] != undefined || word == "オン" || word == "オフ") {
12-3-4. 70,76,86行目あたり
コメントをはずし、function discoParty()関数を有効にする。
13. 日本語対応版プログラムの実行
$ cd ~/tjbot/recipes/speech_to_text ⏎
$ sudo node stt.js ⏎
「光を赤にする」、「光を緑に変える」、または「光をオフにする」、「光をオンにする」と言ってみて下さい。
黒/灰/銀/白/青/ネイビー/青緑/緑/黄緑/水/黄/赤/マゼンタ/オリーブ
黒色/灰色/銀色/白色/青色/ネイビー色/青緑色/緑色/黄緑色/水色/黄色/赤色/マゼンタ色/オリーブ色/紫色/茶色
オン/オフ(オンは白色、オフは黒色です)
の色が指定できます。
14. おわりに
TJBotのボディは "Cardboard"と書かれててたので、素直に”紙段ボール”で作りましたが、 フニャフニャで細かい箇所は強度が足りなくてうまく作れませんでした。”プラ段ボール”に代えて2体目作成しても同じ状況です。
思い込みで訳を間違えていたようで、”厚紙”でやっと完成です。
「ミューズ イラストレーションボードSS 2mm厚 A2」がいいです。世界堂で売ってます。通販なら楽天もありますが(https://item.rakuten.co.jp/reino-web/3110319-ssa2-10/ )10枚入りのため共同購入するか、TJBotを10体作るかです。
また、デザインカッターを使いましたが、肩こりになる恐れがありますのでレーザーカットをお勧めします。時間制で貸してくれるところもあります。