はじめに
Google AIY Voice Kitは、Googleが人工知能の学習を目的として開発したAIスピーカーの開発キットです。
元々、英国の公式Raspberry Piマガジンの付録で人気が出て、ここ日本でも去年から販売されるようになり、入手することができます。
本記事はVoice Kitのセットアップや導入時の留意事項ついて簡単にまとめました。
必要なもの
Voice Kitは単体では使用できません。Raspberry Pi一式と以下のものが必要になります。
- Voice Kit用のイメージファイル
- 精密ドライバー(+)
- 両面テープ
- Googleアカウント
構築手順
Voice Kitの構築は、専用プログラムを使用するためにVoice Kit用OSのインストール、筐体の組み立て、スマートスピーカーのキーとなるAIクラウドサービス「Google Cloud Platform(Google Assistant API)」による設定が必要になります。なお、商品付属の「日本語版 組み立てガイド」にも記載がありますが、効率よく作業する場合は先にVoice Kit用のOSインストールから始めると良いでしょう。
OSインストール
こちら(※)より、Voice Kit用のイメージファイルをダウンロードしてイメージを作成します。
※ クリックするとダウンロードが始まります。
また、イメージファイルは拡張子が.xzになっているため、macの場合はターミナルで以下のコマンドを実行することで展開できます。
$ xz -dv aiyprojects-2018-04-13.img.xz
OSインストールは以前書いたラズベリーパイの基本のOSインストールを参照。また、SSHはデフォルトで有効になっているので、IPアドレスの設定と、VNCサーバーを有効にしておくと作業がやりやすいと思います。
メインパーツの接続及び筐体ボックスの組み立て
商品付属の「日本語版 組み立てガイド」を見ながらやれば、ゆっくりやっても1時間程度で作成できます。
オンラインでもKSYの段ボール製 Piケースの組み立て方 [Piケース 段ボール for 0/W]で、組み立て手順を公開しています。
以下に作る上での留意事項を記載します。
- Raspberry Piとの接続
下の写真のようにRaspberry Piに、Voice HATボード(部品1)を取り付けるため、後から外すのは難しそうです。なので、Voice Kitで使用するRaspberry Piは、専用のRaspberry Piにした方がよさそうです。
-
マイクロフォン ドーター ボードの接着
マイクロフォン ドーター ボードのマイク部分(両端の白い部品)を、 「MIC BOARD」印刷部分の左右にある2つの穴に合わせるようにして貼り付けるため、ここで両面テープが登場します。
Google Cloud Platform(Google Assistant API)のセットアップ
Google AIY ProjectsページのGET CREDENTIALSを参考にしながら、Googleのデベロッパーコンソールから資格情報を取得し、アシスタントとクラウドスピーチAPIを利用できるように登録を行います。大まかな手順は以下の通りです。
- Google Cloud Platformにアクセスし、Googleアカウントにログインする
- 利用規約に同意する
- 新しいプロジェクトを作成する
- Google Assistant APIを有効にする
- 資格情報の作成及びclient_id.jsonファイルのダウンロード
- assistant.jsonファイルの作成(先ほどダウンロードしたJSONファイルの内容をRaspberry Pi上のファイルに書き込む)
- アシスタントのデモを実行する
日本語設定
デフォルトは英語で出力されるため、日本語に設定する場合はコマンドで行う方法とスマートフォンのアプリで行う二つの方法があります。スマートフォンのアプリで行った方が簡単なため、iPhoneを例にアプリの設定手順について以下に記載します。
- iPhoneのApp Storeで、Google Assistantをインストールする
- 設定画面のデバイスからVoice Kitのデバイス名を選択する
- アシスタントの言語から日本語(日本)を選択する
さいごに
Voice Kitはあくまで学習用に作られているだけあって、サンプルのプログラムが格納されているだけにすぎません。なので、とりあえず試すだけならできますが、自動起動の設定もされていないため、使用するときは起動する必要があります。
使ってみた感じ、Raspberry Piを完全にくっつける以外は納得しました。値段も3,000円程度なので人工知能の学習としてはいいかなと思います。
とりあえず、話したり、テキストに書かせた内容を喋らせたりなど色々遊んでみようと思います。