Amazon Echo Spotが2018/7/26より発送、ということで、Alexa向けの画面対応スキルを作ってみました。
Alexaスキルストアに「かおもじ」スキル公開しています。
開発に時間を取れなくなったので停止しました。
停止は、開発者コンソールのスキル一覧に「停止」があり、数分で止まりました。(2時間以内に停止、と表示されました。)
githubにソース公開しています。スキルストアに公開しているものとは一部異なります。
https://github.com/hal1999/kaomoji
スキル開発の知識と環境があることが前提ですが、設定ファイルを修正してご自分で配置することで、お好きな言葉や画像への変更にも対応できるはずです。
スキル概要
スキルストア を参照ください。
作るために用意したもの
- Node.js 開発環境 : Node(npm), VisualStudioCode など
- Amazon開発者アカウント : Skillを作るために必須
- AWSアカウント : Skillのバックグラウンド処理のためのLambdaの他、画像ホストにS3を使用しました。データ保存のためにDynamoDBもこれから使用するかも。
開発手順
既に画面付きSkillの記事を書かれている方もいらっしゃいますし、今は公式の日本語ドキュメントもありますので、書かないことにします。
ask-sdkはドキュメントが足りないかもしれませんが、一部(全部? 見つからなかっただけかも)ソースとテストコードが公開されているので、追えば仕組みも使い方もだいたい分かります。
今後やるかも
- 「かおもじ」スキルの言葉と画像を増やす。
- 言葉に対して、どの画像を提示するのが望ましいのか、ユーザのフィードバックを受け取って学習できるようにする。(これでDynamoDB使いそうです。)
- ↑の学習のリセット
- 言葉ごとに学習するのも非効率なので似たものはまとめて学習とか。。。
- 受け付ける言葉もユーザごとに。。。できないか。。。?
- 任意の言葉をユーザから登録できるように。(Alexaのモデルの仕様上、基本的には想定される単語のリストを事前に登録しておく仕様なので、これは難しそうな気がしている。)
余談
- 私は実機を持っておりませんが、開発者コンソールのテスト画面でSpot(Showも)の画面プレビューが出ますし、続けて対話することでセッション状態もだいたい分かりますので、表示するだけならなんとかなりました。画面タップに対応するのは実機が無いと厳しいと思っています。音声認識精度のチェックも、Alexaアプリでできます(画面無しで)。
- 7/26に間に合わせるつもりで7/24に作成して申請していたのですが、公開前審査の指摘対応で手間取って、結局7/30公開になってしまいました。。。審査は結構細かいです。