ASRPRO について
・以前より ASRPRO開発基板、ASRPRO-CORE という音声認識モジュールが販売されています。
・それぞれ フラッシュが2M、4Mの物があります。
・オフラインで音声認識が可能で高い認識率、長距離識別、AEC音声中断、自学習にも対応しています。
・中国語版ではありますが、ブロックでのプログラムが可能で初心者にも使いやすいものとなっており重宝していました。
・ただ、中国語と英語のみで まだ日本語は使えません。
・自学習では日本語を登録することも可能です(最大32語まで)
ASRPRO開発基板 V1.0(V2.0 が出ています)
ASRPRO-CORE基板
Tianwen Block のホームページ
http://www.twen51.com/new/twen51/
プログラム画面
・システムロケールを中国語(簡体字)にしないと文字化けします。
・インストールにはセキュリティを切る必要があります。
・ユーザー名とパスワードで登録できますが、実際にプログラムを作成するには実名認証の為に中国の携帯番号が必要になります。
・そこで、開発者フォーラムからホワイトリストへの追加をお願いすると対応してもらえます。
開発者フォーラムへの入り口
開発者フォーラムの画面 (Google chrom で日本語に翻訳表示)
同じようなお願いをしている人がいるので参考にしてください。
M5Stack Unit ASR を試してみた結果
日本語にも対応している M5Stack Unit ASR が販売されたので購入して試してみました。
・音声認識については概ね良好です。
・中国語、英語、日本語と試してみました。 さすがに中国語はモデルも多く用意されていて認識率も高いように思います。
・製品にはあらかじめ英語の音声コマンドワードが入っています。
・私の発音では認識しづらいワードもありました。
・日本語についてもうまく認識してくれます。
・ただ、短い単語では誤認識が多いように思います。
・単語個々に感度を調整できるようですが、少し長めの単語に変更した方が良いようです。
・TTSの日本語はぎこちないです。(wav/mp3の音声ファイルへ置換えも可能)
・AEC音声中断は、思うようには機能していません。
・たとえば、音楽再生中に中断しようとしても反応しません。
・音量を絞って、大きな声で言ってやっと反応します。
分解してみます
・裏のビスを六角レンチで外すと簡単に分解できました。
・基板の上にスピーカーが貼り付けられておりマイクとスピーカが非常に近くなっています。
・これが、AEC音声中断がうまく機能しない原因かもしれません。
・CI1302 搭載の基板がベースになっており、この基板からはI/O端子も引き出されているのでシリアル通信だけでなくI/O利用も可能です。
ASRPRO を日本語対応に
・CI-03T の回路図を見ているとASRPRO の回路と非常に似ている。(いや、同じ?)
・そこで、CI-03T用に作成した firmware.bin ファイルをASRPRO に書き込んでみました。
・結果、あっさりと動作しました。 AEC音声中断もうまく働きます。
・これで、ASRPRO でも日本語が使えますが、ASRPRO側での編集はできません。
・あくまでも CI-03T側でプログラム作成、編集が必要なので ASRPRO のブロックでのプログラム作成、編集はできません。
ASRPROへの書込み
ASRPRO開発基板で動作している動画
CI-03T 回路図
ASRPRO 回路図 (CH340K搭載)
M5Stack Unit ASR の入手先(alliexpress でも入手できます)
https://www.switch-science.com/products/10220
CI-03T の入手先(2㎜ ⇒ 2.54㎜ ピッチ変換基板もあり )
https://www.aitendo.com/product-list/1259
ASRPRO の入手先
https://ja.aliexpress.com/w/wholesale-ASRPRO.html?spm=a2g0o.home.search.0
ASRPRO-CORE 4M
https://ja.aliexpress.com/item/1005007753456565.html?spm=a2g0o.productlist.main.9.654741f9kDWWsa&algo_pvid=0b7ea0fe-685a-47ed-920d-076519b60804&algo_exp_id=0b7ea0fe-685a-47ed-920d-076519b60804-4&pdp_ext_f=%7B%22order%22%3A%2255%22%2C%22eval%22%3A%221%22%7D&pdp_npi=4%40dis%21JPY%21231%21162%21%21%211.58%211.11%21%40214100f417460823703051910ec014%2112000042094623527%21sea%21JP%212973594926%21X&curPageLogUid=10EdJ6o9FSde&utparam-url=scene%3Asearch%7Cquery_from%3A
参考にさせて頂いた記事
Unit ASR カスタムファームウェアの生成とフラッシング
https://docs.m5stack.switch-science.com/ja/guide/offline_voice/unit_asr/firmware
M5Stack Unit ASRを日本語で使ってみる
https://qiita.com/fukuebiz/items/e815dcb0f540aa04ce6b
M5Stack Unit ASRで始めるオフライン音声認識
https://qiita.com/GOROman/items/f7eaa86461c6165fa115
M5Stack Unit ASRの独自ファームウェアを生成する
非常に詳しく解説されており大変参考になりました。
https://qiita.com/fukuebiz/items/0a6ea8bca630c5f36d06