WWDC2016のSpeech Recognition APIをまとめてみました。
といっても、実装やできることなどはこちらの記事などで触れられていますので、
主に制約などを調べてみました。
インターネット接続はほぼ必須
セッションの03:30あたりで言及していますが、インターネット接続は必要です。
SiriやKeyboard Dictationと同じ技術要素を使っているので、当然といえば当然です。
ただし、except some some language and device models
とも言っているため、オフラインでも使える端末と言語の組み合わせはあるようですが、それは明らかにされていません。
回数制限あり
09:30あたりのBest Practice
のスライドで言及していますが、以下の回数制限があるようです。
- 端末につき、1日あたりの回数制限が設定されている
- アプリについても同様に、回数制限が設定されている
日常的に回数制限に引っかかるようであれば、連絡してほしいとのこと。
お手軽ではない
こちらも同じ画面から。
実装自体は簡単ですぐ使えるようになりますが、バッテリーやネットワーク通信の観点から考えると、安価な処理ではない、ということに留意してほしいとのことでした。
秒数についても制限あり
iOS10におけるKeyboard Dictationの制約と同様、連続しての使用は最大1分までとのことです。
プライバシーについて
当然といえば当然ですが、以下の2つのようなセキュリティ情報やセンシティブな情報については使うべきではないとのこと。
- パスワード
- 健康や財務に関する情報