米国で話題の音声SNS ~ 入力革命の予兆
アメリカでは、音声版Twitter「Clubhouse」の評価額が話題になっている。
▶ 米国スタートアップ界で話題の次世代SNS「Clubhouse」になぜ100億円以上も時価総額がつくのか?
このSNSがどうなるかはさておき、音声や画像認識がこれから一般化されてくるのではないかと多くの人が感じているように思う。Alexa、Google Homeを触った人ならなおさら、そう感じているかもしれない。
端末、ソフトウェアの進化、人材の増加
インターネットの普及により通信革命がなされ、新しいビジネス、生活スタイルが生まれた。
そして、今、端末の処理性能の高速化、通信をベースとした処理性能の補完がなされている。量子コンピューターも処理性能の高速化に寄与していっていくだろう。
また、処理性能の高速化と相まって、様々な機械学習などのソフトウェア、そして、エンジニアも増えている。こうしたソフトウェア、人材の増加がこれまでと違ったソフトウェアの入力を生み出している。
既存の入力方法を変える、画像認識・音声認識
既存の、マウスやキーボード、タッチパネルだけでなく、画像認識・音声認識がその筆頭だろう。
少し前はまだまだ精度が低いとされていたが、今は、前述の技術的な基盤の変革により、かなり高精度な物となっている。
それに加え、GCPなどを利用してSaaSとして、比較的低額で手軽に、こうした機能を利用できるようになっている。
また、OSSにおいても画像認識ならOpenCV、音声認識ならJuliusと誰もが手軽にこれらの新しい入力を実現する機能を触れるようになった。
AndroidやiPhone、スマートスピーカーを使ったことがあれば、音声認識の精度の高さを実感する。また、顔認証や画像検索、OCRなどを利用すると、以前の認識を覆すほどになっている。
従来のアプリケーション、Webシステムの入力革命
前述の背景をもとに、これから既存のアプリ、また、Webサイトにおいて、キーボードやマウス、タッチとは違う入力方法が採用されてくる。
いわば、「入力革命」が起こってくるのだろうと思う。
まだ、ソフトウェアもWebサイトもこうした入力革命を表しているものは少ないが、官公庁や大企業サイトやアプリを初め採用されてくるのではないだろうか。
特に、官公庁のサイトは、情報が有りすぎて、高齢者をはじめ使い勝手が悪いと思っている人は多いはずである。
役所にいって受付で行き先を尋ねるように、Webサイト上で、キャラクターが音声で案内にしてくれ、音声ガイダンスに従って言葉で目的の情報まで表示してくれるサイトができるかもしれない。
選択肢が少ないサイトやアプリは入力革命とは無縁かもしれないが、上記のような選択肢が多いアプリやサイトでは、入力革命をベースとした操作方法の変革が採用されていくように感じる。
通信革命から入力革命へ
2000年初頭から2020年までは、インターネット、そして、それを携帯して使えるスマホまで通信革命が世の中を変革してきた。
そして、これからは画像認識、音声認識、そしてそれを支える機械学習やビッグデータ解析、SaaSによって、入力革命がなされていくのだろう。
コロナショックによって、ZoomやTeamsなどPCをつかった、カメラやマイクの利用が徐々に一般化している。これは音声や画像を利用した入力の後押しになるのではないだろうか。
既存アプリやWebシステムの入力革命がこれからおこっていくだろうと思う。
また、それに伴って、音声マーケットなども増加していくかもしれない。