LoginSignup
3
1

More than 1 year has passed since last update.

次世代の音声認識YYProbe開発者に聞いてみた

Last updated at Posted at 2022-12-19

こんにちは!
今日はデフエンジニアの会アドベントカレンダー企画19日目として、以前デフエンジニアの会メンバーにYYProbe等の音声認識アプリの説明をしてくださったYYさんにインタビューします!

─その前にまずYYさんの簡単な紹介をします。YYさん、よろしくお願いいたします。

((((;゚Д゚)))))))
よろしくお願いします。YYProbeなどのアプリを開発しています中村と言います。iOSエンジニアで趣味は開発です。

─YYさんは今、音声認識関連のあらゆるアプリを開発していますが、それはどういうことがきっかけですか?

開発の経緯はこちらの記事を見ていただきたいです。

こちら→https://note.com/hakehachiro9600/n/n15eb136771d9

当初の目的は、自然な会話から個人の経験や知識などを収集し組織ナレッジとして蓄積することでした。

その開発の試作品ができた頃にコロナになり、在宅勤務、オンラインMTGが当たり前になった時に、社内の聴覚障害者から音声認識を活用できないか?と相談を受けたことでした。

会議アプリとして作っていたのでそのまま社内実証実験を開始しました。それがかなり良くて現在に至ります。

─そうだったのですね。ユーザーの声を拾ってそれを形にしたということなのですね。
では、それぞれのアプリの簡単な紹介・特徴・メリットをしてもらえますか?

オープンになっているアプリは4種類あります。

①YYProbe
iOS版、Android版があります。
多人数で音声やキーボードでコミュケーションを取ることができ、会話の収集分析が目的のアプリです。
音声認識はノイズに強く、集音範囲なども変更できるため文字起こしの精度は他社と比較してかなり高い部類かと思います。
無料版と法人版、その他いくつかプランがあります。

騒音の多い工場現場での利用を想定しているため、周囲の雑音に強いのが特徴です。
また、聴覚障害者がオンラインMTGで困っているというのも意識して、ビデオ通話の低品位の音声にも強くすることに注力しました。

②YY文字起こし
iOS版のみのアプリでシンプルな機能に軽く基本1対1で簡単に文字起こしするために作ったアプリです。
ユーザー登録などもなく無料で利用いただけます。
音声認識はYYProbeと同じものです。
また、オフラインのエンジンもダウンロードできるようにしてありますので機内モードでも利用できます。
YYシリーズで一番人気のアプリなのかなと思っています。

③YYデスクトップ字幕
Windows用の字幕アプリです。
透明なWindowをいろんなアプリの上に重ねて字幕として利用できます。YYProbeとも連携可能です。
もちろん無料で利用いただけます。

④YY雰囲気カメラ
 YYProbeの音声認識にプラスして
 ・画像認識、画像変換によるカメラ画像加工
 ・サウンド認識による音のオノマトペ化
 ・音楽認識による楽曲、アーティスト名の表示
 ・AI画像生成による言葉のイラスト化
などができます。
音を可視化し楽しむためのアプリです。
最近では子供向けの絵本の読み聞かせコンテンツなども制作してイベントで利用いただいています。
オノマトペのデザインはエキマトペで有名な株式会社方角さんに担当してもらっています。

※株式会社方角代表取締役の方山さんもアドベントカレンダーにご協力いただいています
記事はこちら→https://qiita.com/denkiry/items/89c6ef5cc95b0007c7d9
方山さんありがとうございました。

─色々なアプリを開発してきたのですね!どれもすごいです。
このアプリを開発する際に一番苦労したことは何ですか?

大きく分けて2つです。

①収益がほとんどない新規事業として社内の開発を継続させる事
②主なユーザーである聴覚障害者の方の実体が分からなかった事

ですね。

①に関しては、いつプロジェクトの予算を止められるか?いつもヒヤヒヤしながら進めてきました。
今はおかげさまで収益も少しづつですが目処が立つようになり、認知度も上がってきましたので社内で応援してくれる人が増えてきました。当初は敵だらけという感じでした。
とにかく信念を持って、諦めないことが大事でしたね。

②に関しては社内の400名近い聴覚障害者ユーザーとSNSを通じたユーザーの皆さんとの接点があり少しづつわかってきた感じです。
しかしまだまだ勉強不足です。

─それは良かったです!では、これらの開発の際に一番気を付けたこと(心掛けたこと)は何ですか?

そうですね。

  • ユーザーの視点に立つ
  • 短期的な収益を求めない
  • 諦めない
  • そして誰よりも速く

この4点ぐらいですかね。言葉にすると簡単ですが、それぞれ奥深く難しい課題です。
開発者にはゴールはなく永遠に続く課題かと思います。

─ここまでお話をお伺いして思ったのですが、YYさんは最初のきっかけは社内の聴覚障害者からの要望だったと思います。そこからどんどん成長していったのと同時により多くの聴こえない・聴こえにくい方々と接することも増えたかと思います。
その中で、彼らと接して思ったことなどはありますか?

色々ありますが、1つ自分の持ち合わせていなかった大事なことを教えていただきました。
YYの主なユーザーの聴覚障害者の皆様の意見は、ほとんどが聴者にも意味のある事である。ということです。
私(聴者)では気づけない事に気づいてくれ、教えてくれる。指摘やリクエストはなるほど!と思うことがほとんどです。

実は、この先、聴覚障害者の割合が増えていくという予想があります。→WHOの2050年予想図(世界聴覚報告書*2050年までに4人に1人が聴覚障がいに)

聴覚障害者がマイノリティで無くなる時が来るとすると、社会が障害だらけになってしまいます。
そうなると危険な事や事故も増えるでしょう。

今、聴者が不自由なく当たり前に生活している状態が当たり前でなくなる。
その当たり前でない事は何か?そこに社会を変えるヒントがある。

それに気づいてしまいましたので、この分野で開発を続けていくことは自分の役割なんだと認識しました。

それに気づかせてくれたYYのユーザーの皆様に感謝しかありません。それが今素直に思っている事です。

─YYさん、貴重なお話をありがとうございました。
今後も聴覚障害者(ろう者・難聴者)の方々の生活を助けるアプリ開発を続けていくということは、同時に聴者の暮らしの支えにもなる可能性が高い、ということなのですね。
そしてYYさんはすでにその重要性に気づき、それが自分の使命だと思っていることが分かりました。
今後どうなっていくのかは分かりませんが、きっとYYさんの未来は明るいと思います!
YYさんの今後の未来を皆さんで応援していきたいですね。

YYさん開発のアプリ紹介

  • リアルタイム音声認識アプリ YYSystemのサイト→サイトはこちら
    YYProbe/YY文字起こし/YYデスクトップ字幕/YY雰囲気カメラもこちらで見られます
  • オンラインホワイトボード(ナレッジボード)紹介ページはこちら→サイトはこちら
  • 開発者Twitterはこちら→Twitter
3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1