LoginSignup
0
0

More than 1 year has passed since last update.

Think 2019 参加レポート:音声認識、チャットボット関連

Last updated at Posted at 2019-04-04

はじめに

2月12日から15日まで参加してきた IBM のイベント、Think 2019 についてのアウトプットシリーズ2種類目です。
前回 までは、3回連続で Watson Discovery の新機能 Smart Document Understanding を試してみました。この記事では、下記の2つの分野についてレポートします。

  • 音声認識
  • チャットボット

参加したセッションからピックアップ

日時、タイトルの順に記載します。それぞれ該当分野を記載しますが、分野は私が勝手に分類したものです。

2/12 14:30 Transform Your Contact Center with Watson-Powered Voice Agents

分野:音声認識。スライド公開あり。
下図は、スライドの25ページ目からの引用ですが、Watson AssistantSpeech to TextText to Speech の3種類の API と Nexmo という音声・メッセージ API を組み合わせる例の紹介でした。日本だと、類似のもので Twilio をご存知のかたが多いかもしれませんね。
p25_from_4548voice_agent.png

アメリカの社会保障法に基づいて発行されている社会保障番号(Social Security number、略して SSN)を題材にしたサンプル・アプリケーションのデモが行われました。スマートフォンから電話で社会保障番号の変更を申請し、本人確認のためのやりとりをすすめて最後に変更を完了するまでのデモでした(下図はデモ中の様子)。なお、本当の社会保障番号ではなく、ダミーで用意された番号を変更していました。チャットボットと音声認識の組み合わせでできることとして、具体的でとてもわかりやすく参考になるセッションでした。
12_1430_4559voice_agents_demo.jpg

デモを含めて前半部分を Tom Banks 氏が話し、後半で女性講師(氏名聞き取れず)が Speech To Text について紹介していました。

2/13 15:30 IBM Watson Speech to Text: A Training Guidebook for Technologists

分野:音声認識。スライド公開あり。
Speech to Text の学習データ作り方について詳しく解説したセッション。Speech to Text をいろいろとカスタマイズしたい技術者向けのセッションでした。
下図はスライド10ページ目からの引用ですが、全体的に文字が圧倒的に多いので読むのが大変かもしれません。
p10_from_7027s2t_guidebook.png

IBM Developer では、昨年の 2018年7月に Build a custom language model for Watson Speech to Text というチュートリアルが公開されていました。THINK 2019 の翌月の3月12日に Train a speech-to-text model というコード・パターンも公開されました。スライドに目を通した後す前に、これらのチュートリアルとコード・パターンに取り組むといいかもしれませんね。

2/14 10:30 Why a Failure Strategy is Crucial for the Success of Your AI Product

分野:チャットボット。スライド非公開。
AutoCAD という図面作成ソフトウェアはご存知ですか? このセッションは、AutoCAD などを販売している Autodesk Inc. の Kris Zhou 氏による事例紹介でした。Autodesk Inc. の Web サイトにログインして右上の言語(下図の丸1)を英語(English)に切り替え、左上のメニュー(下図の丸2)から Customer Service の Contact Support を選択すると下記のような画面が表示されます。英語限定と思われますが、この画面からいろいろなお問い合わせをすることができます。
autodesk0.png

このコンタクトセンター機能を作る過程で試行錯誤しながら工夫したことを紹介するセッションでした。残念ながらスライド非公開ですが、良かれと思っていろいろな機能を盛り込んだらかえって満足度が低下した、などチャットボットを作るうえで技術者が気を付けなければいけない点を多数聞くことができました。詳しいお話をさせていただく機会を別途予定していますのでお楽しみに!

2/14 15:30 How Ingram Micro Improved Customer Experience with Watson AI

分野:チャットボット。スライド公開あり。
IBM の各種ハードウェアおよびソフトウェアを取り扱う卸売業(Distributor)が各国にあります。専門商社という言葉のほうがわかりやすいかもしれませんね。アメリカやブラジルなど各国に拠点を持つ Ingram Micro もその一つです。下図はスライド6ページ目から引用した、ブラジル国内の拠点図です。
p06_from_1279ingram_micro.png

ブラジル拠点の講師により、ブラジル国内での問い合わせ受け付け業務をチャットボットでどの程度効率化できたか事例発表がありました。人間とのインターフェースには、Facebook Messenger を使用しているそうです。

ちなみに IBM の販売パートナー向けの My Sales Activity(MySA)という仕組みのユーザーガイドの英語版は31ページ、Partner Guided Selling(PGS)についてのユーザーガイドの英語版は180ページあるんだそうです。いままでは、各代理店からの質問にたいして上記のユーザーガイドを人間が確認して回答していました。この作業をチャットボットで置き換えようとしたところ、下図で引用した18ページ目によると、インテンツは70件以上で、エンティティが10件以上で構成できたそうです。
p18_from_1279ingram_micro.png

参加したかったけどできなかったセッション

2/14 11:30 Best Practices for Continuous Improvement with IBM Watson Assistant
分野:チャットボット。スライド公開あり。
Watson Assistant Continuous Improvement Best Practices という PDF 形式の資料を参考に作成されたスライドのようです。スライドの中で上記の資料が紹介されていました。その資料はほとんどが文章ですが、下図で引用した17ページ目のように、スライドは文章よりも画面キャプチャの割合が多めです。最初にスライドを見てから資料を読むと理解しやすいかもしれませんね。スライドをざっと見る限り、チャットボット運用中に得られたログなどを改善にフィードバックする参考になりそうそうです。
p17_from_4543best_practice_assistant.png

まとめ

以上いかがでしたでしょうか。2019年4月3日水曜日から5日金曜日まで東京テレポート駅最寄りのビックサイト・青海展示棟で開催の第3回 AI・人工知能EXPO に行かれる予定のたかたも多いかもしれません。筆者は一日目の夕方ごろに行きました。チャットボット、テキストマイニング、ビッグデータ分析、音声認識、AI をつかったアプリケーションの開発支援を紹介する展示ブースが増えましたね。これからチャットボットおよび音声認識に取り組まれる方も多いと思います。この記事が何らかの参考になれば幸いです。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0