LoginSignup
5
4

More than 5 years have passed since last update.

横浜市のごみ分別AIで使われているチャットボット Repl-AI でできること・その2(表現ゆらぎ吸収)

Last updated at Posted at 2017-08-20

Repl-AI は,ユーザー入力のゆらぎを吸収する機能がある.

  • 辞書(予め設定したワードを,特定のワードに変換する機能)
  • 曖昧一致(類似ワードかどうかを自動推定してマッチングする機能)
  • 部分一致(入力内に含まれていればマッチングする機能)

新規登録などはこちら ↓
横浜市のごみ分別AIで使われているチャットボット Repl-AI でできること・その1(新規登録・サンプルシナリオ・カスタマイズ)

辞書

辞書機能は,予め設定したワードを特定のワードに変換する機能で,システムでも吸収できない表現のゆらぎを吸収させるために用いる

例えば,あいさつ系のワードだったらボットがあいさつで返すケース.
普通に作成すると,あいさつに該当するワードを全て ユーザー発話BOX に入力する必要がある.

image.png

このシナリオは辞書を用いると,次のように設定できる.

辞書作成

ボット毎に設定する.
ボット一覧ページの ユーザー辞書 から設定ページへ遷移.

image.png

代表単語 と それに集約する単語を登録する.
ここでは先程 ユーザー発話BOX に設定していたワードを設定する.
代表単語に吸収する単語 にマッチした場合,ボットは 代表単語 として認識するようになる.

image.png

シナリオに辞書を適用

代表単語 だけシナリオに設定して,シミュレータで対話してみる.

image.png
image.png

表記ブレにも使える

ユーザーは,かな文字やカタカナ,漢字,アルファベットで入力してくるかわからない.
それぞれに対応できるように辞書を拡張する.

image.png

曖昧一致

入力した発話の概念を解釈し、似たような言葉にもマッチングするようにできる機能です。この機能を利用することで、ユーザの発話の揺らぎを自動的に吸収してくれるようになります。 「曖昧一致」機能について

類似ワードかどうかを自動推定してマッチングする機能.
実際に 曖昧一致 を有効にして,マッチしたワードをまとめてみた.

image.png

入力したワード マッチしたワード マッチしなかったワード
はい はい,うん,うむ.そう,イエス イェス,そうです,おっけー,OK,よい
いいえ いいえ,のー,ノー, だめ,ダメ,NG,ちがう,違う,のう,脳
犬,イヌ,いぬ いっぬ,イッヌ,🐶,🐩
猫,ネコ,ねこ ねっこ,根子,根っこ
旦那 旦那,夫,だんな,ダンナ,檀那 おっと,オット
妻,嫁,褄,都万,つま よめ,お嫁さん,ツマ,都万
家族 家族,かぞく,華族,ファミリー,ファミリ カゾク,ふぁみりー,ふぁみり,ファミリーマート

読み にしたときに入力したワードの読みと同じになる単語・漢字だとマッチする模様.
家族 → ファミリー のように英語のアルファベット読みのケースもマッチすることがわかった.
(ちなみに ファミリーマート だとマッチしないw)

部分一致

入力の一部に,設定した文字列が含まれている場合にマッチしてくれるようになる.

部分一致のチェックをつけると、設定したキーワードが実際のユーザー発話内に含まれていれば、それを見つけて反応してくれます。「部分一致」機能について

入力文字列が「こんにちは」の場合は,文章のどこかに「こんにちは」が含まれていればマッチしたと判断される.
内部的には,ワイルドカードを用いたマッチングをしている模様.

こんにちは
*こんにちは
こんにちは*
*こんにちは*

関連記事

5
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
4