とあるきっかけで 最近興味を持った or 面白いなと思ったAI・データ分析関連のニュース、サービスについて 調べてみる機会があり個人メモでまとめていたのだけど、せっかくなので投稿してみるという試み。
2019/4にあった、前回のAI・人工知能EXPOから、流行りを感じたもの
チャットボット
チャットボットの種類
1.選択肢タイプ
データベースに蓄積されたシナリオや、設定された回答を選択して会話するタイプです。設定されていない受け答えはできません。
2.ログタイプ
会話を行った記録をログとして蓄積し、これを利用して人間に近づけた会話を行うタイプです。ログが蓄積されることによって、より自然な会話ができるようになるため、ログが少ない場合は会話が続かなくなります。
近年では、ログ解析にAIを活用し、人間の会話により近づける試みがされています。
3.ハッシュタイプ
辞書に登録されたテンプレートを元に、会話を行うタイプです。辞書タイプと呼ばれることもありますが、範囲の限定された利用方法であれば、受け答えには問題ありません。
4.Elizaタイプ
「Yes」「No」や相づちで返答しつつ、相手の言葉を要約したり聞き返したりすることで会話するタイプです。チャットボットの原型ともいわれるElizaから名付けられており、基本的には聞き役に徹するチャットボットといえます。
所感
自身ではヤマト運輸のLINE再配達ボットを利用したことがあるが、選択肢もしくはハッシュタイプの印象。
機械学習が活用されるのは「ログタイプ」と思われるが、どのように導入していくか。
また、どのようなシーンで需要が見込まれるか?
- チャット応答の内容を継続的に改善する(モデル改善)必要がある場合
- ユーザセグメントが時間と共に変化する場合
- ???
LINE、Facebook messenger などチャットプラットフォーム上へ展開するケースにチャットのログを収集できるか?
NLP
AI人材
2019年5月18日付の日本経済新聞に載った「AI人材教育 国が認定」という見出しの記事では「AIなど」が7回繰り返されていた。
記事を読むと「AIやロボットなどの技術革新」あるいは「AIや数理、データサイエンスの分野」「AIやデータ分析」と書かれている。つまり「AIなど」の「など」にはロボット、数理、データサイエンス、データ分析が入り、さらにそれらを使ったイノベーションも含む。
一言に"AI人材" では括れない。
様々な専門家の集合知が必要になるのだから、特定領域の集中習得は必須。ただし テリトリーを広げるための努力も必要。
その他気になった技術・ニュース
オープンストリームとSBクラウド、ECサイトに画像検索を導入できるPoCサービスを開始
Google 画像検索便利だなーと思っていたが、ECシステムに組み込むの良さそう。
新製品に対応していくための定期的なモデル改善が必要になりそう
なお、Image Searchは、中国アリババグループが独自に開発した、マシンラーニング(機械学習)とディープラーニング(深層学習)技術を活用した画像検索エンジンである。中国のB2Cオンラインショッピングモール> 「天猫(Tmall)」や、CtoCマーケットプレイス「淘宝(タオバオ)」をはじめとするECサイトなどで使われている。
やっぱAlibaba すごい。
写真を撮るだけで出品できるようにする
すごい。
自社にデータもっててモデルを回せるプラットフォーマーはやっぱり強いなと。
時系列データからAI学習用の教師データを簡単に作成、富士通研究所と熊本大学が開発
教師あり学習における教師データの生成を助ける試み。
ABEJAが「BERT」を活用した新サービス「ABEJA Insight for Contact Center」を発表
従来、コンタクトセンターで用いられてきた自然言語(話し言葉や書き言葉)の処理モデルでは、画一的な対応しかできず、口語ならではの文法の揺らぎには的外れな回答をすることもあった。
そこで、2018年にブレイクスルーをもたらした「BERT(※)」のモデルをコンタクトセンターに利用することで、膨大な文書から複雑な言語表現の学習が可能になり、違和感のほとんどないやりとりが実現できると考えられるという。
※BERT(Bidirectional Encoder Representations from Transformers)
2018年秋に Google™️ がオープンソースとして公開した自然言語の意味理解に特化したモデルの名称
BERT 知らんかった。
Googleが公開した自然言語処理の最新技術、BERTとは何者なのか
BERTは何がすごいのか
BERTはこれまで用いられてきた自然言語処理タスクを解くモデルに直接接続できる、汎用的な分散表現計算機構として評価されています。
やばい。「何がすごいのか」を全く理解できんかった。
さらに調べる。
なぜ自然言語処理にとって単語の分散表現は重要なのか?
ディープな話になってきた。
単語と単語の類似度を測れる点がone-hot表現よりも優れているということらしい。
で、RNNやCNNといったニューラルネットワークで自然言語処理する際に分散表現を使ってデータをINPUTすることが多いらしい。
「AI × コールセンター」はさらに市場規模が大きくなりそう。
コールセンターの未来を変える?! AIの行方【働く人の生の声】