LINE DEVELOPER DAY 2017に参加してきました。
LINEのクラウドAIプラットフォーム「Clova(クローバ) 」のテクノロジーについてのセッションを聞きながらまとめました。
※写真追加しました
The Technologies in Clova
概要
- LINEの新たなプラットフォーム戦略として、クラウド型AIプラットフォーム「Clova」について
- AIプラットフォームであるClovaやスマートスピーカーWAVEについて
- ビジョン、アーキテクチャについて
提携企業
History
2016年の開始から、これまでほぼ1年で開発されている。
第一弾のデバイスとして、WAVE, Smart Speaker!!
音声認識できるスピーカーで、テレビCMで発表された。
電気をつけたり消したり、音楽をかけたり、LINEのメッセージを送信したり、読み上げたりといった機能があるようだ。
WAVE
CHAMP SALLY
CHAMP BROWN
Clovaの構成
Client - Brain - Skillの3つで構成される
Clientの役割
Devices
Apps
などからのユーザインターフェース
Brainの役割
自然言語理解
音声合成
テキスト生成
など
Skillの役割
音楽再生
ニュース読み上げ
LINE送信
テレビや電気をつける
など
CIC(clova interface connect)
クライアントからの入力をClova Platformへ送信する
SDKとAPIで構成される。
認証認可の仕組み
CEK(clova extention kit)
既存のアプリなどにもAPIを提供してもらえればClovaからデータを提供することができる
Clova使用例
Exapmle 1「秋に合う音楽をかけて」
解析のながれについて
- 認証やClovaへの接続(CIC)
- 音声テキスト変換(SR)
- テキスト解析 ユーザの意図を判断する(NLU)
- 音楽の決定(CEK-Music)
- 音楽のストリーミング配信(CEK-CIC-Wave)
Example 2「この曲は何?」
- 現在再生中のタイトル、メタ情報を取得(NLU-CEK-Music)
- 文章生成(SS) Synthesize voice from reply
HARD PROBLEMS..
ぶち当たった壁について
日本語の問題
文字種が多い
Stop -> Topと誤認識
止めて -> 込めてと誤認識
日本語では、T K Hはあまり発音されない。
同音異義語
かけて->掛けて、欠けて
二時->虹、二次
発音の問題
晴一時雨 ハレイチジアメをセイ イチジ ウと読んだり。
SKILLS
現在Clovaで出来ること
Music
Weather
Chat
Fortune
Alarm
など
FUTURE OF Clova
Clovaの未来について
重要視するキーワード : GROWTH
今秋発売
WAVE, Smart Speajejr
New Devices CHAMP, Smart Speaker。LINEのサリー、ブラウンのかわいい系のスピーカー
強化したいポイント
話者認識
家族には、こんにちは
たまたまやってきた友達は、はじめまして
日時時間の認識
おはよう、こんばんはの使い分け
Happy New Yearなど
Clova x Gatebox コラボレーション
午後のセッションにて詳細
最後に、もっと大事なこと
エンジニアの皆様の力
2018年には開発できる環境を提供する予定。
会場の方、抽選で50人にWAVEをプレゼント!