A Neural Conversational Model
どんなもの?
sequence2sequenceモデルを対話に使ったシンプルなモデルで対話を実現した。
先行研究と比べてどこがすごい?
従来の対話モデリングのアプローチは、特定のドメイン(例:飛行機のチケット予約)に対してであり、手でルールを書く必要があった。提案するsequence2sequenceモデルではend-to-endで学習を行うことができ、ルールもほとんど書く必要がない。Noisyなドメインでも検証。
技術や手法のキモはどこ?
sequence2sequenceモデルを使うことで、与えられた発話、あるいは発話履歴から次の発話を予測する。
どうやって有効だと検証した?
クローズドメインのデータセットとオープンドメインのデータセットを使って学習し、作成したモデルについて人間が評価した。
なお、データセットについてはそれぞれ以下の通り:
- クローズドメイン: IT Helpdesk Troubleshooting dataset
- オープンドメイン: movie transcript dataset
ある質問に対する答え方を既存の対話システム(CleverBot)と作成したモデルを比較することで行った。
作成したモデルでは200の質問の中97が好ましく、CleverBotは200のうち60が好ましいという結果となり、無事勝利。
議論はある?
一貫性がないのでチューリングテストを通過するのは難しそう。
Human: what is your job ?
Machine: i ’m a lawyer .
Human: what do you do ?
Machine: i ’m a doctor .