(勉強会より:論文読みレポート)
"人工知能に適当に会話させたいのだけど、言語の生成ってどのレベルまでできるの?"というのは、リアルな開発現場でもお客様が良くする質問です。
上記が米カーネギーメロン大学の先週の研究論文ですが、
コーパス(Web上の文章を巡回取得したデータベース)をGAN(生成のニューラルネットワーク)にかけて学習させた事例です。
"Controllable Text Generation"
https://arxiv.org/abs/1703.00955
途中の数式は読み飛ばした部分もあるので恐縮ですが、
アウトプットだけ見ると;
I will regret it (私は後悔するだろう=ネガティブ表現)
を
I will enjoy it(私は楽しむだろう=ポジティブ表現)
に自動言い換えできるレベルにはなって来ている事がわかります。
これは、画像生成で言うところの;
サングラスをかけていない顔画像
を
サングラスをかけている顔画像
に変換している作業に近いものがあります。
ベースデータがあり、数式に表せる様な加工フィルターがあると、目的に近いアウトプットが出せる様になって来ています。
Controllableというタイトルになっている部分もミソで、
現状自由に言語生成のアウトプットを出すと、
Microsoftのりんなちゃんの様にややシュールな不思議系会話になるので、
それを如何に実用レベルの安定管理できる技術に発展させるかが、研究領域で課題になっています。
GANは非常に熱い分野だけに、今後様々なバリエーションのデータ生成ができてくると、産業の各領域で生産性が上がるため、注目すべき技術だと思います。