モチベーション
新聞に対するポジティブな意見
- いろいろな情報が集まっており非常に有用
- 毎日更新されており新しい情報を仕入れることができる
新聞に対するネガティブな意見
- 自分から能動的に読みに行く必要がある(Pull型)
- ニュース量が膨大で自分が読みたい記事を探しづらい
作ったもの
Slack上の会話から、興味ありそうなニュースをつぶやいてくれるHubot
機能
Hubot を用いて対話的機能と定期通知機能を作成。
コマンド
- maki news => 過去の自分の発言と最も関連があるニュースを教えてくれる
- maki news TEXT => 入力したテキストと最も関連があるニュースを教えてくれる
定期配信
- チャットルームの発言最新N件と最も関連があるニュースをCronで定期配信
構成
- 学習:ニュース記事 -> 特徴ベクトル化
- 適用:チャット過去ログ -> 類義語追加 -> 特徴ベクトル化 -> モデルに対して類似文書検索
類義語追加
問題点: 学習データに無い単語から推薦ができない
IT Media のニュースタイトルを 3 年分スクレイピングし、word2vec で学習、類似語を列挙可能にした。
特徴
Jubatusの強み
- オンライン学習
- ニュース記事が配信されるたびに学習
- スクレイピング -> モデル更新
- ニュース記事が配信されるたびに学習
読売新聞データの活用
- pull型からpush型ニュースへ
新規性
- 過去の発言から類語を作って(word2vec)直接つぶやいてなくても興味ありそうなニュースが拾える
- チャット常駐push型ニュースである
- オススメニュース配信アプリ => 別アプリ開かないといけない、めんどくさい
- チャット => 毎日見てる、気軽
- チャット常駐push型ニュースである