モチベーション
新聞に対するポジティブな意見
- いろいろな情報が集まっており非常に有用
- 毎日更新されており新しい情報を仕入れることができる
新聞に対するネガティブな意見
- 自分から能動的に読みに行く必要がある (Pull 型)
- ニュース量が膨大で自分が読みたい記事を探しづらい
作ったもの
Slack 上の会話から、興味ありそうなニュースをつぶやいてくれる Hubot。
機能
Hubot を用いて対話的機能と定期通知機能を作成。
対話コマンド
- maki news => 過去の自分の発言と最も関連があるニュースを教えてくれる
- maki news TEXT => 入力したテキストと最も関連があるニュースを教えてくれる
定期配信
- チャットルームの発言最新N件と最も関連があるニュースをCronで定期配信
構成
- 学習: ニュース記事 => 特徴ベクトル化
- 適用: チャット過去ログ => 類義語追加 => 特徴ベクトル化 => モデルに対して類似文書検索
類義語追加
問題点: 学習データに無い単語から推薦ができない
ニュースサイトのニュースタイトルを 3 年分スクレイピングし、word2vec で学習、類似語を列挙可能にした。
特徴
Jubatus の強み
- オンライン学習
- ニュース記事が配信されるたびに学習
- スクレイピング -> モデル更新
- ニュース記事が配信されるたびに学習
読売新聞データの活用
- Pull 型ニュースから Push 型ニュースへ
新規性
- 過去の発言から類語を作って (word2vec) 直接つぶやいてなくても興味ありそうなニュースが拾える
- チャット常駐push型ニュースである
- オススメニュース配信アプリ => 別アプリ開かないといけない、めんどくさい
- チャット => 毎日見てる、気軽
- チャット常駐push型ニュースである