前回分はこちら↓↓
Chapter1 1.3 http://qiita.com/ru_pe129/items/9b024a4ac5cfa119e2fc
1.4 Recommendation Techniques
RSの役割を果たすためには、推薦するアイテムが推薦するに値する重要なアイテムであることを予測することが必要不可欠となる。つまり、RSはユーザーごとに各アイテムのユーティリティを予測する必要がある。
ここで、アイテムのユーティリティ決定モデルに関して提案された手法について説明する。今から述べる手法は一般的に協調フィルタリングに用いられている手法である。ユーザーuについてアイテムiが持つユーティリティをR(u,i)と表す。協調フィルタリングを用いたRSの基本的なタスクはR(u,i)を求めることに帰着される。つまり、あるユーザーuにはR(u,i)の大きいアイテムを推薦するということである。
もちろん、アイテムのユーティリティをRSが完全に予測することはできない。また、ユーザーのユーティリティはcontextualによって分かる場合もある。例えば、ユーザーが初心者の場合と専門家の場合では推薦アイテムが異なる。また、ユーザーが推薦を要求したタイミングや場所によってもユーザーのニーズは変化する。このような情報を推薦に用いる場合、適切な推薦はさらに難しくなる。
本書では適応分野、用いられる知識、アルゴリズムなどそれぞれが異なったいくつものRSを紹介するが、概要として以下にいくつか示す。
内容ベース:ユーザーが以前に好んだアイテムと似たアイテムを推薦を行う方法。たとえば、ユーザーが以前にコメディ映画によい評価を与えた場合、コメディ映画を推薦する
協調フィルタリング:あるユーザーと似た好みを持つユーザーがよい評価を与えたアイテムを推薦する方法。推薦システムの中ではもっとも人気かつ広く用いられている手法であると言われている。Chapter4やChapter5に記述される内容の説明が書かれてあるが、今回は省略する。
デモグラフィック:ユーザーのプロフィールなどのあらかじめ入力された情報を用いて推薦を行う方法。住んでいる地域、年齢、言語、職業など。
知識ベース:推薦を行う分野の詳細な知識を用いて推薦を行う方法。この手法では、ケースベースでの推薦となる。(ある種の特別な場合に扱う推薦手法ということだろうか…)
コミュニティベース:ユーザーの友達の好みを用いて推薦する方法。人は、類似しているが知らない人からの推薦よりも友人からの推薦を選択する傾向がある。ソーシャルネットワークの広がりによって関心が高まっている推薦方法である。推薦の精度については、協調フィルタリングと比較した場合、ケースバイケースという研究結果が出ている。たとえば、コールドスタート問題が存在するようなケースではコミュニティベースの推薦がうまくいくが、十分に情報が集まっている場合は既存の手法を上回る結果は得られていないようである。
ハイブリッドRS:複数の推薦手法を用いて互いの欠点を補うような推薦手法。
reduction-based, contextual post filtering, context modelingの3つの方法に関する違いが書かれていますが、英語力の不足により省略します…(いずれは追加します。)
1.5 Application and Evaluation
RSの研究は商用利用や実際の運用に重点を置いて実施されてきたため、RSの研究には実際の運用を含んでいることが多い。ゆえに、RSの研究には、運用、メンテナンス、機能向上の3つのステージに分かれている。
RSを構築する上で最初に考えるべきことは、RSを利用するドメインである。ドメインの大まかな区切りは以下のとおりである。
**エンターテイメント**・・・音楽や映画、IPテレビ(インターネットで見るテレビのこと?)など **E-コマース**・・・本やカメラ、パソコンなど **サービス**・・・旅行、住居の賃貸など **コンテンツ**・・・ニュースなど もちろん、RSに対する関心の高まりとともに新たな分野への応用が期待されることも容易に予想され、その場合は上記のカテゴリー分けでは網羅できないだろう。RSの開発者には、RSの対象となるドメインに対する十分な理解が必要となる。なぜなら、対象ドメインの十分な理解なくしては効果的な推薦アルゴリズムを考えることは難しいからである。RSに用いることができる情報源をしっかり分析した上でアルゴリズムを考えるべきである。
RSの運用上の問題についてさらにピックアップしていく。RSを運用していく上で忘れてはならないのは推薦の「評価」である。そして、評価についてもRSを複数のステップに切り分けて考える必要がある。システムをローンチする前であればオフラインでの評価が中心となる。例えば、推薦したアイテムの評価(アルゴリズム)、ユーザーとのインタラクションとRSの比較、複数のアルゴリズムを使って推薦結果を比較するといった評価が挙げられる。もちろん、システムがローンチされてからも評価は不可欠である。システムのローンチ後はオンラインで評価を行う。オンラインで評価を行うことが不可能もしくはリスキーである場合には、小規模のユーザーグループにタスクを振ってテストを行って評価する場合もある。
お疲れさまでした。さて、いかがだったでしょうか?
イントロダクションということもあって技術的なことは少ない分、推薦システムに興味のある経営サイドの人も読んでおいて損はない内容だと思います。Chapter1は1.8まであります。イントロダクションだけはまとめて読んだほうが良さそうなので今週中に読みきりたいです。次回もよろしくお願いいたします。