協調フィルタリングのユーザベースとアイテムベースって誤解されやすいと思ってて、実際誤解してた。
【概略】
ユーザベース: 似てるユーザーをレコメンド
アイテムベース: 似てるアイテムをレコメンド
【誤解してたこと】
ユーザベース:
年齢やアクセス記録を
機械学習に食わせた時の類似度を見る
アイテムベース:
タイトル、タグ情報、売れ具合などアイテムに閉じた情報を
機械学習に食わせた時の類似度を見る
【正しくは】
ユーザベース:
ユーザがあるアイテムに対して起こしたアクションを
機械学習に食わせて、
どういうタイプのアイテムが好きかという傾向の類似度を見る
アイテムベース
アイテムに関わったユーザ群を
機械学習に食わせて
どういうひとに好かれやすいかという傾向の類似度を見る