概要
IR Reading 2021春を聴講したので、感想を投稿する。
印象に残った論文まとめ
-
An Efficient Neighborhood-based Interaction Model for Recommendation on Heterogeneous Graph (KDD 2020)
graphを使った手法。負例は要らない? -
S^{3}-Rec: Self-Supervised Learning for Sequential Recommendation with Mutual Information Maximization (CIKM 2020)
属性データを融合させる。属性、コンテキストを両方とも利用可能。 -
CEQE: Contextualized Embeddings for Query Expansion (EMNLP 2020)
BERTを使って、QEしたら、他のQEと比べて良い結果に。ベースラインはBM25。Relavance Modelも参照。 -
Online Experimentation with Surrogate Metrics: Guidelines and a Case Study (WSDM 2021)
時間がかかる指標の代わりにモニタリングする指標を作る。例えば、リテンションを最適化したいが、リテンションの測定には時間がかかる。だが、評価は素早く行いたい。ここで代替の指標をすぐにすぐに得られる指標を使って行いたい。これを許容できる範囲でやる方法。 -
PROP: Pre-training with Representative Words Prediction for Ad-hoc Retrieval(WSDM2021)
IRだとNLPのpre-trained modelの問題設定とちがうのでは?-> IRに適合したpretrained objectiveを作りました。 -
Generative Models are Unsupervised Predictors of Page Quality: A Colossal-Scale Study (WSDM 2021)
NLPの生成モデルにより自動生成されたページと人手で生成されたページを見分けるモデルはそのままページのクオリティを推定するモデルとしてそのまま利用できる。教師データ不要で質の判定が可能。 -
Interpretable Ranking with Generalized Additive Models (WSDM 2021)
説明可能性をすごい感じた。このシンプルさで結果が出るなら、こういうモデルがいい! 使ってみたいと思えた。 -
Popularity-Opportunity Bias in Collaborative Filtering (WSDM 2021)
セレンディピティを出すための一つの工夫として、相関係数をロスに混ぜ込むという手法。実サービスで使うなら、ヘビーユーザーに対して適用とかがいいのかも。 -
Denoising Implicit Feedback for Recommendation (WSDM 2021)
クリックデータから、あんまり興味なさそうなクリックデータを取り除くと、精度が良くなった。閲覧時間等が取れるのであれば、データの質を向上させられる。 -
Density Ratio-based Personalised Recommendation from Implicit Feedback (TheWebConf 2021)
pair-wiseより高速なpoint-wiseを性能を良くするように改良してやってみたという研究。