Kaggle - Outbrain Click Prediction1の13位解法2の調査記事です.
Name: ololo
Kaggle Discussion: https://www.kaggle.com/c/outbrain-click-prediction/discussion/27897
Writeup: http://www.csie.ntu.edu.tw/~r01922136/kaggle-2014-criteo.pdf
Code: https://github.com/alexeygrigorev/outbrain-click-prediction-kaggle
- 下記特徴量をSVMやFTRLで予測
- イベント関連: user id, document id, platform id, day, hour, geo
- 広告関連: ad document id, campaign, advertizer id
- 特徴量の平均でのXGBoostやETでの予測
- すべてのカテゴリ特徴量
- 出版社やsource, 上位カテゴリ, トピックやentityといった文書の特徴量
- これらの特徴量の相互関係
- 広告文書とページでのコサイン類似度
- 下記特徴量のFFM
- 文書類似度,文書カテゴリ,トピックやentityを除くカテゴリ特徴量
- XGBoostの葉(cf.3)
- 最終的にXGBoostで結合
References
-
Kaggle, Outbrain Click Prediction, 2017. ↩
-
ololo, Congrats and Solution Sharing ↩
-
Juan, et al., 3 Idiots’ Approach for Display Advertising Challenge ↩