Kaggle - Instacart Market Basket Analysis1の1位解法2の調査記事です.
Title: 12th solution
Name: plantsgo
Kaggle Discussion: https://www.kaggle.com/c/instacart-market-basket-analysis/discussion/38110
Code: https://github.com/plantsgo/Instacart-Market-Basket-Analysis/tree/master
モデル
- ユーザーがどの商品を買うか
- 次の注文があるかどうか
特徴量
- 製品の特徴量
- 通路の特徴量
- 部門の特徴量
- 注文順からなる特徴量
- ユーザーの特徴量
- ユーザー x 注文順からなる特徴量
- ユーザー x 製品の特徴量
- ユーザー x Aisleの特徴量
- ユーザー x 部門の特徴量
データ
- 訓練データとして直前の注文も追加.(2回前も追加してみたが,改善は見られなかった)
アンサンブル
all["label"] = 0.28 * all["prediction_arbor"] + 0.12 * all["prediction_lgbm"] + 0.36 * all["label_2"] + 0.24 * all["label_1"]
- arbor: arboretum3
- lgbm: LightGBM
- label1: ユーザーごとに分けて学習
- label2: 全てシャッフルして学習
備考
- FaronのF1最適化4を利用.
Refererences
-
Kaggle, Instacart Market Basket Analysis ↩
-
plantsgo, 12th solution ↩
-
Faron, Get Expected F1-Score in O(n²) ↩