#「mercedes-benz-greener-manufacturing」の事例
https://www.kaggle.com/c/mercedes-benz-greener-manufacturing
メルセデスベンツの製造工程で、様々な車種でどのようなオプションがあるかによって検査時間がどのように変わるかを分析します。
検査時間により二酸化炭素の排出量が削減されます。
#kernel例
提出されているkernelを見てみましょう。
stacked then averaged models [~ 0.5697]
https://www.kaggle.com/hakeem/stacked-then-averaged-models-0-5697
今回のポイントは385の次元を持つデータをどのように扱うかでした。
###次元を圧縮して12次元のデータを作ります。
下記のモデルで次元を圧縮します。
PCA
ICA
GRP
SRP
###圧縮した次元を追加して、xgboostのモデルで学習します。
###結果
次元を削減しなかった場合はスコア「0.55526」
次元を削減したカラムを追加した場合は、スコア「0.56847」に少し上がりました。