機械学習

kaggle : mercedes-benz-greener-manufacturing について


「mercedes-benz-greener-manufacturing」の事例

https://www.kaggle.com/c/mercedes-benz-greener-manufacturing

メルセデスベンツの製造工程で、様々な車種でどのようなオプションがあるかによって検査時間がどのように変わるかを分析します。

検査時間により二酸化炭素の排出量が削減されます。


kernel例

提出されているkernelを見てみましょう。

stacked then averaged models [~ 0.5697]

https://www.kaggle.com/hakeem/stacked-then-averaged-models-0-5697

今回のポイントは385の次元を持つデータをどのように扱うかでした。


次元を圧縮して12次元のデータを作ります。

下記のモデルで次元を圧縮します。

PCA

ICA

GRP

SRP


圧縮した次元を追加して、xgboostのモデルで学習します。


結果

次元を削減しなかった場合はスコア「0.55526」

次元を削減したカラムを追加した場合は、スコア「0.56847」に少し上がりました。