3
Help us understand the problem. What are the problem?

More than 3 years have passed since last update.

posted at

updated at

kaggle : mercedes-benz-greener-manufacturing について

「mercedes-benz-greener-manufacturing」の事例

https://www.kaggle.com/c/mercedes-benz-greener-manufacturing
メルセデスベンツの製造工程で、様々な車種でどのようなオプションがあるかによって検査時間がどのように変わるかを分析します。
検査時間により二酸化炭素の排出量が削減されます。

kernel例

提出されているkernelを見てみましょう。

stacked then averaged models [~ 0.5697]
https://www.kaggle.com/hakeem/stacked-then-averaged-models-0-5697

今回のポイントは385の次元を持つデータをどのように扱うかでした。

次元を圧縮して12次元のデータを作ります。

下記のモデルで次元を圧縮します。
PCA
ICA
GRP
SRP

圧縮した次元を追加して、xgboostのモデルで学習します。

結果

次元を削減しなかった場合はスコア「0.55526」
次元を削減したカラムを追加した場合は、スコア「0.56847」に少し上がりました。

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Sign upLogin
3
Help us understand the problem. What are the problem?