databricksのAutoMLでモデルの最適ハイパーパラメータを探索
tryしたこと
第2回 金融データ活用チャレンジ のtrainデータをdatabricksのAutoMLで学習してもらいAUCが最大モデルのハイパーパラメータを確認する
AutoML アルゴリズム
選択できるモデルは AutoML アルゴリズム
実行結果
少し字が小さくて見えにくいかもしれないが
Run Name列の●enchanting-snail-9 をクリックすると
またfeature engineering(説明変数の前処理)も確認できる
感想
AutoMLが探索してくれたハイパーパラメータを指定したモデル(xgb_AutoML)と何も指定しないモデル(xgb)を比較した結果の性能差は一目瞭然
滅茶苦茶重宝してます
AutoMLのアルゴリズムを拡張していただけることを期待したい
(参考)
ハイパーパラメータ | 値 |
---|---|
max_depth | 6 |
min_child_weight | 5 |
learning_rate | 0.12469004141974227 |
colsample_bytree | 0.3426659786494081 |
subsample | 0.6375820909703716 |