Kaggleで学んだことをメモしていきます。
Dicision tree
説明変数(特徴量)から、モデルを構築
モデル構築には、sklearnを使用
データは、モデル構築データとValidationデータに分けておくが、これもsklearnを使用
モデル構築後、Validationするが、予測精度が悪いことがある
これは、モデル構築データに合わせすぎたため(overfitting)
その逆を、Underfitting
MAE(Meas absolute error)をsklearnで計算し、値が一番小さいものが最適なtreeの深さ
その最適なtreeの深さを使用して、モデルを再構築
★random forestについて記載予定
参照:https://www.kaggle.com/learn/intro-to-machine-learning
sklearnの使い方は覚えられないので、実際に使用する際は検索必要そうです。
/pythonでのメモ
#dictionary作成
lista = [1,50]
dictionary = {a : a+100 for a in lista}
print(dictionary) #{1: 101, 50: 150}
#keyの取り出し
key = min(dictionary, key=dictionary.get)
print(key)#1