さくっとできそう。
pandas_profiling
pp.ProfileReport(train)
で出てきている表がとにかくカッコいい。missingが分かりやすくてよい。
が、手元のjupyter labだと(テーマの営業か?)白黒で段組みもなく、expand-hideも効いてないのでガッカリ。
いったんhtmlに書き出してから読み込むとうまく表示されるとのことなので試してみる。
profile = pp.ProfileReport(train)
profile.to_file(outputfile="profile_report.html")
from IPython.display import HTML
HTML(filename='profile_report.html')
が、やはり黒背景には結構微妙だし、toggleも動かない・・残念。Jupyter LabはLight - Darkのテーマ切り替えがさくっと出来るから見にくいのはまあいいのだが。
で、結局は簡単にXGBとLGBMで出してブレンド、
y_pred_xgb = pd.DataFrame( XGB.predict(test_scaled))
y_pred_lgbm = pd.DataFrame(LGBM.predict(test_scaled))
y_pred=pd.DataFrame()
y_pred['SalePrice'] = 0.5 * y_pred_xgb[0] + 0.5 * y_pred_lgbm[0]
y_pred['Id'] = test['Id']
これを提出して
Your submission scored 0.13666
まあ、何もやってないに等しいからな。
前回の何で出したかわからないやつのスコアは
0.21975
だった。
以上です。
特にやらなくてもいいと思う。