scikit-learnの使い方について、使用したものを整理する。
ロジスティック回帰
参考はこのページ。
sample
from sklearn.linear_model import LogisticRegression
#モデルの生成
clf = LogisticRegression()
#訓練データで学習 Xは説明変数のデータフレーム yは答え
clf.fit(X, y)
#学習したモデルの精度
clf.score(X,y)
#モデルの変数ごとの係数を表示
coeff_df = DataFrame([X.columns, clf.coef_[0]]).T
coeff_df
#テストデータから予測する test_dfはテストデータの説明変数のデータフレーム
clf.predict(test_df)
シリアライズ
モデルをpklファイルに出力する
sample
from sklearn.externals import joblib
joblib.dump(モデル, '〜.pkl')
pklファイルから読み込む
sample
from sklearn.externals import joblib
モデル = joblib.load('〜.pkl')