formulaでダミー変数化したいとき
必要なモジュールを呼び出します
.py
import pandas as pd
import patsy
サンプルのデータフレームを準備します
a, b, x1, x2の列をダミー変数化します。
(カテゴリカルな列のみ展開されます)
dmatrix("formulaでどのカラムを展開するか指定", 展開前のデータフレーム名)
でダミー変数化を行うことができます。
return_type="dataframe" の指定をすることで、
展開後のデータをデータフレームの形にしておくことができます。
その他
詳しく知りたい方はこちら