ダミー変数とは、カテゴリカル(質的)データを0又は1で表現した変数のことです
機械学習の分野ではダミー変数を用いた前処理をOne-Hotエンコーディングと呼びます
Pandasを使うと、データの統計量を表示したり、グラフ化するなど、
データ分析(データサイエンス)や機械学習で必要となる作業を簡単に行うことができるようになります
pandasのカラムをOne-Hotエンコーディングする関数の作成しました!
名前は one_hot_pd としました!
def one_hot_pd(Read_data,columns_name):
all_data_p1=Read_data
all_data_after_get_dummies_gender=pd.get_dummies(all_data_p1[columns_name])
all_data_after_get_dummies_gender.reset_index()
all_data_non_gender=all_data_p1.drop([columns_name], axis=1)
all_data_o = pd.concat([all_data_after_get_dummies_gender, all_data_non_gender], axis=1)
all_data_out_p=all_data_o.fillna(1)
df_only=all_data_out_p
return df_only