LoginSignup
0
0

More than 1 year has passed since last update.

pandasのカラムをOne-Hotエンコーディングする関数の作成

Posted at

ダミー変数とは、カテゴリカル(質的)データを0又は1で表現した変数のことです
機械学習の分野ではダミー変数を用いた前処理をOne-Hotエンコーディングと呼びます

Pandasを使うと、データの統計量を表示したり、グラフ化するなど、
データ分析(データサイエンス)や機械学習で必要となる作業を簡単に行うことができるようになります

pandasのカラムをOne-Hotエンコーディングする関数の作成しました!

名前は one_hot_pd としました!

    def one_hot_pd(Read_data,columns_name):
        all_data_p1=Read_data
        all_data_after_get_dummies_gender=pd.get_dummies(all_data_p1[columns_name])
        all_data_after_get_dummies_gender.reset_index()
        all_data_non_gender=all_data_p1.drop([columns_name], axis=1)
        all_data_o = pd.concat([all_data_after_get_dummies_gender, all_data_non_gender], axis=1)
        all_data_out_p=all_data_o.fillna(1)
        df_only=all_data_out_p
        return df_only
0
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0