- AIでデータ分析-ダミー変数化:職種の列をダミー変数化する
- 用いるデータの紹介
- まずはPythonでダミー変数化する
- AIの活用:ChatGPTでダミー変数化する
- まとめ
AIでデータ分析-ダミー変数化:統計モデル(回帰分析など)を活用するための前処理として、職種の列をダミー変数化する
このノートは、分析においてAIを使って何ができて何ができないかを検証するために、実際に試した結果をまとめたノートです。
今回はデータセットの職種列をダミー変数化していきたいと思います。
その際、AIで正しくダミー変数化を実行できるのか試してみたいと思います。AIを用いることでいかに効率化できるのか、体験していただければと思います。
所要時間は10分ほどとなっています。
それでは、さっそく始めていきましょう!
データの紹介
今回検証に用いるデータのサンプルデータは従業員データです。サンプルデータはこちらからダウンロードできます。
1行が従業員1人のデータになっています。列情報としては年齢、性別、婚姻ステータス、部署、職種、給料などがあります。
まずはPythonでダミー変数化を実行する
まずダミー変数化する前のデータの状況を確認します。
職種はまとめられていることが確認できます。
次に職種の列に対しPythonでダミー変数化し,結果を確認します。
職種の列がダミー変数化されていることが確認できます。
所要時間は3分でした。
AIの活用:ChatGPTでダミー変数化を実行する
次にAIを使って同じことをするため、chatGPTに従業員データをアップロードし、「添付のデータを使って職種の列をダミー変数化し、csvデータではき出して」と入力し、実行します。
出力されたcsvデータを確認します。
正しくダミー変数化できていることが確認できました。
所要時間は1分でした。
まとめ
今回はダミー変数化を2つの方法で調べました。
1つはPythonで実行する方法と、もう1つはchatGPTを用いる方法です。
結果はいずれも同じ結果を得ることができ、AIはダミー変数化を正しく実行することができることを
確認することができました。
AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!
AIでデータ分析-ダミー変数化:統計モデル(回帰分析など)を活用するための前処理として、職種の列をダミー変数化する は以上となります!