- AIでデータ分析-データの前処理:入社日と退社日から新しく在籍期間の列を作る
- 用いるデータの紹介
- Pythonで加工する
- AIの活用:ExploratoryのAIデータ加工で加工する
- まとめ
AIでデータ分析-データの前処理:入社日と退社日から新しく在籍期間の列を作る
このノートは、分析においてAIを使って何ができて何ができないかを検証するために、実際に試した結果をまとめたノートです。
今回はデータの前処理として、入社日と退社日の列から新しく在籍期間の列を作成していきたいと思います。
その際、Exploratoryを用いて、AIは2つの列情報から新しく適切な列を作ることができるのか試してみたいと思います。AIを用いることでいかに効率化できるのか、体験していただければと思います。
所要時間は10分ほどとなっています。
それでは、さっそく始めていきましょう!
データの紹介
今回検証に用いるデータのサンプルデータは従業員データです。サンプルデータはこちらからダウンロードできます。
1行が従業員1人のデータになっています。列情報としては年齢、性別、婚姻ステータス、部署、職種、給料などがあります。
まずはPythonで加工する
まずはPythonで加工します。
結果を確認します。
所要時間は10分でした。
AIの活用:ExploratoryのAIデータ加工で加工する
次に同じことをするため、Exploratoryに従業員データをアップロードし、3ステップに分けて段階的に加工します。具体的には下記3つの画像のようにプロンプトを入力→ステップとして実行を繰り返します。
結果を確認します。
結果は入社日と退社日の列から在籍期間の列を正しく作ることができました。
所要時間は2分でした。
まとめ
今回は入社日と退社日から新しく在籍期間をの列を作成するにあたり、2つの方法を試しました。
1つはPythonを用いた方法と、もう1つはExproratoryのAIデータ加工を用いた方法です。
結果は2つの日付型のデータから、AIで簡単に新しく時間差特長量を作成できることを
確認することができました。
AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!
AIでデータ分析-データの前処理:入社日と退社日から新しく在籍期間の列を作る は以上となります!