- AIでデータ分析-データ前処理(51)-集計特徴量:ローリング集計特徴量の作成
- 用いるデータの紹介
- Pythonで実装
- AIの活用:geminiを活用
- まとめ
AIでデータ分析-データ前処理AIでデータ分析-データ前処理(51)-集計特徴量:ローリング集計特徴量の作成
今回はデータの前処理でよく行われるチェックリスト(51)-集計特徴量:ローリング集計特徴量の作成 をAIを用いて行ってみたいと思います。
AIを用いることでいかに効率化できるのか、体験していただければと思います。
所要時間は10分ほどとなっています。
それでは、さっそく始めていきましょう!
データの紹介
今回用いる前処理練習用のcsvデータです。
サンプルデータはこちらから、チェックリストはこちらからダウンロードできます。
1行が1訪問を表すデータになっています。
Pythonで実装
まずはPythonで実行します。
所要時間20分でした。
AIの活用:geminiを活用
今度は同じことがAIでもできるか下記のようにgeminiに依頼します。
結果を確認します。
移動平均の値が先ほどと変わっています。この違いの理由は自身でPythonで実装した際は日付ごとにエリア別の降水量をグループ化した際最初の値だけ残しそれ以外の重複を削除した上で7日移動平均を計算したのに対し
AIは日付×エリアでグループ化した際に平均値をとることで日付×エリアごとの降水量の値を1つに集約した後、7日移動平均をとっていたことにありました。
ちなみにこの後7日移動平均に用いる値について下記のように修正を依頼すると全く同じ7日移動平均の値が得られることが確認できました。
所要時間10分でした。
まとめ
今回は前処理練習用のデータに対し、前処理チェックリスト(51)-集計特徴量:ローリング集計特徴量の作成 をAIを用いてできるか試しました。
結果はAIで代替できることを確認することができました。
AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!
AIでデータ分析-データの前処理(51)-集計特徴量:ローリング集計特徴量の作成 は以上となります!








