0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AIでデータ分析-データ前処理(51)-集計特徴量:ローリング集計特徴量の作成

Posted at
  • AIでデータ分析-データ前処理(51)-集計特徴量:ローリング集計特徴量の作成
  • 用いるデータの紹介
  • Pythonで実装
  • AIの活用:geminiを活用
  • まとめ

AIでデータ分析- ローリング集計特徴量の作成.png

AIでデータ分析-データ前処理AIでデータ分析-データ前処理(51)-集計特徴量:ローリング集計特徴量の作成

今回はデータの前処理でよく行われるチェックリスト(51)-集計特徴量:ローリング集計特徴量の作成 をAIを用いて行ってみたいと思います。

AIを用いることでいかに効率化できるのか、体験していただければと思います。

所要時間は10分ほどとなっています。

それでは、さっそく始めていきましょう!

データの紹介

今回用いる前処理練習用のcsvデータです。

サンプルデータはこちらから、チェックリストはこちらからダウンロードできます。

1行が1訪問を表すデータになっています。

スクリーンショット 2025-11-26 1.00.25.png

image.png

スクリーンショット 2026-01-13 22.47.40.png

Pythonで実装

まずはPythonで実行します。

スクリーンショット 2026-01-14 0.57.55.png

所要時間20分でした。

AIの活用:geminiを活用

今度は同じことがAIでもできるか下記のようにgeminiに依頼します。

スクリーンショット 2026-01-14 1.28.04.png

結果を確認します。

スクリーンショット 2026-01-14 1.32.30.png

移動平均の値が先ほどと変わっています。この違いの理由は自身でPythonで実装した際は日付ごとにエリア別の降水量をグループ化した際最初の値だけ残しそれ以外の重複を削除した上で7日移動平均を計算したのに対し

AIは日付×エリアでグループ化した際に平均値をとることで日付×エリアごとの降水量の値を1つに集約した後、7日移動平均をとっていたことにありました。

ちなみにこの後7日移動平均に用いる値について下記のように修正を依頼すると全く同じ7日移動平均の値が得られることが確認できました。

スクリーンショット 2026-01-14 1.36.22.png

スクリーンショット 2026-01-14 1.35.43.png

所要時間10分でした。

まとめ

今回は前処理練習用のデータに対し、前処理チェックリスト(51)-集計特徴量:ローリング集計特徴量の作成 をAIを用いてできるか試しました。

結果はAIで代替できることを確認することができました。

AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!

AIでデータ分析-データの前処理(51)-集計特徴量:ローリング集計特徴量の作成 は以上となります!

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?