- AIでデータ分析-データ前処理(75)-特徴選択・次元削減:低分散特徴量の削除
- 用いるデータの紹介
- Pythonで実装
- AIの活用:geminiを活用
- まとめ
AIでデータ分析-データ前処理AIでデータ分析-データ前処理(75)-特徴選択・次元削減:低分散特徴量の削除
今回はデータの前処理でよく行われるチェックリスト(75)-特徴選択・次元削減:低分散特徴量の削除 をAIを用いて行ってみたいと思います。
AIを用いることでいかに効率化できるのか、体験していただければと思います。
所要時間は10分ほどとなっています。
それでは、さっそく始めていきましょう!
データの紹介
今回用いる前処理練習用のcsvデータです。
サンプルデータはこちらから、チェックリストはこちらからダウンロードできます。
1行が1訪問を表すデータになっています。
Pythonで実装
まずはPythonで実行します。
所要時間20分でした。
AIの活用:geminiを活用
今度は同じことがAIでもできるかgeminiに依頼します。
結果を確認します。
前提となっている前処理の部分でPythonで実行した際には距離グループの列を作っていませんでしたが、AIで実行した際には距離グループの列を作っていたため、除外した列に距離グループの有無という違いはあるものの、同等の結果を得られることが確認できました。
所要時間2分でした。
まとめ
今回は前処理練習用のデータに対し、前処理チェックリスト(75)-特徴選択・次元削減:低分散特徴量の削除 をAIを用いてできるか試しました。
結果はAIで代替できることを確認することができました。
AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!
AIでデータ分析-データの前処理(75)-特徴選択・次元削減:低分散特徴量の削除 は以上となります!







