- AIでデータ分析-データ前処理(22)②-欠損処理:分類モデルによる欠損補完
- 用いるデータの紹介
- Pythonで実装
- AIの活用:geminiを活用
- まとめ
AIでデータ分析-データ前処理AIでデータ分析-データ前処理(22)②-欠損処理:分類モデルによる欠損補完
今回はデータの前処理でよく行われるチェックリスト(22)②-欠損処理:分類モデルによる欠損補完 をAIを用いて行ってみたいと思います。
AIを用いることでいかに効率化できるのか、体験していただければと思います。
所要時間は10分ほどとなっています。
それでは、さっそく始めていきましょう!
データの紹介
今回用いる前処理練習用のcsvデータです。
サンプルデータはこちらから、チェックリストはこちらからダウンロードできます。
1行が1訪問を表すデータになっています。
Pythonで実装
まずはPythonで実行します。
"来店手段"列の欠損値を埋めるにあたり、購入点数以外の列を説明変数として、分類モデルであるRondomForestで
所要時間60分でした。
AIの活用:geminiを活用
今度はAIでやろうとするとどうなるか確認するため、下記のようにgeminiに依頼します。
結果を確認します。
所要時間5分ほどでした。
まとめ
今回は前処理練習用のデータに対し、前処理チェックリスト②-欠損処理:分類モデルによる欠損補完 をAIを用いてできるか試しました。
結果は分類モデルで欠損値を補完することはAIで代替できることを確認することができました。
AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!
AIでデータ分析-データの前処理②-欠損処理:分類モデルによる欠損補完 は以上となります!


