- AIでデータ分析-データ前処理(40)-変換:対数変換
- 用いるデータの紹介
- Pythonで実装
- AIの活用:geminiを活用
- まとめ
AIでデータ分析-データ前処理AIでデータ分析-データ前処理(40)-変換:対数変換
今回はデータの前処理でよく行われるチェックリスト(40)-変換:対数変換 をAIを用いて行ってみたいと思います。
AIを用いることでいかに効率化できるのか、体験していただければと思います。
所要時間は10分ほどとなっています。
それでは、さっそく始めていきましょう!
データの紹介
今回用いる前処理練習用のcsvデータです。
サンプルデータはこちらから、チェックリストはこちらからダウンロードできます。
1行が1訪問を表すデータになっています。
Pythonで実装
まずはPythonで実行します。
所要時間90分でした。
AIの活用:geminiを活用
今度は同じことがAIでもできるか下記のようにgeminiに依頼します。
結果を確認します。
Winsorizeで下位5%を一律に切り上げてしまっているため、滞在時間の短い人の情報が失われてしまっています。また上限には95パーセンタイルの値が用いられていますが、観測ノイズではない長時間滞在と考えられる層も変換してしまっているため、情報の損失が多いように感じます。
所要時間5分でした。
まとめ
今回は前処理練習用のデータに対し、前処理チェックリスト(40)-変換:対数変換 をAIを用いてできるか試しました。
結果はパラメータの設定まで行わないとまだAIで代替できないことを確認することができました。
AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!
AIでデータ分析-データの前処理(40)-変換:対数変換 は以上となります!













