0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AIでデータ分析-データ前処理(41)-Box-Cox/Yeo-Johnson変換

Posted at
  • AIでデータ分析-データ前処理(41)-Box-Cox/Yeo-Johnson変換
  • 用いるデータの紹介
  • Pythonで実装
  • AIの活用:geminiを活用
  • まとめ

AIでデータ分析-Box-Cox:Yeo-Johnson変換.png

AIでデータ分析-データ前処理AIでデータ分析-データ前処理(41)-Box-Cox/Yeo-Johnson変換

今回はデータの前処理でよく行われるチェックリスト(41)-Box-Cox/Yeo-Johnson変換 をAIを用いて行ってみたいと思います。

AIを用いることでいかに効率化できるのか、体験していただければと思います。

所要時間は10分ほどとなっています。

それでは、さっそく始めていきましょう!

データの紹介

今回用いる前処理練習用のcsvデータです。

サンプルデータはこちらから、チェックリストはこちらからダウンロードできます。

1行が1訪問を表すデータになっています。

スクリーンショット 2025-11-26 1.00.25.png

image.png

スクリーンショット 2026-01-06 21.24.39.png

Pythonで実装

まずはBox-Cox変換をPythonで実行します。

Box-Cox変換は変換前のデータとして0以上を値を前提としているため、データが0以上という条件を満たす購入金額列に対して変換を行います。

変換前の購入金額列の分布を確認します。

スクリーンショット 2026-01-06 21.27.41.png

Box-Cox変換を行います。

スクリーンショット 2026-01-06 21.29.24.png

分布の形状と歪度の値(-0.06で絶対値が1未満)を見ても正規分布に近づいたことが確認できました。

所要時間5分でした。

次にデータがマイナスや0を含んでいる際に分布を正規分布に近づけるYeo-Johnson変換を-の値はありませんが、0を含む"滞在時間_秒"列に適応します。

まずは"滞在時間_秒"列の変換前の分布を確認します。

スクリーンショット 2026-01-06 21.40.26.png

Yeo-Johnson変換を行います。

スクリーンショット 2026-01-06 21.42.15.png

AIの活用:geminiを活用

今度は同じことがAIでもできるか下記のようにgeminiに依頼します。

スクリーンショット 2026-01-06 21.46.23.png

結果を確認します。

スクリーンショット 2026-01-06 21.47.26.png

図で分布が可視化されていませんが、歪度が-0.06で同じのため、同じ結果を得られていそうです。

次に"滞在時間_秒"列にYeo-Johnson変換も確認します。
スクリーンショット 2026-01-06 21.55.35.png

スクリーンショット 2026-01-06 21.50.24.png

歪度が0.11で同じ結果を得られることが確認できました。

所要時間1分でした。

まとめ

今回は前処理練習用のデータに対し、前処理チェックリスト(41)-Box-Cox/Yeo-Johnson変換 をAIを用いてできるか試しました。

結果はAIで代替できないことを確認することができました。

AIでできることとできないことを把握し、うまく活用することで、データ分析もかなり効率化できそうですね!

AIでデータ分析-データの前処理(41)-Box-Cox/Yeo-Johnson変換 は以上となります!

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?