歪度(Skewness)と尖度(Kurtosis)
歪度(Skewness) : 分布の非対称性を示す指標。値が正であると分布が右に伸びている。逆に負であると左に伸びている。
尖度(Kurtosis) : 正規分布を基準とした分布の鋭さの指標。正規分布の尖度を0と定義する場合と3と定義する場合がある。基準である正規分布の尖度よりも大きければ分布は尖っており、小さければ緩やかな分布である。
pandasで歪度(Skewness)と尖度(Kurtosis)を計算
サンプルとしてsklearnのbostonを利用
import pandas as pd
from sklearn import datasets
boston = datasets.load_boston()
df = pd.DataFrame(boston.data, columns=boston.feature_names)
var = 'DIS'
# Calculate Skewness and Kurtosis
print("Skewness :", df[var].skew())
print("Kurtosis :", df[var].kurt())
結果
Skewness : 1.0117805793009007
Kurtosis : 0.4879411222443908