はじめに
今回は統計検定2級の範囲の歪度と尖度に関して学んでいきます!
📊 データの形を読み解く:歪度と尖度の完全ガイド
統計学やデータ分析を学ぶ中で、「平均」や「標準偏差」だけでは分布の全体像がつかめないと感じたことはありませんか?
そんなときに役立つのが、「歪度(Skewness)」と「尖度(Kurtosis)」という2つの指標です。
🌀 歪度(Skewness)とは?
データの**左右の偏り(非対称性)**を数値で表す指標です。
🔢 定義(数式)
$$
\text{歪度} = \frac{E[(X - \mu)^3]}{\sigma^3}
$$
- $\mu$:平均
- $\sigma$:標準偏差
- 分子の $(X - \mu)^3$:分布の3乗モーメント → 対称性に敏感
🧠 イメージで理解
歪度 | 分布の形 | 特徴例 |
---|---|---|
> 0 | 右に尾が長い | 高い値が一部に存在(例:年収分布) |
= 0 | 左右対称 | 正規分布など |
< 0 | 左に尾が長い | 小さい値に外れ値(例:難問のテスト) |
🧩 歪度はなぜ使う?
- 中央値と平均のズレを把握できる(歪度 > 0 → 中央値 < 平均)
- 正規性のチェック・外れ値の方向の把握に使える
- 機械学習の前処理(対数変換など)の判断材料にも◎
🔺 尖度(Kurtosis)とは?
分布の**山のとがり具合と、端の重さ(外れ値の出やすさ)**を表す指標です。
🔢 定義(過剰尖度)
$$
\text{尖度} = \frac{E[(X - \mu)^4]}{\sigma^4} - 3
$$
- 4乗モーメントを使うため、外れ値に非常に敏感
- 「−3」は正規分布を基準として尖度 = 0とするための調整値
🧠 イメージで理解
尖度 | 分布の形 | 特徴例 |
---|---|---|
> 0 | 山が尖って尾が重い | 外れ値が出やすい(例:t分布) |
= 0 | 標準的な尖り具合 | 正規分布など |
< 0 | 平らで尾が軽い | 一様分布など、外れ値が出にくい |
🧩 尖度はなぜ使う?
- 外れ値の出やすさを数値で把握できる
- リスク評価(金融)、異常検知、品質管理で有用
- 正規性からの逸脱の検出にも役立つ
🎯 歪度と尖度を同時に見るとわかること
分布の特徴 | 歪度 | 尖度 | 例 |
---|---|---|---|
高収入者が一部いる | > 0 | > 0 | 年収分布、株価リターン |
点数が低い人が多い難問 | < 0 | > 0 | テストの成績 |
平らで均一な分布 | = 0 | < 0 | 一様分布 |
正規分布とほぼ同じ | = 0 | = 0 | 標準正規分布 |