以下の統計検定2級対策動画で用いられているスライドの一部です。
変動係数 とは?
~平均や単位が違うデータの「ばらつき」を比べる方法~
どちらの売上が、より安定的?
ある商店街に、カフェAとレストランBがあります。
売上データは以下の通りです。
| 店舗 | 平均売上 | 標準偏差 |
|---|---|---|
| カフェA | 50,000 円 | 10,000 円 |
| レストランB | 200,000 円 | 30,000 円 |
「相対的に」 安定している (ばらつきが小さい) のはどちらの店舗でしょうか?
1. まずは単純に比較してみる
標準偏差 (データのばらつきを示す指標)だけを見ると…
- カフェAの標準偏差: 10,000 円
- レストランBの標準偏差: 30,000 円
レストランBの方が、標準偏差の値は大きいです。
これだけ見ると、「レストランBの方が売上の変動が大きい」と考えてしまいそうです。
…でも、それでいいんだっけ?
待ってください!
両店舗は、 売上の規模 (平均値)が全く違います。
-
売上規模が大きいレストランBの標準偏差が、カフェAより大きくなるのは自然なことかもしれません。
-
そこで、 平均値に対する相対的なばらつき を見る必要があります。
そこで登場するのが「変動係数」
変動係数 は、平均値の大きさを考慮して「相対的なばらつき」を比較するための指標です。
早速、各店舗の変動係数を計算してみましょう。
-
カフェAの変動係数
$$
\frac{10,000 \text{ (標準偏差)}}{50,000 \text{ (平均値)}} = 0.2
$$
各店舗の変動係数を計算
-
カフェAの変動係数
$$
\frac{10,000}{50,000} = 0.2
$$ -
レストランBの変動係数
$$
\frac{30,000}{200,000} = 0.15
$$
結論:相対的に安定しているのは?
変動係数を比較します。
- カフェAの変動係数: 0.2
- レストランBの変動係数: 0.15
0.2 > 0.15 なので、カフェAの方が変動係数は大きい結果となりました。
これは、 平均売上に対して相対的に見ると、カフェAの方が日々の売上のばらつきが大きい ことを意味します。
結論: レストランB の方が、相対的に安定した売上を上げています。
変動係数の比較グラフ
変動係数のもう一つの強み
変動係数は、 単位が異なるデータ のばらつきを比較する際にも役立ちます。
例:身長(cm)と体重(kg)のばらつきは、どちらが大きい?
- 標準偏差は単位(cm, kg)を持つため、直接比較できません。
- 変動係数は、標準偏差を平均値で割るため、単位が打ち消される 「無次元数」 となります。
これにより、単位が全く異なるデータセットでも、ばらつきの度合いを公平に比較できます。
まとめ:変動係数の定義
ここまでの内容を一般化すると、次のように定義できます。
変動係数
平均値に対する標準偏差の相対的な大きさを示す指標
-
変動係数が大きい
平均値に対して、データのばらつきが大きい -
変動係数が小さい
平均値に対して、データのばらつきが小さい
まとめ:変動係数の公式
変動係数の計算式は非常にシンプルです。
$$
\text{変動係数} = \frac{\text{標準偏差}}{\text{平均値}}
$$
統計学の記号で表すと、以下のようになります。
($s$ は標本標準偏差、 $\bar{x}$ は標本平均)
$$
CV = \frac{s}{\bar{x}}
$$
使用上の注意点
変動係数は便利ですが、使う際に注意すべき点があります。
-
平均値が0に近いデータには注意
- 平均値で割り算をするため、平均値が0に近いと変動係数が極端に大きくなり、解釈が難しくなります。
-
負の値を含むデータ
- 利益や気温の変化量など、データが負の値を取りうる場合、平均値が負になる可能性があります。その場合の変動係数の解釈は一般的ではありません。
✅ 基本的には、 全てのデータが正の値 を取り、 平均値が0から十分離れている データセットに使うのが安全です。
本日のまとめ
- 変動係数 は、平均値に対する相対的なばらつきを見る指標です。
- 計算式は 「標準偏差 ÷ 平均値」 です。
- 単位が違うデータ や 平均値が大きく違うデータ のばらつきを公平に比較できます。
- 平均値が0に近いデータに使う際は解釈に注意が必要です。
標準偏差とあわせて使いこなし、データ分析の幅を広げましょう!
