ばらつきを示す指標(分散や標準偏差)
-
問題提起
- ばらつき(分散と標準偏差)とは何か。
- 何に使うのか、どういうときに使うのか。
-
ばらつきの説明
- 統計学では、個々のデータの平均からの差をばらつきの指標に用いる。
-
ばらつきの図解
-
定義式
- 分散
- 分散の定義式
- $s^2=\displaystyle \frac{\displaystyle \sum_{i=1}^{n}(x_i-\bar{x})}{n}$
- $(x_i-\bar{x})$ の部分が、個々のデータと平均との差(図2の赤線の部分)。それを二乗して総和を取り、データ数で割ったものが分散。
- 特徴
- 分散は、平均との差を二乗したものからできる数値なので、スケールがデータと比べてとても大きい。
- 分散の定義式
- 標準偏差
- 定義式
- $s^2=\sqrt{\displaystyle \frac{\displaystyle \sum_{i=1}^{n}(x_i-\bar{x})}{n}}$
- 分散のルート(平方根)を取ったもの。
- 特徴
- 標準偏差のスケールは、データと同じになる。
- 例えばデータが正規分布に従う場合、平均値プラスマイナス標準偏差の範囲に、データ全体の68%が入る。
- 定義式
- その他
- 分母をnではなく(n-1)として分散や標準偏差を計算する場合もある。
- 不偏分散、標準偏差の不偏推定量などという。
- 少ないデータから全体の傾向を推測する推測統計学では、これも使用する。
- 今回は
データのばらつき
という概念を伝えることに集中するので、それには触れない。
- 分母をnではなく(n-1)として分散や標準偏差を計算する場合もある。
- 分散
-
分散や標準偏差の使いどころ
- 管理の際の指標とする。
- ばらつきの少ないデータ: いつも同じような値なので、予測や管理が容易。
- ばらつきの多いデータ: 予測がつかないので管理が難しい。
- 管理の際の指標とする。
-
分散や標準偏差の使い方の例(生産管理における例)
- 下に3つの製品(製品A, B, C)の月ごとの発注量のグラフを書く。
- ばらつきが大きい製品は、管理方法をどうするべきだろうか?
-
製品Aの発注量のグラフ
-
製品Bの発注量(売れる季節がある)
-
製品Cの発注量
-
おまけ(変動係数)
- 変動係数とは何か?
- 標準偏差を平均で割ったもの。
- スケールの異なる値を比べるときに使う。
- 例: クジラとサバのサイズのばらつきを比べる
- 上記例の変動係数
- 製品A: 0.064
- 製品B: 0.314
- 製品C: 0.312
- 定義式
- $C.V.=\displaystyle \frac{s}{\bar{x}}$
- $C.V.$ :Coefficient of Variation
- $C.V.=\displaystyle \frac{s}{\bar{x}}$
- 変動係数とは何か?