学習のポイント
解説動画
統計量 の定義:
統計量とは、未知のパラメータの値によらない、標本 $X_1, X_2, ..., X_n$ のみの関数である。
解説
標本平均は統計量である
標本平均 $\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i$ について、以下が成立します。
- $\bar{X}$ は、標本 $X_1, X_2, ..., X_n$ の関数です。
- $\bar{X}$ の定義式には、未知のパラメータ (例えば母平均 μ) は含まれていません。 $\bar{X}$ は、標本 $X_1, ..., X_n$ と定数 $\frac{1}{n}$ のみで計算できます。
よって、標本平均は、定義を満たすため、統計量です。
標本分散は統計量である
標本分散$S = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2$について、以下が成立します。
- 標本分散 $S$ は、標本 $X_1, X_2, ..., X_n$ を用いて計算される関数です。
- 標本分散 $S$ の定義式には、未知の母数 (例えば母分散 $\sigma^2$ や母平均 μ) は一切含まれていません。母分散 $\sigma^2$ や母平均 μ の値を知らなくても、標本データがあれば $S$ を計算できます。
よって、標本分散 $S$ は統計量である と言えます。
未知のパラメータが式に含まれる場合は、統計量ではない
式 $\frac{1}{n} \sum_{i=1}^n (X_i - μ)^2$ について、μ が未知のパラメータである場合を考えると、
-
式 $\frac{1}{n} \sum_{i=1}^n (X_i - μ)^2$ は、標本 $X_1, X_2, ..., X_n$ の関数です。
-
式の中に、未知のパラメータ μ が含まれています。未知の値である $μ$ を用いて計算される $\frac{1}{n}\sum_{i=1}^n (X_i - μ)^2$ は、標本データだけから計算できる値ではなく、統計量の定義を満たしません。
よって、式 $\frac{1}{n} \sum_{i=1}^n (X_i - μ)^2$ は統計量でない と言えます。
最小値は統計量である
標本 $X_1, X_2, ..., X_n$ が与えられたとき、最小値は、これらの標本の中で最も小さい値のことです。数式で表すと、$X_{(1)}$ となります。
-
最小値は、標本 $X_1, X_2, ..., X_n$ から、一つの数値を出力する関数として表現でき、関数の形は $f(X_1, X_2, ..., X_n) = \min(X_1, X_2, ..., X_n)$ です。
-
最小値を求める操作は、母集団のパラメータ (例えば母平均 μ、母分散 $\sigma^2$ など) に依存しません。標本データ $X_1, X_2, ..., X_n$ さえあれば、その中で最も小さい値を特定することができます。
よって、最小値は統計量である と言えます。
最大値は統計量である
最小値が統計量であることと同様に最大値も統計量です。
nが奇数のときの中央値は統計量である
標本 $X_1, X_2, ..., X_n$ が与えられたとします。標本を小さい順に並べ替え、それらを$X_{(1)}, X_{(2)}, ..., X_{(n)}$ と表します。ここで、$X_{(1)}$ が最小値、$X_{(n)}$ が最大値です。$n$ が奇数の場合、 中央値は、$\frac{n+1}{2}$ 番目の $X_{(\frac{n+1}{2})}$ です。
- $X_{(\frac{n+1}{2})}$ は、標本 $X_1, X_2, ..., X_n$ から一意に決定される値であり、標本の関数と言えます。
- $X_{(\frac{n+1}{2})}$ の定義式には、未知の母数 (母平均 μ、母分散 $\sigma^2$ など) は含まれていません。 標本データ $X_1, X_2, ..., X_n$ を並べ替えるという操作だけで、$X_{(\frac{n+1}{2})}$ を求めることができます。
よって、$X_{(\frac{n+1}{2})}$ は統計量です。