t分布
t分布の理解と、その周辺知識。6つの話題を理解する。
- 目的
- t分布の統計量について
- 例題
- 歴史
- 小標本問題
-
- 第一種過誤α、第二種過誤β
1.目的
- 平均値に関する検定に使用する($\chi^2$分布は分散に関するものだった)
- 標準正規分布を仮定する(標準正規分布と照会して、帰無仮説の棄却如何を検証)
- 実験データから論じたい
2.t分布の統計量について
上記「目的」を考えると自然に導出されそう。
統計量をtとする。
t = \frac{\bar{X} - \mu}{\sqrt{s^2/n}}
- $\bar{X}$ : Xの標本平均
- $\mu$ : 母平均、または比較したい平均値や理論値
- $s^2$ : 不偏分散
- n : サンプルサイズ
「実験データの平均を標準化した」というだけの式。
分母が$\sqrt{\sigma^2}$のケースと$\sqrt{\sigma^2/n}$のケース
■1.正規分布からの観測値:$\sqrt{\sigma^2}$
$N(\mu , \sigma^2)$に従うので、これの標準化処理は
Z = \frac{X-\mu}{\sqrt{\sigma^2}}
■2.標本(サンプルサイズn)の平均値について考える場合:$\sqrt{\sigma^2/n}$
「平均」ということで、複数個の合計処理が入る、というのが肝。
平均の期待値$E[\bar{X}]$について。
E[\bar{X}] = E[\frac{1}{n}(X_1 + X_2 + X_3 + ,,,X_n)] = \frac{1}{n}(E[X_i] + E[X_2] + ... +E[X_n]) = \frac{1}{n}n\cdot E[X] = \bar{X}
平均の分散$V[\bar{X}]$について
V[\bar{X}] = V[\frac{1}{n}(X_1 + X_2 + X_3 + ,,,X_n)] = \frac{1}{n^2} (V[X_1]+V[X_2]+...+V[X_n])
各$X_i$が独立な場合、加法性より、最右辺の式は分散($σ^2$)のn個の和になる。
V[\bar{X}] = \frac{1}{n^2} (V[X_1]+V[X_2]+...+V[X_n]) = \frac{1}{n^2}\cdot nV[X] = \frac{\sigma^2}{n}
よって、サンプルサイズnの平均値に関する平均は$\bar{X}$、分散は$\frac{\sigma^2}{n}$
3.例題
イチゴの糖度を測った。バラつきを考慮して、10回測る。
糖度15度のイチゴとして販売したいが、平均値は14.8、バラつきは不偏分散が$s^2=0.06$であった。
このとき、このイチゴは糖度15度と言えるか?
平均はほぼ15、バラつきもあるので、糖度15度と言っても良い気がする。平均が14.99度だったら15度と言ってもよさそう。感覚的に、14.9ではどうか?どこに線引きする?
これをt分布を用いて客観的に判断する。
立式:t分布の統計量そのまま。$\mu$に相当するのは、検証(比較)相手である「15度」となる。
t = \frac{14.8 - 15}{\sqrt{0.06 / 10}} \approx -2.58
サンプルサイズ、n=10なので、自由度9のt分布を参照する。
これの両側5%信頼区間(片側2.5%ずつ)を見ると、$-2.26 \leq t \leq 2.26$ 、この外側が棄却域。
今回、t=-2.58なので、惜しくも糖度15度ではないことが客観的に示される。
##4. 歴史
歴史:ギネスビール社員のゴセット氏。統計的手法で研究をしていた。
当時、標準正規分布を用いた評価はできたが、実際の商品に対してこれを行おうとすると取得できるサンプル数が小さすぎて実験値が統計的に正規分布にうまく従わない。
これを、比較的少量のサンプルでも良い結果を得られるようにしたかった。
考えるのは、実験値を基にした評価。
標本平均$\bar{X}$、不偏分散(実験値から求める分散)$s^2$を用いてこれの従う分布が分かれば嬉しいと考え、研究を重ねた末、この統計量$t = \frac{\bar{X} - \mu}{\sqrt{s^2/n}}$が従う分布式を得た。
(式はwikipediaより画像貼り付け)
これにより、少ないサンプルでもその平均値の推定が高精度にできるようになった。
5.小標本問題
ゴセット氏の苦悩を実感してみる。
<苦悩>
- 標本が多ければ、標準正規分布を使用した「Z検定」で有意差に言及できる
- 標本が少ないと統計的なゆらぎの影響で、良い評価ができない
- 第一種過誤率(本当は真の集団に対して統計誤差により誤って偽の判定をする)が不当に大きくなる
標本が少ないと過誤が大きい、というのが小標本問題(のうちの一つ)。
<実験>
- 目的:標準正規分布を使用した検定と、t分布を使用した検定を比較する
- 実験:標本サイズを変化 (2〜16) させながら、擬似データを作り検定するシミュレーションを実施
- 実験:各標本サイズ条件での実験を128回繰り返す
- 条件:第一種過誤率はα=0.05に設定
- 操作:標本を生成し、それぞれp値を計算
- 結果:第一種過誤率を計算し、グラフ表示
- グラフ:標本サイズごとのαエラー率の推移をプロット
生成AIに頼むとコードを書いてくれた。結果は以下。
標準正規分布だと、標本サイズが小さいときに第一種過誤に依る誤判定がかなり大きい。
一方、t分布を使用すると安定して理論値(設定値の5%)を維持している。
ゴセット氏は「標準正規分布では小標本時に最大30%もの確率で誤った判定が下る」ことに対処しようとしてt分布が生まれた、ということか。
結果、ほぼ理論値通りの結果を得ることに成功している。
すばらしい成果。
6.第一種過誤α、第二種過誤β
余談。参考資料。
統計検定時に、その標本サイズが少ないと誤った判定を下すことがある。
その種類。
第一種過誤
本当は帰無仮説が正しいのに、それを誤って棄却してしまう誤り。
検定時、比較のもととなる分布に関する誤差。
図を作成中
ヒストグラム中の閾値について描きたい
第二種過誤
本当は帰無仮説が間違っているのに、それを誤って採択してしまう誤り。
検証時、検証したい分布側に関する誤差
図を作成中
2つのヒストグラムの推移を描きたい
正確性に欠けるが、再確認時に整理する為の表を作成。
種類 | 検定の元となる分布に関連? | 検定データの分布に関連? |
---|---|---|
第一種過誤 | 〇 (検定の閾値設定による影響) | △ (データのばらつきによる影響) |
第二種過誤 | △ (検定の閾値設定の影響は少ない) | 〇 (データの真の分布の影響が大きい) |