大前提
※私なりの理解です。
間違っている場合、ご指摘いただけると幸いです。
目的
標本誤差が σ/√n という式で計算できることを理解する。
詰まった個所
中心極限定理の理解において、詰まった。
・サンプルサイズのnが大きい場合に標本平均の分布が正規分布に近似する。
⇒サンプルサイズnで標本を抜き出し、標本平均を計算するという作業を繰り返す。
算出した標本平均を集めると分布が正規分布に近似することを示す。
上記は理解。
この際、この分布は平均値:μ(母集団平均)、標準偏差:σ/√n となる。
⇒ 標準偏差が σ/√n となる理由がわからなかった。
1.分散(離散型確率変数)
そもそも分散の算出は 確率変数の値 - 平均値(期待値)の2乗 × 確率 を確率変数の数だけ
すべて足し合わせたものとなる。
離散型確率変数「X」の分散は以下式
V(X) = Σ(xi - E(X))^2pi [1..n]
この場合、E(X)は母集団の平均値(μ)と同じになる。
サイコロの出目で例えると、条件は以下
・xi(確率変数の値):{1,2,3,4,5,6}
・E(X)(平均値・期待値):1/6(1+2+3+4+5+6) = 3.5
・pi(確率):1/6(正しく均等に目が出る前提)
分散を算出は次の通りになる。
(1-3.5)^2/6+(2-3.5)^2/6+(3-3.5)^2/6+(4-3.5)^2/6+(5-3.5)^2/6+(6-3.5)^2/6
= 1/6{6.25+2.25+0.25+0.25+2.25+6.25}
= 17.5/6
2.分散の4性質
(1) V(C)=0
定数の分散は0になる。
(2) V(X+C)=V(X)
確率変数に定数を足した場合の分散は、元の確率変数の分散に等しくなる。
(3) V(kX)=k^2V(X)
確率変数を定数倍したものの分散は、元の確率変数の分散を定数の2乗倍したものになる。
本件において、もっとも重要な性質。
サイコロの出目で例えると、次の通りに証明できる。
(1×2-3.5×2)^2/6+(2×2-3.5×2)^2/6+(3×2-3.5×2)^2/6+(4×2-3.5×2)^2/6+(5×2-3.5×2)^2/6+(6×2-3.5×2)^2/6
= 1/6{25+9+1+1+9+25}
= 70/6
= 17.5/6×2^2
(4) V(X+Y)=V(X)+V(Y)(XとYが独立である場合)
独立な確率変数について、確率変数の和の分散は、それぞれの確率変数の分散の和に等しくなる。
3.標本誤差の証明
サンプル xi はそれぞれ独立に標本誤差が σ の分布に従うので、標本平均の分散は次のとおりである。
V(1/n{X1+...+Xn})
= 1/n^2(V(X1)+...V(Xn))
= nσ^2/n^2 ・・・分散(標本誤差^2)をn回行う⇒nσ^2
= σ^2/n
= σ/√n
参考
https://mathwords.net/hyouzyungosa
https://bellcurve.jp/statistics/course/6716.html
https://bellcurve.jp/statistics/course/6718.html