統計
初投稿です。備忘録として
間違いや指摘があれば言ってください。
##1.検定統計量
μ:母平均,σ:母標準偏差, \\
\overline{X}:標本平均,s:標本標準偏差,u:不偏標準偏差,\\
n:サンプルサイズ
###<1標本>
母平均の検定
母分散σ^2が既知
・母分散が既知の場合、母分散σを用いて、標準誤差(標本平均の標準偏差)は$σ/\sqrt{n}$
で表せる。
・標本平均を標準化したzは以下のように表され、標準正規分布に従う。
z = \frac{\overline{X}-μ}{σ/\sqrt{n}} \sim N(0,1)\\
σ/\sqrt{n}:標準誤差
<検定>有意水準5%で両側検定を行う場合、|z|>1.96の時が棄却域となる。
母分散σ^2が未知
母分散σ^2が未知の時、不偏推定量uを用いる、検定統計量t は自由度n-1のt分布に従う。
t = \frac{\overline{X}-μ}{u/\sqrt{n}} \sim t(n-1)\\
u/\sqrt{n}:標準誤差
母分散の検定
検定統計量χ^2は 自由度n-1のχ^2分布に従う。
χ^2 = \frac{(n-1)u^2}{σ^2} \sim χ^2(n-1)
母比率の検定
平均0, 分散σ^2の標準正規分布に従う
z = \frac{\hat{p}-p}{\sqrt{p(1-p)/n}} \simeq N(0,1)\\
\sqrt{p(1-p)/n}: 標準誤差
###<2標本>
母平均の差の検定
母分散σ^2が既知
d = \overline{x} -\overline{y}, δ = μ_x - μ_y\\
z = \frac{d-μ}{\sqrt{ \frac{σ_1^2}{n}+\frac{σ_2^2}{m} }} \sim N(0,1)\\
\sqrt{ \frac{σ_1^2}{n}+\frac{σ_2^2}{m} }:標準誤差
母分散σ^2が未知、等分散
母分散σ^2が未知の時、不偏推定量uを用いる、検定統計量t は自由度n-1のt分布に従う。
ここで、普遍分散$u^2$は$\frac{(S_x + S_y)}{(n_x-1)+(n_y-1)}$で求められる。
d = \overline{x} -\overline{y}, δ = μ_x - μ_y\\
t = \frac{d-μ}{\sqrt{ \frac{1}{n}+\frac{1}{m} }u} \sim N(0,1)\\
\sqrt{ \frac{1}{n}+\frac{1}{m} }u:標準誤差
###<対応のある2標本>
母平均の検定
差をとり母平均の検定に帰着させる
検定統計量t は自由度n-1のt分布に従う。
d_i = x_i - y_i\\
\overline{d}:差の平均, \hat{σ}^2:差の不偏分散\\
t = \frac{\overline{d}-δ}{\hat{σ}/\sqrt{n}} \sim t(n-1)\\
\hat{σ}/\sqrt{n}:標準誤差
母分散の比の検定
分散は正の値をとるので比の形で検定を行う
・χ_1^2 = \frac{(n-1)u_x^2}{σ_x^2} \sim χ^2(n-1)\\
・χ_2^2 = \frac{(m-1)u_y^2}{σ_y^2} \sim χ^2(n-1)\\
--------
\\
F = \frac{χ_1^2(n-1)}{χ_2^2(m-1)} = \frac{u_x^2・σ_y^2}{u_y^2・σ_x^2} \sim F(n-1, m-1)\\
等分散の場合 σ_x^2 = σ_y^2 = σ^2\\
F = \frac{χ_1^2(n-1)}{χ_2^2(m-1)} = \frac{u_x^2}{u_y^2} \sim F(n-1, m-1)\\
母比率の差の検定
差をとることで1標本の時と似た形式に、ただし標準誤差に注意!
\hat{p} = p_1 - p_2\\
z = \frac{\hat{p}-p}{\sqrt{\frac{p_1(1-p_1)}{n}+\frac{p_2(1-p_2)}{m}}} \simeq N(0,1)\\
\sqrt{\frac{p_1(1-p_1)}{n}+\frac{p_2(1-p_2)}{m}}: 標準誤差