#まとめ
- 一つの正規母集団
- 母平均を推定
- 母分散が不明($t(n-1)$)
$\mathrm{P}\left(\bar{X}-[t_{\alpha/2}(n-1)]\cdot \sqrt{s/n}\leq\mu\leq \bar{X}+[t_{\alpha/2}(n-1)]\cdot \sqrt{s/n}\right)$ - 母分散が与えられている($N(0,1)$)
$\mathrm{P}\left(\bar{X}-[Z_{\alpha/2}]\cdot \sqrt{\sigma/n}\leq\mu\leq \bar{X}+[Z_{\alpha/2}]\cdot \sqrt{\sigma/n}\right)$
- 母分散が不明($t(n-1)$)
- 母分散を推定($\chi^2(n-1)$)
$\mathrm{P}\left(\frac{(n-1)s^2}{[\chi^2_{\alpha/2}(n-1)]}\leq\sigma^2\leq \frac{(n-1)s^2}{[\chi^2_{(1-\alpha/2)}(n-1)]}\right)$
- 母平均を推定
- 2つの正規母集団
-
母平均の差を推定
- 母分散$\left[\sigma^2_Aと\sigma^2_B\right]$が与えられている
$\mathrm{P}\left((\bar{X}-\bar{Y})-[Z_{\alpha/2}]\cdot\sqrt{(\sigma^2_A/l)+(\sigma^2_B/m)}\leq(\mu_A-\mu_B)\leq (\bar{X}-\bar{Y})+[Z_{\alpha/2}]\cdot \sqrt{(\sigma^2_A/l)+(\sigma^2_B/m)}\right)$ - 母分散が等しいこと$\left[\sigma^2_A=\sigma^2_{A'}\right]$が与えられている
$\mathrm{P}\left((\bar{X}-\bar{Y})-[t_{\alpha/2}(l+m-2)]\cdot\sqrt{\frac{s^2}{l}+\frac{s^2}{m}}\leq\left(\mu_A-\mu_B\right)\leq (\bar{X}-\bar{Y})+[t_{\alpha/2}(l+m-2)] \cdot \sqrt{\frac{s^2}{l}+\frac{s^2}{m}}\right)$ - 母分散が未知で等しいとは仮定できない
$\mathrm{P}\left((\bar{X}-\bar{Y})-[t_{\alpha/2}(near(\nu))]\cdot\sqrt{\frac{s^2_A}{l}+\frac{s^2_B}{m}}\leq
\left(\mu_A-\mu_B\right)\leq (\bar{X}-\bar{Y})+[t_{\alpha/2}(near(\nu))] \cdot \sqrt{\frac{s^2_A}{l}+\frac{s^2_B}{m}}\right)$
- 母分散$\left[\sigma^2_Aと\sigma^2_B\right]$が与えられている
-
母分散の比を推定
$\mathrm{P}\left([F_{1-\alpha/2}(l-1,m-1)]\cdot\frac{s^2_B}{s^2_A}\leq \frac{\sigma^2_B}{\sigma^2_A}\leq [F_{\alpha/2}(l-1,m-1)]\cdot\frac{s^2_B}{s^2_A}\right)$
-
- 二項母集団
$\mathrm{P}\left(\hat{p}-[Z_{\alpha/2}]\cdot\sqrt{\hat{p}(1-\hat{p})/n}\leq p\leq \hat{p}+[Z_{\alpha/2}]\cdot \sqrt{\hat{p}(1-\hat{p})/n}\right)$ - ボアソン母集団
$\mathrm{P}\left(\hat{\lambda}-[Z_{\alpha/2}]\cdot\sqrt{\hat{\lambda}/n}\leq\lambda\leq \hat{\lambda}+[Z_{\alpha/2}]\cdot \sqrt{\hat{\lambda}/n}\right)$
##1. 母平均を推定
###1.1. 母集団の分散(母分散)が不明
- 母分散を不偏な標本分散$s^2$で代用する
- t分布に従う$\left[t=\frac{(\bar{X}-\mu)}{\sqrt{s/n}}\right]$の形にする
- t分布表を使って解く
\mathrm{P}(下側{\alpha/2}\%点の面積\leq信頼区間の面積\leq上側{\alpha/2}\%点の面積)=全体の面積ー信頼区間外の面積\\
\mathrm{P}\left(-[t_{\alpha/2}(n-1)]\leq\frac{(\bar{X}-\mu)}{\sqrt{s/n}}\leq [t_{\alpha/2}(n-1)]\right)=1-\alpha\\
\mathrm{P}\left(\bar{X}-[t_{\alpha/2}(n-1)]\cdot \sqrt{s/n}\leq\mu\leq \bar{X}+[t_{\alpha/2}(n-1)]\cdot \sqrt{s/n}\right)=1-\alpha\\
###1.2. 母集団の分散(母分散)が提供されている
1. $\bar{X}$は正規分布に従うので$\bar{X}$を標準化$\left[Z=\frac{(\bar{X}-\mu)}{\sqrt{\sigma/n}}\right]$の形にする
2. 標準正規分布表を使って解く
\mathrm{P}\left(下側{\alpha/2}\%点の面積\leq信頼区間の面積\leq上側{\alpha/2}\%点の面積\right)=全体の面積ー信頼区間外の面積\\
\mathrm{P}\left(-[Z_{\alpha/2}]\leq\frac{(\bar{X}-\mu)}{\sqrt{\sigma/n}}\leq [Z_{\alpha/2}]\right)=1-\alpha\\
\mathrm{P}\left(\bar{X}-[Z_{\alpha/2}]\cdot \sqrt{\sigma/n}\leq\mu\leq \bar{X}+[Z_{\alpha/2}]\cdot \sqrt{\sigma/n}\right)=1-\alpha\\
##2. 母分散を推定
1. 不偏な標本分散$\left[s^2=\frac{1}{n-1}\sum^n_{i=1}(X_i-\bar{X})^2\right]$を用いて自由度(n-1)の$\chi^2$分布に従う$\left[\chi^2=\frac{(n-1)s^2}{\sigma^2}\right]$の形に変更する
2. $\chi^2$分布表を使って解く
\mathrm{P}\left(下側{1-\alpha/2}\%点の面積\leq信頼区間の面積\leq上側{\alpha/2}\%点の面積\right)=全体の面積ー信頼区間外の面積\\
\mathrm{P}\left([\chi^2_{(1-\alpha/2)}(n-1)]\leq\frac{(n-1)s^2}{\sigma^2}\leq [\chi^2_{\alpha/2}(n-1)]\right)=1-\alpha\\
\mathrm{P}\left(\frac{[\chi^2_{(1-\alpha/2)}(n-1)]}{(n-1)s^2}\leq\frac{1}{\sigma^2}\leq \frac{[\chi^2_{\alpha/2}(n-1)]}{(n-1)s^2}\right)=1-\alpha\\
\mathrm{P}\left(\frac{(n-1)s^2}{[\chi^2_{(1-\alpha/2)}(n-1)]}\geq\frac{\sigma^2}{1}\geq \frac{(n-1)s^2}{[\chi^2_{\alpha/2}(n-1)]}\right)=1-\alpha\\
\mathrm{P}\left(\frac{(n-1)s^2}{[\chi^2_{\alpha/2}(n-1)]}\leq\sigma^2\leq \frac{(n-1)s^2}{[\chi^2_{(1-\alpha/2)}(n-1)]}\right)=1-\alpha\\
##1. 母平均の差
###1.1. 母分散が与えられている
-1. $\left[\sigma^2_Aと\sigma^2_B\right]$がわかっているので$\bar{X}$は$\mathrm{N}(\mu_A, \sigma^2_A/l)$に従い,$\bar{Y}$は$\mathrm{N}(\mu_B, \sigma^2_B/m)$に従う
0. 平均の差を求める場合でも,分散は和であることに注意して,正規分布の性質を使うと$\bar{X}-\bar{Y}$は$\mathrm{N}\left(\mu_A-\mu_B, (\sigma^2_A/l)+(\sigma^2_B/m)\right)$に従う
-+-+-+-+-ここからはA. 一つの正規母集団 1.2. 母集団の分散(母分散)が提供されている の推定と同じ-+-+-+-+-
- $\bar{X}-\bar{Y}$は正規分布に従うので$\bar{X}-\bar{Y}$を標準化$\left[Z=\frac{(\bar{X}-\bar{Y})-(\mu_A-\mu_B)}{\sqrt{(\sigma^2_A/l)+(\sigma^2_B/m)}}\right]$の形にする
- 標準正規分布表を使って解く
\mathrm{P}\left(下側{\alpha/2}\%点の面積\leq信頼区間の面積\leq上側{\alpha/2}\%点の面積\right)=全体の面積ー信頼区間外の面積\\
\mathrm{P}\left(-[Z_{\alpha/2}]\leq\frac{(\bar{X}-\bar{Y})-(\mu_A-\mu_B)}{\sqrt{(\sigma^2_A/l)+(\sigma^2_B/m)}}\leq [Z_{\alpha/2}]\right)=1-\alpha\\
\mathrm{P}\left((\bar{X}-\bar{Y})-[Z_{\alpha/2}]\cdot\sqrt{(\sigma^2_A/l)+(\sigma^2_B/m)}\leq(\mu_A-\mu_B)\leq (\bar{X}-\bar{Y})+[Z_{\alpha/2}]\cdot \sqrt{(\sigma^2_A/l)+(\sigma^2_B/m)}\right)=1-\alpha\\
###1.2. 母分散が等しいことが与えられている
-+-+-+-+-A. 一つの正規母集団1.1. 母集団の分散(母分散)が不明の推定と発想は同じ-+-+-+-+-
- $\sigma_A=\sigma_B$であるから合併した分散(プールした分散)$\left[s^2=\frac{1}{(l-1)+(m-1)}\left(\sum^n_{i=1}\left(X_i-\bar{X}\right)^2+\sum^n_{j=1}\left(Y_j-\bar{Y}\right)^2\right)\right]$を算出する
- 2標本t統計量$\left[t=\frac{\left(\bar{X}-\bar{Y}\right)-\left(\mu_A-\mu_B\right)}{\sqrt{\frac{s^2}{l}+\frac{s^2}{m}}}\right]$は自由度$((l-1)+(m-1))$のt分布$t((l-1)+(m-1))$に従う
- t分布表を使って解く
\mathrm{P}(下側{\alpha/2}\%点の面積\leq信頼区間の面積\leq上側{\alpha/2}\%点の面積)=全体の面積ー信頼区間外の面積\\\\
\mathrm{P}\left([-t_{\alpha/2}(l-1+m-1)]\leq
\frac{\left(\bar{X}-\bar{Y}\right)-\left(\mu_A-\mu_B\right)}{\sqrt{\frac{s^2}{l}+\frac{s^2}{m}}}\leq [t_{\alpha/2}(l-1+m-1)]\right)=1-\alpha\\
\mathrm{P}\left((\bar{X}-\bar{Y})-[t_{\alpha/2}(l-1+m-1)]\cdot\sqrt{\frac{s^2}{l}+\frac{s^2}{m}}\leq
\left(\mu_A-\mu_B\right)\leq (\bar{X}-\bar{Y})+[t_{\alpha/2}(l-1+m-1)] \cdot \sqrt{\frac{s^2}{l}+\frac{s^2}{m}}\right)=1-\alpha\\
###1.3. 母分散が未知で等しいとは仮定できない
0. ウェルチの近似法を用いて解く
- $\left[Z=\frac{(\bar{X}-\bar{Y})-(\mu_A-\mu_B)}{\sqrt{\frac{\sigma^2_A}{l}+{\frac{\sigma^2_B}{m}}}}\right]$の$[\sigma^2_Aと\sigma^2_B]$をそれぞれ不偏な標本分散$[s^2_Aとs^2_B]$を用いて代用した形$\left[t=\frac{(\bar{X}-\bar{Y})-(\mu_A-\mu_B)}{\sqrt{\frac{s^2_A}{l}+{\frac{s^2_B}{m}}}}\right]$を作る
- この式は自由度を求めるための式$\left[\nu=\frac{\left(\frac{s^2_A}{l}+\frac{s^2_B}{m}\right)^2}{\frac{\left(\frac{s^2_A}{l}\right)^2}{l-1}+\frac{\left(\frac{s^2_B}{m}\right)^2}{m-1}}\right]$に最も近い整数のt分布$[t(near(\nu))]$に近似的に従う(参考書では$\nu^*$で表していましたがLaTexがバグるので変えています)
- t分布表を用いて解く
\mathrm{P}(下側{\alpha/2}\%点の面積\leq信頼区間の面積\leq上側{\alpha/2}\%点の面積)=全体の面積ー信頼区間外の面積\\\\
\mathrm{P}\left([-t_{\alpha/2}(near(\nu))]\leq
\frac{\left(\bar{X}-\bar{Y}\right)-\left(\mu_A-\mu_B\right)}{\sqrt{\frac{s^2_A}{l}+\frac{s^2_B}{m}}}\leq [t_{\alpha/2}(near(\nu))]\right)=1-\alpha\\
\mathrm{P}\left((\bar{X}-\bar{Y})-[t_{\alpha/2}(near(\nu))]\cdot\sqrt{\frac{s^2_A}{l}+\frac{s^2_B}{m}}\leq
\left(\mu_A-\mu_B\right)\leq (\bar{X}-\bar{Y})+[t_{\alpha/2}(near(\nu))] \cdot \sqrt{\frac{s^2_A}{l}+\frac{s^2_B}{m}}\right)=1-\alpha
##2. 母分散の比
- $U=\frac{(l-1)s^2_A}{\sigma^2_A}$は$\chi^2(l-1)$, $V=\frac{(l-1)s^2_B}{\sigma^2_B}$は$\chi^2(m-1)$の$\chi^2$分布に従う
- $U$と$V$が独立である$[Cov(U,V)=0]$ことを確認する
- $F(l-1,m-1)$に従うフィッシャーの分散比$\left[F=\frac{\left(\frac{\left(\frac{(l-1)s^2_A}{\sigma^2_A}\right)}{(l-1)}\right)}{\left(\frac{\left(\frac{(m-1)s^2_B}{\sigma^2_B}\right)}{(m-1)}\right)}\right]$を求める
- $F$分布表を用いて解く
\mathrm{P}(下側{1-\alpha/2}\%点の面積\leq信頼区間の面積\leq上側{\alpha/2}\%点の面積)=全体の面積ー信頼区間外の面積\\
\mathrm{P}\left([F_{1-\alpha/2}(l-1,m-1)]\leq \frac{\left(\frac{s^2_A}{\sigma^2_A}\right)}{\left(\frac{s^2_B}{\sigma^2_B}\right)}\leq [F_{\alpha/2}(l-1,m-1)]\right)=1-\alpha\\
\mathrm{P}\left([F_{1-\alpha/2}(l-1,m-1)]\cdot\frac{s^2_B}{s^2_A}\leq \frac{\left(\frac{1}{\sigma^2_A}\right)}{\left(\frac{1}{\sigma^2_B}\right)}\leq [F_{\alpha/2}(l-1,m-1)]\cdot\frac{s^2_B}{s^2_A}\right)=1-\alpha\\
\mathrm{P}\left([F_{1-\alpha/2}(l-1,m-1)]\cdot\frac{s^2_B}{s^2_A}\leq \frac{\sigma^2_B}{\sigma^2_A}\leq [F_{\alpha/2}(l-1,m-1)]\cdot\frac{s^2_B}{s^2_A}\right)=1-\alpha\\
#C. 母集団がベルヌーイ分布に従う
ベルヌーイ分布の再生性から$\sum X_i$はベルヌーイ分布$Bi(1,p)$に従い$\left[\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}\right]$から分布関数を求めることができるが,$n$が大きいと$\left[\frac{n!}{x!(n-x)!}\right]$が膨大になる.
そこで中心極限定理の$n$が大きければ正規分布に近似するという性質を用いて標準正規分布表で解く
##1. 二項分布の母数(parameter)
パラメータ$[p]$の信頼区間を求める
- 標本の成功回数を$S$とおくと$S$の期待値と分散は$[E[S]=np]$ $[V[S]=np(1-p)]$である
- $S=\sum X_i$であるから$S/n$を推定量$[\hat{p}=S/n=\bar{X}]$とする
- 中心極限定理より$\left[z=\frac{\hat{p}-p}{\sqrt{p(1-p)/n}}\right]$は$n$が十分大きいとき標準正規分布に近似する
- 標準正規分布表で解く
$\mathrm{P}\left(下側{\alpha/2}%点の面積\leq信頼区間の面積\leq上側{\alpha/2}%点の面積\right)=全体の面積ー信頼区間外の面積$
$\mathrm{P}\left(-[Z_{\alpha/2}]\leq\frac{\hat{p}-p}{\sqrt{p(1-p)/n}}\leq [Z_{\alpha/2}]\right)=1-\alpha$
$\mathrm{P}\left(\hat{p}-[Z_{\alpha/2}]\cdot\sqrt{p(1-p)/n}\leq p\leq \hat{p}+[Z_{\alpha/2}]\cdot \sqrt{p(1-p)/n}\right)=1-\alpha$ - 大数の法則から$\hat{p}$は$p$の一致推定量であり, $n$が大きい場合は$\hat{p}\simeq p$とみなせるので
$\mathrm{P}\left(\hat{p}-[Z_{\alpha/2}]\cdot\sqrt{\hat{p}(1-\hat{p})/n}\leq p\leq \hat{p}+[Z_{\alpha/2}]\cdot \sqrt{\hat{p}(1-\hat{p})/n}\right)=1-\alpha$
##2. ボアソン分布の母数(parameter)
パラメータ$[\lambda]$の信頼区間を求める
- 確率変数$X$の期待値と分散は$[E[X]=\lambda]$ $[V[X]=\lambda]$である
- $\lambda$の推定量$\hat{\lambda}$は, $\hat{\lambda}=\bar{X}$である
- 中心極限定理より$\left[z=\frac{\hat{\lambda}-\lambda}{\sqrt{\lambda/n}}\right]$は$n$が十分大きいとき標準正規分布に近似する
- 標準正規分布表で解く
$\mathrm{P}\left(下側{\alpha/2}%点の面積\leq信頼区間の面積\leq上側{\alpha/2}%点の面積\right)=全体の面積ー信頼区間外の面積$
$\mathrm{P}\left(-[Z_{\alpha/2}]\leq\frac{\hat{\lambda}-\lambda}{\sqrt{\lambda/n}}\leq [Z_{\alpha/2}]\right)=1-\alpha$
$\mathrm{P}\left(\hat{\lambda}-[Z_{\alpha/2}]\cdot\sqrt{\lambda/n}\leq\lambda\leq \hat{\lambda}+[Z_{\alpha/2}]\cdot \sqrt{\lambda/n}\right)=1-\alpha$ - 大数の法則から$\hat{\lambda}$は$\lambda$の一致推定量であり, $n$が大きい場合は$\hat{\lambda}\simeq\lambda$とみなせるので
$\mathrm{P}\left(\hat{\lambda}-[Z_{\alpha/2}]\cdot\sqrt{\hat{\lambda}/n}\leq\lambda\leq \hat{\lambda}+[Z_{\alpha/2}]\cdot \sqrt{\hat{\lambda}/n}\right)=1-\alpha$
↓ Welchの公式について詳しく書いてあるサイトがありました
https://note.com/utaka233/n/na0a9b7742e45
#参考文献
統計学入門 (基礎統計学Ⅰ)