正規母集団の母平均の推定
正規母集団から抽出した標本$x$を以下の様に定義する。ここで、母平均を$\mu$、母分散を$\sigma^2$とする。
x \sim N \left( \mu, \sigma^2 \right)
よって、標本平均$\overline{x}$は、以下の分布に従う。$n$は標本数とする。
\overline{x} \sim N \left( \mu, \frac{\sigma^2}{n} \right)
また、不偏分散(母分散の不偏推定量)は以下の様に定義する。
\hat{\sigma} = \cfrac{1}{n-1} \left( x - \mu \right)^2
母分散が既知
母分散が既知か未知かで推定方法が異なる。まず、母分散が既知の場合の区間推定方法を示す。信頼区間は$95{\%}$とする。
Z = \cfrac{\overline{x} - \mu}{\cfrac{\sigma}{\sqrt{n}}} \sim N \left( 0, 1 \right)
$Z$は標準正規分布に従うため、信頼区間を$95{\%}$とすると、以下の関係が成立する。
P \left( - Z_{0.25} \leq Z \leq Z_{0.25} \right) = 0.95
よって、区間推定式は以下の様になる。
\overline{x} - Z_{0.25}\cfrac{\sigma}{\sqrt{n}} \leq \mu \leq \overline{x} + Z_{0.25}\cfrac{\sigma}{\sqrt{n}}
母分散が未知
続いて、母分散が未知の場合の区間推定方法を示す。信頼区間は95%とする。
t = \cfrac{\overline{x} - \mu}{\cfrac{\hat{\sigma}}{\sqrt{n}}} \sim t(n-1)
$t$は自由度$n-1$の$t$分布に従うため、信頼区間を$95{\%}$とすると、以下の関係が成立する。
P \left( - t(n-1)_{0.25} \leq t \leq t (n - 1)_{0.25} \right) = 0.95
よって、区間推定式は以下の様になる。
\overline{x} - t(n-1)_{0.25} \cfrac{\hat{\sigma}}{\sqrt{n}} \leq \mu \leq \overline{x} + t(n-1)_{0.25}\cfrac{\hat{\sigma}}{\sqrt{n}}
正規母集団の母分散の推定
正規母集団の母分散の区間推定を行うために、以下の様に$w$を定義する。
w = \sum_{i} Z^{2}_{i} = \cfrac{(n-1)\hat{\sigma}^2}{\sigma^2} \sim \chi^2(n-1)
$w$は自由度$n-1$の$\chi^2$分布に従うため、信頼区間を$95{\%}$とすると、以下の関係が成立する。
P \left( \chi^2(n-1)_{0.975} \leq w \leq \chi^2(n-1)_{0.025} \right) = 0.95
よって、区間推定式は以下の様になる。
\cfrac{(n-1)\hat{\sigma}^2}{\chi^2(n-1)_{0.025}} \leq w \leq \cfrac{(n-1)\hat{\sigma}^2}{\chi^2(n-1)_{0.975}}
母比率の推定
十分に大きい標本数$n$の標本に対して、$x$人が確率$p$で発生する事象に当てはまったとする。すると、$x$の分布は以下の様に定義できる。これを二項分布という。
x \sim B(n, p)
中心極限定理を用いることにより、$x$の分布を以下の様に正規分布として定義出来る。
x \sim N(np, np(1-p))
よって、標本比率は以下の様に定義出来る。
\hat{p} = \frac{x}{n} \sim N \left( p, \cfrac{p(1-p)}{n} \right)
標本比率は、正規分布に従うので、標準正規分布$Z$は以下の様に定義出来る。
Z = \cfrac{\hat{p} - p}{\sqrt{\cfrac{p(1-p)}{n}}} \sim N(0, 1)
$Z$は標準正規分布に従うので、信頼区間を$95{\%}$とすると、以下の関係が成立する。
P \left( - Z_{0.25} \leq Z \leq Z_{0.25} \right) = 0.95
よって、区間推定式は以下の様になる。
\hat{p} - Z_{0.25}\sqrt{\cfrac{p(1-p)}{n}} \leq p \leq \hat{p} + Z_{0.25}\sqrt{\cfrac{p(1-p)}{n}}
ここで、大数の法則を用いると以下の関係式が成立する。
\lim_{n \rightarrow \infty} \hat{p} \simeq p
故に、上記の推定式は以下の近似式で書き改められる。
\hat{p} - Z_{0.25}\sqrt{\cfrac{\hat{p}(1-\hat{p})}{n}} \leq p \leq \hat{p} + Z_{0.25}\sqrt{\cfrac{\hat{p}(1-\hat{p})}{n}}