はじめに
基本的な区間推定は(プログラミングなどをしなくても)おなじみのExcelで簡単にできます。
その方法のまとめです。
書いてないこと
区間推定の用語・理屈の詳しいor丁寧な説明は書いてないです。
どちらかというと、実際にExcelでやる時のチートシートに近いかもです。
区間推定
本題に入ります。
信頼区間→それを求めるためにカギとなる値の求め方(Excel)
の順で書きます。
信頼係数 = 1-α とします。
①母平均の区間推定
(ア)母分散σ²が既知の場合
標本平均$\bar{X}$、標本の大きさnとすると、
信頼区間は [$\bar{X} -z_{\left( \dfrac{\alpha }{2}\right) }\dfrac{\sigma }{\sqrt{n}}$, $\bar{X} +z_{\left( \dfrac{\alpha }{2}\right) }\dfrac{\sigma }{\sqrt{n}}$]
なのでこれを求めます。
【Excel】
〇推定誤差$z_{\left( \dfrac{\alpha }{2}\right) }\dfrac{\sigma }{\sqrt{n}}$:CONFIDENCE.NORM(α, σ, n)
or
〇 $z_{\left( \dfrac{\alpha }{2}\right) }$:NORM.S.INV(左側確率1-$\dfrac{\alpha }{2}$)
(イ)母分散σ²が未知の場合
標本平均$\bar{X}$、標本の大きさn、標本分散(不偏分散)をs²とすると
信頼区間は [$\overline{X}-t_{n-1\left( \dfrac{\alpha }{2}\right) }\dfrac{s}{\sqrt{n}}$, $\overline{X}+t_{n-1\left( \dfrac{\alpha }{2}\right) }\dfrac{s}{\sqrt{n}}$]
なのでこれを求めます。
【Excel】
〇推定誤差$t_{n-1\left( \dfrac{\alpha }{2}\right) }\dfrac{s}{\sqrt{n}}$:CONFIDENCE.T(α, s, n)
or
〇$t_{n-1\left( \dfrac{\alpha }{2}\right) }$:T.INV(左側確率1-$\dfrac{\alpha }{2}$, 自由度n-1)
or
〇データ→データ分析→基本統計量
②母分散の区間推定
標本の大きさn、標本分散(不偏分散)をs²とすると、
信頼区間は [$\dfrac{\left( n-1\right) s^{2}}{χ²_{n-1\left( \dfrac{\alpha }{2}\right) } }$,$\dfrac{\left( n-1\right) s^{2}}{χ²_{n-1\left( 1-\dfrac{\alpha }{2}\right) } }$]
なので、これを求めます。
【Excel】
〇$χ²_{n-1\left( \dfrac{\alpha }{2}\right) }$:CHISQ.INV(左側確率1-$\dfrac{\alpha }{2}$, 自由度n-1)
〇$χ²_{n-1\left( 1-\dfrac{\alpha }{2}\right) }$:CHISQ.INV(左側確率$\dfrac{\alpha }{2}$, 自由度n-1)
〇偏差平方和(n-1)s²:DEVSQ(データ範囲)
③母比率の区間推定
標本数nは十分に大きいもの(n≧30)とします。
標本比率p´とすると、
信頼区間は[$p'-z_{\left( \dfrac{\alpha }{2}\right) }\sqrt{\dfrac{p'\left( 1-p'\right) }{n}}$, $p'+z_{\left( \dfrac{\alpha }{2}\right) }\sqrt{\dfrac{p'\left( 1-p'\right) }{n}}$]
なので、これを求めます。
【Excel】
〇推定誤差$z_{\left( \dfrac{\alpha }{2}\right) }\sqrt{\dfrac{p'\left( 1-p'\right) }{n}}$:CONFIDENCE.NORM(α, p´(1-p´), n)
or
〇$z_{\left( \dfrac{\alpha }{2}\right) }$:NORM.S.INV(左側確率1-$\dfrac{\alpha }{2}$)
【おまけ】分布ごとの、累積確率・横軸上の値(x)の求め方
累積確率(左側確率)・横軸上の値(以下xと書きます)の求め方は分布をまたいで似ている所が多いので、ここで表にまとめておきます。
x→累積確率 | 累積確率→x | |
---|---|---|
正規分布 | NORM.DIST(x, $\bar{x}$, σ, TRUE) | NORM.INV(累積確率, $\bar{x}$, σ) |
標準正規分布 | NORM.S.DIST(x,TRUE) | NORM.S.INV(累積確率) |
χ²分布 | CHISQ.DIST(x, 自由度, TRUE) | CHISQ.INV(累積確率, 自由度) |
t分布 | T.DIST(x, 自由度, TRUE) | T.INV(累積確率, 自由度) |
F分布 | F.DIST(x, 自由度1, 自由度2, TRUE) | F.INV(累積確率, 自由度1, 自由度2) |
※ $\bar{x}$ は平均値
※σは標準偏差
※「.RT」をつけて右側確率を使う方法もありますが割愛します。