はじめに
こちら統計検定準1級のテキストでおなじみ、「統計検定準1級対応 統計学実践ワークブック」の例・例題解答をまとめたものです。
テキストはこちら
今回の記事ではワークブックの1〜10章について解答をまとめています。
個人的なメモを記事にまとめたものなので、記述ミスなどがあるかもしれません。
その場合は優しく教えていただけるとありがたいです笑
その他注意事項
- 著作権の兼ね合いで問題は記述していません
- 問題の解答方法は1つでは無いので、ワークブックの解法とは違う解き方をしているものも存在します
- 一部理解が追いついてないためスキップしている問題があります(試験に出ないわけではありません)
関連記事
また、以下の記事内容も一緒に学習していたので併せて参考にしてみてください
1.例題解説 11~20章 統計学実践ワークブック
2.例題解説 21~32章 統計学実践ワークブック
3.統計用語の解説がわかりやすかったサイトチートシート
今後受験される方の参考になれば幸いです。
それではどうぞーー!!
1章 事象と確率
例
-
例1
$$
A\cup B = A + B - A\cap B
$$より
$A\cup B = 20 + 15 -5 = 30$
どちらも見ていない人は
$50-30=20$
例題
-
問 1.1
-
(1)
$$
0.6\cdot 0.4 + 0.4\cdot 0.5 = 0.44
$$ -
(2)
女子合格率: $0.4\cdot 0.5= 0.2$ より
$$
0.2/0.44 = 0.4545..
$$
またはベイズの定理より
$$
P(女子|合格)\frac{P(合格|女子)P(女子)}{P(合格)}\
=\frac{0.5 \cdot 0.4}{0.44} = 0.4545..
$$
-
-
問 1.2
-
(1)
$P(X=1)=P(X=2)$ より
1,2が $1/6$ の場合:$E[X]=5/2$
1,2が $2/6$ の場合:$E[X]=2$
2より大きいのは1,2が $1/6$ の時となる
$V[X] = \frac{1}{N}\sum^n_{i=1} (x_i - E[X])^2$
より
$V[X] = 7/12$
-
(2)
それぞれの結果を表にすると以下になる
1 2 3 3 3 3 1 1 2 3 3 3 3 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3では無いパターンは4回しか無いので
$32/36 = 8/9$
-
-
問 1.3
ベイズの定理を用いる
$$p(A|B) = \frac{p(B|A)p(A)}{p(B|A) p(A) + p(B|A以外)p(A以外)}$$-
(1)
罹患と陽性反応をそれぞれベイズの定理に当てはめると
\displaylines{ P(罹患|陽性)= \frac{P(陽性|罹患)P(罹患)}{P(陽性)}\\ = \frac{0.99 \cdot \frac{1}{100}}{0.99 \cdot \frac{1}{100} + 0.02 \cdot \frac{99}{100}}\\ = \frac{0.01}{0.01 + 0.02} = 1/3 }
-
(2)
\displaylines{ P(罹患|2回目も陽性)= \frac{P(2回目も陽性|罹患)P(罹患)}{P(2回目も陽性)}\\ = \frac{0.9(0.99 \cdot \frac{1}{100})}{0.9(0.99 \cdot \frac{1}{100}) + 0.1(0.02 \cdot \frac{99}{100})}\\ = \frac{0.9}{0.9+0.1\cdot 2}\\ = 9/11 }
-
2章 確率分布と母関数
例
-
例1
周辺確率密度関数は
$-1\leq x \leq 1$ の場合の同時確率密度関数が正となる$y$の範囲は $-\sqrt{1-x^2}\leq y \leq \sqrt{1-x^2}$ となる
$x$ の周辺確率密度関数は $
\int^{\sqrt{1-x^2}}_{-\sqrt{1-x^2}} \frac{1}{\pi} dy
$で積分する$$
\frac{1}{\pi} \int^{\sqrt{1-x^2}}_{-\sqrt{1-x^2}}dy
$$$y$が無い場合はその範囲を返す
$$
\sqrt{1-x^2}- (-\sqrt{1-x^2}) = 2\sqrt{1-x^2}\
$$
積分結果(周辺確率密度関数)は
$$
\frac{2\sqrt{1-x^2}}{\pi}
$$条件付き確率密度関数は
$$
f_{Y|X}(y|x) = \frac{f(x, y)}{f_x (x)}
$$となり、一様分布なので
\displaylines{ f_{Y|X}(y|x)\\ = \frac{1}{\pi}\cdot \frac{\pi}{2\sqrt{1-x^2}} \\ = \frac{1}{2\sqrt{1-x^2}} }
-
例2
離散分布の確率母関数は
$
G(s)=E[s^X] = \sum s^x p(x)
$より\displaylines{ \sum s^x p(x)= s^0 (1-p) + s^1p\\ =1(1-p)+sp\\ =1-p+sp\\ =1+p(s-1) }
二項分布の確率母関数は
母関数の特性- 確率分布と1対1対応
- 独立な変数の和が母関数の積に対応する
の2より
$1+p(s-1)$を$n$回掛けたものと一致するので
$$(1+p(s-1))^n$$
例題
-
問 2.1
-
基準化定数 $c$
$$
\int^1_0 \int^1_0 c(x+y) dx dy = 1\
となるように計算する
$$\displaylines{ \int^1_0 [c(\frac{1}{2}x^2+y)]^1_0 dy\\ = \int^1_0 c(\frac{1}{2}+y) dy\\ = [c(\frac{1}{2} + \frac{1}{2}y^2)]^1_0\\ = c(\frac{1}{2} + \frac{1}{2})\\ = c \cdot 1 }
上記が1と同じになればよいので $c$ は1となる
-
周辺密度関数
$y$ の範囲0〜1で積分すれば良いので、
$$
f_X(x) = \int^1_0(x+y)dy = x + \frac{1}{2}
$$ -
条件付き確率密度関数
条件付き確率密度関数は以下
$$
f_{Y|X}(y|x) = \frac{f(x,y)}{f_X(x)}
$$より
$$
f_{Y|X}(y|x) = \frac{x+y}{x + \frac{1}{2}}
$$
-
-
問 2.2
-
確率母関数
\displaylines{ G(s) = \sum s^x p(x)\\ = \sum s^x p(1-p)^x\\ = p \sum s^x (1-p)^x\\ = p \sum (s (1-p))^x\\ }
ここで、$|a|$が1より小さい時、
\displaylines{ \sum a^x = \frac{1}{1-a}より\\ = p \cdot \frac{1}{1-(s(1-p))}\\ = \frac{p}{1-(s(1-p))} }
-
期待値
指数関数の微分公式:$[g(s)^{x}]′ = x \cdot g'(s) \cdot g(s)^{x-1}$より
\displaylines{ E[x] =p \cdot \frac{d}{ds} [1-s(1-p)]^{-1}\\ = p \cdot (1- p) [1-s(1-p)]^{-2}\\ s=1を代入する\\ = p \cdot -(-(1- p)) \cdot [1-(1-p)]^{-2}\\ = p \cdot (1- p) \cdot p^{-2}\\ = \frac {p \cdot (1- p)}{p^{2}}\\ = \frac {1- p}{p}\\ }
-
分散
分散は2回微分して $s=1$ を代入すると
$G''(1) = E[X(X-1)]$
となるので、
\displaylines{ V[X]\\ = E[X^2] - E[x]\\ =E[X^2] - E[X] +E[X] -(E[X])^2\\ = G''(1)+ G'(1) - (G'(1))^2\\ }
$G''(1)$ を求めると
\displaylines{ \frac{\partial}{\partial s}p(1-p)(1-s(1-p))^{-2}\\ = p(1-p)\frac{\partial}{\partial s}(1-s(1-p))^{-2}\\ = p(1-p)(-2)(1-s(1-p))^{-3}(-(1-p))\\ =\frac{ 2p(1-p)^2}{(1-s(1-p))^3}\\ = \frac{ 2p(1-p)^2}{p^3}\\ = \frac{ 2(1-p)^2}{p^2}\\ }
よって分散 $V[X]$ は
\displaylines{ = \frac{2(1-p)^2}{p^2} + \frac{1-p}{p}-(\frac{1-p}{p})^2 \\ =\frac{2(1-p)^2 +p(1-p)-(1-p)^2}{p^2}\\ = \frac{(1-p)^2+p(1-p)}{p^2}\\ = \frac{(1-p)((1-p)+p)}{p^2}\\ =\frac{1-p}{p^2} }
-
-
問 2.3
-
モーメント母関数
$$
f(x) = \lambda e^{- \lambda x}\
$$モーメント母関数の求め方$m(\theta)= \int^{\infty}_0 e^{x\theta} f(x)\ dx$より
$$
\int^{\infty}_0 e^{\theta x}\ \lambda e^{-\lambda x}\
= \lambda \int^{\infty}_0 e^{x(\theta-\lambda)}dx\
= \lambda \int^{\infty}_0 e^{-(\lambda-\theta)x}dx\
$$$\int e^{-b x} dx= \frac{1}{b}e^{bx}$より
$$
\lambda \int^{\infty}_0 e^{-(\lambda-\theta)x}dx\
= \frac{\lambda}{\lambda -\theta}
$$ -
期待値
モーメント母関数を $\theta$ で微分して0を代入する
\displaylines{ \frac{\partial}{\partial \theta} \lambda (\lambda - \theta)^{-1}\\ = \lambda \frac{\partial}{\partial \theta}(\lambda - \theta)^{-1}\\ = \lambda \cdot -1 (\lambda -\theta)^{-2}(-1)\\ = \lambda /(\lambda-\theta )^2 }
$\theta = 0$ を代入して
$$
\frac{\lambda}{\lambda^2} = \frac{1}{\lambda}
$$ -
分散
分散を求めるには $V[X] = E[X^2] - (E[X])^2$
$E[X^2]$ はモーメント母関数を2回微分して0を代入する\displaylines{ \lambda (\lambda-\theta )^{-2}\\ =\lambda (-2)(\lambda - \theta)^{-3}(-1)\\ = \frac{2\lambda}{\lambda^3} = \frac{2}{\lambda^2} }
よって
\displaylines{ V[X] = \frac{2}{\lambda^2} - (\frac{1}{\lambda})^2\\ = \frac{1}{\lambda^2} }
-
3章 分布の特性値
例
-
例1
$$
変動係数=\frac{\sqrt{V[X]}}{E[X]}
$$より
身長: $5.7/168.9 = 0.033..$
体重: $15.9/63.6 = 0.25$
体重のほうが散らばりが多い
-
例2
調和平均の公式
$$
\frac{n}{\frac{1}{x_1}+ \frac{1}{x_2}+ \frac{1}{x_3}...+\frac{1}{x_n}}
$$よって
$$
\frac{3}{1/5+1/4+1/3}\
= \frac{3}{47/60}\
= 3.83..
$$
例題
-
問 3.1
-
(1)
変動係数:$\frac{\sigma}{\mu}$より
$$
12/60 = 0.2
$$ -
(2)
変動係数は変わらないので、
$$
x/65 = 0.2\
x = 65\cdot 0.2= 13
$$
-
-
問 3.2
-
(1)
調和平均を用いる
$$
n件の調和平均=\frac{n}{\frac{1}{x_1}+ \frac{1}{x_2}+ \frac{1}{x_3}...+\frac{1}{x_n}}
$$より
$$
\frac{96}{48/8+48/12}\
= 9.6
$$ -
(2)
加重平均を用いる
$$
\frac{500\cdot 600 + 700\cdot 700 + 800\cdot 500}{500+700+800}=595
$$ -
(3)
幾何平均を用いる
$$
\sqrt[n]{n_1 \cdot n_2 \cdot n_3 \cdot... n_n}
$$$$
{}^4\sqrt{1.15\cdot 0.98\cdot 1.03\cdot 0.99}= 1.035..
$$
-
-
問 3.3
方法1それぞれ別にパンを半分ずつ利用するので
$$
Z_1 = X_1 + X_2 + Yより\
= 0.5^2 + 0.5^2 + 0.4^2\
= 0.66
$$方法2
一つのパンを半分にするので
$$
Z_2 = 2X+Y\
V[Z_2] = 2^2V[X] + V[Y]より\
4 \cdot 0.5^2 + 0.4^2\
= 1.16
$$
4章 変数変換
例
-
例1
-
公式:確率密度関数の変数変換
$f(x)$ を $Y=g(X)$ の変数変換をするには
求めたい値を $X$ を用いて表現する
$Y=g(X)$
$$
f(y) = \frac{f(g^{-1}(y))}{|g'(g^{-1}(y))|}\
=\frac{f(x)}{|g'(x)|}
$$その後、 $x$ を $y$ に変換する
変換 $g(x) = X^2$ に基づき、
$Y = X^2$ と定義すると、元の確率変数 $X$ に対応する $Y$ の値は $X$ の絶対値に依存する
つまり、 $X = \pm \sqrt{Y}$
標準正規分の確率密度関数 $f(x)$ は
$$
f(x) = \frac{1}{\sqrt{2\pi}}exp{(-\frac{x^2}{2}})\
$$となる
ただし、 $X = \pm \sqrt{Y}$ より$X^2$ となる変数は両方の符号を反映させるため2倍する
$$
=2 \cdot {\frac{1}{\sqrt{2\pi}}exp{(-\frac{x^2}{2}})}
$$$g'(x) = 2X$ として
$\frac{f(x)}{|g'(x)|}$ より、 $g'(x)$ を割る
$$
\frac{2}{\sqrt{2\pi}}exp{(-\frac{x^2}{2}})\cdot \frac{1}{2x}\
= \frac{1}{x\sqrt{2\pi}}exp{(-\frac{x^2}{2}})
$$こちらに $y=x^2$ を適応
$$
= \frac{1}{\sqrt{2\pi y}}exp{(-\frac{y}{2}})
$$ -
例題
-
問 4.1
-
(1)
期待値
正規分布のモーメント母関数を用いて
$$
M_X(\theta ) = E[e^{\theta X}] = exp \Big(\theta\mu + \frac{\theta^2 \sigma^2}{2}\Big)
$$$\theta=1$ とすると $e^X$ の期待値となる
$$
E[Y] = E[e^X] = M_X(1) = exp\Big( \mu + \frac{\sigma^2}{2}\Big)
$$ -
(2)
分散
$E[Y^2]$ は $\theta = 2$ として
\displaylines{ E[Y^2] = E[e^{2X}] = M_X(2) = exp\Big(2\mu + \frac{2^2\sigma^2}{2} \Big)\\ = exp\Big(2\mu +2\sigma^2 \Big) }
\displaylines{ V[Y] = exp\Big(2\mu +2\sigma^2 \Big) - exp\Big(2( \mu + \frac{\sigma^2}{2})\Big)\\ 共通項を括って\\ = exp(2\mu + \sigma^2 )(exp(\sigma^2)-1) }
-
(3)
確率密度関数
変数変換の公式より
$exp(X)$ を微分しても$exp(X)$ となるので
$$
\frac{1}{\sqrt{2\pi }\sigma}exp\Big( -(x-\mu)/2\sigma^2 \Big)\cdot \frac{1}{exp(X)}
$$問題文より
$$
Y = exp(X)\
X = log(Y)
$$こちらを代入すると
$$
\frac{1}{y\sqrt{2\pi }\sigma}exp\Big( -(log(y)-\mu)/2\sigma^2 \Big)
$$
-
-
問 4.2
確率変数の線形結合の分布
$Z=aX+bY, W= Y$ とする
この場合の逆変換は以下となる
$X = \frac{Z}{a} - bW$
$Y=W$
ヤコビアンは
\displaylines{ J = \begin{bmatrix} \frac{\partial Z}{\partial X} & \frac{\partial Z}{\partial Y} \\ \frac{\partial W}{\partial X} & \frac{\partial W}{\partial Y} \end{bmatrix} = \begin{bmatrix} a & b \\ 0 & 1 \end{bmatrix}\\ }
これにより
\displaylines{ = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix} =1 }
逆関数の $X = Z - W , Y = W$ を代入する
\displaylines{ \frac{f(x,y)}{|J(x,y)|}= \frac{f(x)f(y)}{|J(x,y)|}\\ = \frac{\lambda e^{-\lambda x} \cdot \lambda e^{-\lambda y} }{1}\\ = \lambda e^{-\lambda (z-w)} \cdot \lambda e^{-\lambda w}\\ = \lambda^2 e^{-\lambda z} }
こちらを $W$ で積分すると $f(Z)$ が求められる
$$
\int^Z_0\lambda^2 e^{-\lambda z}dw\
$$$w$ がないので外に出す
$$
\lambda^2 e^{-\lambda z}\int^Z_0 dw
$$$\int^Z_0 dw$ は定積分の長さになるので
$$
\lambda^2 e^{-\lambda z}\cdot z\
=\lambda^2 z e^{-\lambda z}
$$
5章 離散型分布
例
-
例1
ランダムに選択下として、左上が4以上になる確率は超幾何分布 $HG(10,5,5)$ に従うので
\displaylines{ \frac{{}_5C_4 \cdot {}_5C_1 }{{}_{10}C_5} + \frac{{}_5C_5 \cdot {}_5C_0 }{{}_{10}C_5}\\ = \frac{5!}{4!\cdot 1!} \cdot \frac{5!}{1!\cdot 4!}\cdot \frac{5!\cdot 5!}{10!}+ \frac{5! \cdot 5!}{10!}\\ = 0.103 }
何も指定なくても10%くらいは起こるので判別できるとは言えない
例題
-
問 5.1
-
(1) 二項分布で
1から一度も発見されない確率を引く
$$
\beta = 1-(p^0 (1-p)^n)\
= 1-(1-p)^n
$$ -
(2)
以下のように展開できる
\displaylines{ 1-(1-p)^n = 0.98\\ (1-p)^n = 0.02\\ 両辺に自然対数を取ると\\ n\ log (1-p) = log(0.02)\\ n \cdot -p = -3.9\\ n\cdot - \frac{1}{5000} = -3.9\\ n = 19500 }
-
-
問 5.2
$N =79$
$M = 40$
$n = 25$
の超幾何分布に従うので
\frac{{}_{M}C_{x} \ {}_{N-M}C_{n-x}}{{}_{N} C_{n}}
より
\frac{{}_{40}C_{x} \ {}_{39}C_{25-x}}{{}_{79} C_{25}}
-
問 5.3
-
(1)
1,0なのでXの二乗もXと等しい
1の期待値を計算すれば良い
確率は変わらないので$$
\frac{3}{9}\cdot 1+ \frac{6}{9}\cdot 0=\frac{1}{3}
$$ -
(2)
どちらも1になるパターンを計算すれば良い
$$
E[X_i X_j] = 1 \cdot \frac{3}{9} \cdot \frac{2}{8} + 0 \cdot (1- \frac{3}{9} \cdot \frac{2}{8})\
= \frac{1}{12}
$$ -
(3)
\displaylines{ V[\bar{X}] \\ = V\big[ \frac{1}{4}( X_1 + X_2 + X_3 + X_4 )\big]+Cov[X_1, X_2]+...+Cov[X_3, X_4] }
Cov[X_i, X_j] :{}_4P_{2} = \frac{n!}{n-r} = \frac{4!}{4-2}=12
12通り存在する
$E[X_i^2]$ :(1)より、また $E[X_i]$ も同様なので$$
V[X_i] = E[X_i^2] - (E[X_i])^2\
= 1/3 - (1/3)^2\
= 2/9
$$$Cov[X_i, X_j]= E[X_i X_j]-E[X_i]E[X_j] = 1/12 - (1/3)^2=-1/36$
\displaylines{ V[\bar{X}]\\ = (\frac{1}{4})^2+\sum_{i-1}^4 V[X_i] +Cov[X_1, X_2]+...+Cov[X_3, X_4]\\ = \frac{1}{16}( 4\cdot \frac{2}{9}+ 12\cdot -\frac{1}{36})\\ = \frac{1}{16}(\frac{5}{9})\\ = \frac{5}{144} }
-
-
問 5.4
-
(1)
$X$ と $Y$ はそれぞれ独立なので
$1.5+3$ で $4.5$
-
(2)
ポアソン分布の確率密度関数: $e^{-\lambda} \lambda^x/x!$
\displaylines{ P(X=x|X+Y=5)\\ =\frac{P(X=x, X+Y=5)}{P(X+Y=5)}\\ = \frac{P(X=x, Y=x-5)}{P(X+Y=5)}\\ }
こちらにポアソン分布の確率密度関数を適応する
\displaylines{ \frac{\frac{e^{-1.5}1.5^x}{x!} \cdot \frac{e^{-3}3^{5-x}}{(5-x)!}}{\frac{e^{(-1.5+3)}(1.5+3)^5}{5!}}\\ = \frac{e^{-4.5}1.5^x \cdot3^{5-x}}{x!(5-x)!}\frac{5!}{e^{-4.5}4.5^5}\\ =\frac{5!}{x!(5-x)!}\frac{1.5^x \cdot 3^{5-x}}{4.5^5} }
第二項の指数部分を分割して
\frac{5!}{x!(5-x)!}\cdot \frac{1.5^x}{4.5^x}\cdot \frac{3^{5-x}}{4.5^{5-x}}
組み合わせの公式より
$$
{}_5 C_x (\frac{1.5}{4.5})^x (\frac{3}{4.5})^{5-x}
$$$Bin(5, 1/3)$ の二項分布に従う
平均:$np = 5\cdot 1/3 = 5/3$
-
-
問 5.5
-
(1)
$$
4/4+4/3+4/2+4/1 = 25/3
$$ -
(2)
$x$ :新たに購入を始めた場合
$$
25/3 + 5/1 = 40/3
$$$y$ :最初から5枚だった場合
$$
5/5+5/4+5/3+5/2+5/1 = 137/12
$$\displaylines{ x-y \\ = 40/3-137/12\\ = 160/12-137/12\\ = 23/12 }
-
6章 連続型分布と標本分布
例題
-
問 6.1
-
(1)
Aくん:70
Bくん:45 -
(2)
$Z$ 値が $-0.5〜2$ の間は
下側:0.3085
上側:0.0228
この間は$0.6687$ なので669人
-
(3)
標準正規分布のZ値が $0.25%$ の点は $0.675$ なので
$$
0.675\cdot 10\cdot 2 = 13.5
$$ -
(4)
0以上で積分するが、
確率密度の条件付き期待値を利用する
$$
E[Z|Z\geq 0]=\frac{\int^{\infty}_0 z f(z) dz}{P(Z\geq 0)}
$$$P(Z\geq 0)$ : $1/2$ より
$$
\frac{\int^{\infty}_0 x \cdot \frac{1}{\sqrt{2 \pi}} exp(\frac{-z^2}{2})}{1/2}\
= \frac{2}{\sqrt{2 \pi}}\int^{\infty}_0 z \cdot exp(- \frac{1}{2} z^2)\
$$ガウス積分を適応する
$\int^{\infty}_0 xe^{-ax^2} = \frac{1}{2a}$
$$
= \frac{2}{\sqrt{2 \pi}}\cdot \frac{1}{2 \cdot \frac{1}{2}}= 0.79...
$$標準偏差10と掛けて
$$
65+7.9..= 72.9..
$$- 参考:ガウス積分
https://manabitimes.jp/math/754
- 参考:ガウス積分
-
-
問 6.2
-
(1)
\displaylines{ V[X+Y] = V[X] + V[Y] + 2Cov[X,Y]\\ 相関係数=\frac{Cov[X,Y]}{\sqrt{V[X]} \sqrt{V[Y]}} }
より
\displaylines{ 150^2 = 80^2 + 90^2 +2Cov[Listening,Reading]\\ Cov[Listening,Reading]= (150^2-80^2-90^2)/2 =4000 }
$$
r = \frac{4000}{80 \cdot 90}\
= 0.5555...
$$ -
(2)
\displaylines{ 2変量正規分布の条件付き期待値= E[Y] + r[X,Y]\cdot \frac{\sqrt{V[Y]}}{\sqrt{V[X]}}(x - E[X])\\ 250 + 0.556 \cdot \frac{90}{80}(335- 305)= 268.8 }
-
-
問 6.3
-
(1)
生存関数について
$$
累積分布関数:F(t) = 1-S(t)
$$累積分布関数を微分すると確率密度関数を求められる
$$
F(t) = 1-exp(-\lambda t)
$$$$
F'(x) = f(x)\
= -(-\lambda)exp(-\lambda t)\ =\lambda \ exp(- \lambda t)
$$ -
(2)
-
期待値
期待値を求めるには以下の積分を求める必要がある
$$
\int^{\infty}_0 t \cdot \lambda \ exp(- \lambda t) dt\
$$$f(x) = t$
$G(x) = \int \lambda\ exp(-\lambda t) = \lambda /-\lambda exp(-\lambda t)=- exp(-\lambda t)$
部分積分の公式: $\int f(x)\ g(x) = f(x) G(x) - \int f'(x)\ G(x)$
より
\displaylines{ [t\cdot - exp(-\lambda t)]^\infty_0 - \int^\infty_0 -exp(-\lambda t)dt\\ = [t\cdot - exp(-\lambda t)]^\infty_0 + \int^\infty_0 exp(-\lambda t)dt\\ }
ここで
$$
[t\cdot - exp(-\lambda t)]^\infty_0\
= 0 - (-0\cdot 1)=0
$$\displaylines{ \int^\infty_0 exp(-\lambda t)dt\\ = [\frac{1}{-\lambda} exp(-\lambda t)]^\infty_0\\ = 0 - (-\frac{1}{\lambda})\\ = \frac{1}{\lambda} }
より期待値は
$$
\frac{1}{\lambda}
$$ -
上側25%点
$P(T>t) = 0.25$ を満たす $t$ を求める
すなわち $S(t) =exp(-\lambda t)= 0.25$ を満たす必要があるので
\displaylines{ ext(-\lambda t) = \frac{1}{4}\\ -\lambda t = log\ \frac{1}{4}\\ -\lambda t = log1 - log 4\\ -\lambda t = 0 - log 4\\ t = \frac{log 4}{\lambda} }
-
(3)
\displaylines{ \frac{1}{\lambda} = 3より\\ \lambda = \frac{1}{3}\\ \frac{log 4}{\lambda } = log4\cdot \frac{3}{1} \\ = 4.2年 }
-
-
問 6.4
-
(1)
Aさん:55
Bさん:40
-
(2)
文系の場合:
Z値は $-5/4=-1.25$ より
標準正規分布表より0.1056
理系の場合:
Z値は $-25/3 = 8.3333...$ より
全ての生徒が合格していると見てよい
よって
\displaylines{ \frac{300}{500}\cdot 0.105 +\frac{200}{500}\cdot 0.00= 0.06336\\ 1- 0.06336 = 0.9366... }
-
7章 極限定理,漸近理論
例
-
例1
$$
(X_1 + X_2 + ... X_n)/nはE[X_n]に収束する
$$確率密度関数:$\frac{1}{b-a}$ より積分して期待値を取得する
\displaylines{ \int^{1}_0 x \frac{1}{1-0}dx\\ = \frac{1}{1-0} \int^{1}_0 x\ dx\\ = [\frac{1}{2}x^2]^1_0 = \frac{1}{2}\\ }
上記に平方根を取って
$$
\sqrt{\frac{1}{2}}= \frac{1}{\sqrt{2}}
$$
-
例2
分布収束は以下で計算ができる$$
lim_{n→\infty}F_n(x) = G(x)
$$$Z = \frac{x- \mu}{\sigma}$より
$Z = \frac{x-0}{\sqrt{\frac{1}{n}}}= \sqrt{n}x$
このZ値と累積分布関数を利用して式変換する
累積分布関数
$$
\Phi(z)=\int^z_{-\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}dz\
$$この $\Phi(z)$ は0〜1の値を取り、
$\Phi(z) = \Phi(\sqrt{n}x)$ となる
$x\geq 0$ で$Z→\infty$
$x\leq0$ で$Z→0$に収束する
よって
$x\geq 0$ で1
$x\leq0$ で0に収束する
-
例3
こちらの解説記事がわかりやすいです
-
例4
デルタ法を用いる
-
デルタ法:
ある関数を $f$ を用いて $f(\bar{X_n})$ と表されてる量を考える
$f(x)$ が連続微分可能な時、$\sqrt{n}\big(f(\bar{X_n})-f(\mu)\big)$ は $N\big(0, f'(\mu)^2\sigma^2 \big)$ に収束する
$\sqrt{n} \big(\bar{X}_n^2 - \mu^2 \big)$ の収束分布を求める
$f(x) = x^2$ とすると
$$
Z = \sqrt{n}(\bar{X}^2 - \mu^2) = \sqrt{n}\big(f(\bar{X})- f(\mu)\big)
$$よりデルタ法を用いて
$$
N(0, f'(\mu)^2\sigma^2)\
= N(0, (2\mu)^2 \sigma^2)
$$となる
-
別解
テイラー展開の一次近似を用いて
$f(X)\approx f(\mu) + \frac{f'(\mu)}{1!}(X- \mu)$
↓変換して
$f(X)- f(\mu) = f'(\mu)(X - \mu)$より
$$
\sqrt{n}\big(f(\bar{X})- f(x)\big) = \sqrt{n}\big( f'(\mu)(\bar{X} - \mu) \big)\
$$中心極限定理 $\sqrt{n}(\bar{X}- \mu) \approx N(0, \sigma^2)$ より
$$
\sqrt{n}\big( f'(\mu)(\bar{X} - \mu) \big) \approx N(0,f'(\mu)^2 \sigma^2)
$$$f'(x) = 2x$ より $f'(\mu) = 2\mu$
よって $N(0,(2\mu)^2\sigma^2 )$ に収束する
-
-
例5
-
連続写像定理:
$X_n$ がある分布の確率変数 $X$ に収束し、$h$ の関数が連続とする時、
$h(X_n)$ は $h(X)$ に収束する
$X_n, Y_n$ がそれぞれ $X,Y$ に収束し、
$h(X), h(Y) = X^2, Y^2$ は連続のためそれぞれ自由度1の $X^2$ 分布に収束する
$X,Y$ は独立なので、
$h(X,Y) = X^2+ Y^2$ は自由度2の $X^2$ 分布に収束する -
例題
-
問 7.1
3がでたら成功、それ以外は失敗とする二項分布で近似する
期待値: $np = 30 \cdot \frac{1}{6} =5$
分散:$np (1-p) = 30 \cdot \frac{1}{6}\cdot (1- \frac{1}{6}) = \frac{25}{6}$
$Z$ 値を求めて正規分布表に当てはめて確率を近似する
ただし、有限修正項(0.5)を入れる
$$
Z = \frac{(10-0.5) - 5}{\sqrt{\frac{25}{6}}}\
= \frac{4.5}{\sqrt{\frac{25}{6}}} = 2.205..
$$正規分布表より、
0.0139..に近似される
-
問 7.2
中心極限定理より-
(1)
$$
\frac{\sqrt{n}(\bar{X} - \mu)}{\sigma} \approx \frac{1}{\sigma}N(0, \sigma^2)\
= N(0, (\frac{1}{\sigma})^2 \sigma^2)\
= N(0, 1)
$$ -
(2)
\displaylines{ g(x) = x^3として、\\ \sqrt{n}(g(\bar{X}_n) - g(\mu))\\ = N(0, g'(\mu)^2 \sigma^2)\\ = N(0, 9\mu^4 \sigma^2) }
-
(3)
(1)より $\frac{\sqrt{n}(\bar{X} - \mu)}{\sigma} = N(0,1)$
標準正規分布の二乗より $X^2$ 分布に収束する
-
8章 統計的推定の基礎
例
-
例1
- 点推定:パラメータを推定すること
- 推定量:パラメータを推定するための式や方法(f(x)など)
- 推定値:推定量に観測値を代入したもの
- 統計量:パラメータを含まずに標本データから算出する値
よって $\frac{1}{n}\sum^n_{i=1}(X_i - \mu)^2$ のみ統計量では無い
-
例2
独立に同一の正規分布 $N(\mu, v)$ に従う場合の尤度関数は $N(\mu, v)$ のときの確率密度関数の積と等しい
\displaylines{ L(\mu, v| X_1, X_2...X_n) = \prod^n_{i=1} f(X_i|\mu, v) }
確率密度関数は
$f(x|\mu, v) = \frac{1}{\sqrt{2\pi v}} \exp(- \frac{(x -\mu)^2}{2v})$ より\displaylines{ L(\mu, v| X_1, X_2...X_n) = \prod^n_{i=1}\frac{1}{\sqrt{2\pi v}} \exp(- \frac{(X_i -\mu)^2}{2v}) }
計算を簡単にするために対数を取る
確率密度関数の対数は
\displaylines{ \log f(x|\mu, v) = -\frac{1}{2} \log(2\pi v) - \frac{(x -\mu)^2}{2v} }
総和を取ると対数尤度関数となる
\displaylines{ \log L(\mu, v| X_1, X_2...X_n) = -\frac{n}{2} \log(2\pi v) - \frac{1}{2v}\sum^n_{i=1} (X_i - \mu)^2 }
上記を平均 $\mu$ 、分散 $v$ で微分する
- $\mu$ の微分
$\mu$ が付いている部分のみ微分=0とする
\displaylines{ \frac{\partial}{\partial \mu} \Big( \sum^n_{i=1}(X_i - \mu)^2 \Big)\\ = \sum^n_{i=1} 2(X_i - \mu)\cdot (-1)\\ =-2\sum^n_{i=1} (X_i - \mu) = 0\\ \sum^n_{i=1} (X_i - \mu) = 0\\ \sum^n_{i=1}X_i - \sum^n_{i=1}\mu = 0\\ \sum^n_{i=1}X_i - n\mu = 0\\ \mu = \frac{1}{n}\sum^n_{i=1}X_i }
よって標本平均となる
\displaylines{ \frac{\partial}{\partial v} \log L (\mu, v) = -\frac{n}{2}\log (2\pi v) - \frac{1}{2v}\sum^n_{i=1}(X_i - \mu)^2\\ = -\frac{n}{2v} -\frac{1}{2} \cdot (-\frac{1}{v^2})\sum^n_{i=1}(X_i - \mu)^2\\ = -\frac{n}{2v} + \frac{1}{2v^2}\sum^n_{i=1}(X_i - \mu)^2= 0 }
両辺に $2v^2$ を掛けて
\displaylines{ \frac{n}{2v}=\frac{1}{2v^2}\sum^n_{i=1}(X_i - \mu)^2\\ nv=\sum^n_{i=1}(X_i - \mu)^2\\ v = \frac{1}{n}\sum^n_{i=1}(X_i - \mu)^2 }
よって標本分散が最尤推定値となる
- $\mu$ の微分
-
例3
モーメントを利用する1次モーメント:$E[X]$で期待値を表し、確率分布の重心を表す
$$
\mu_1 = E[X]
$$2次モーメント:2次モーメント自体は$E[X^2]$だが、通常は中心化されたモーメント
$V[X] = E(X-E[X]^2)$を利用する$$
\mu_2 = E[(X-E[X])^2]
$$
$Ga(\alpha, \frac{1}{\lambda})$の平均と分散
$$
E[X] = \frac{\alpha}{\lambda}\
V[X] = \frac{\alpha}{\lambda^2}\
$$標本の1次、2次モーメントを計算
\displaylines{ \bar{X} = \frac{1}{n}\sum^n_{i=1} X_i\\ S^2 = \frac{1}{n} \sum^n_{i=1}(X_i - \bar{X})^2 }
モーメント法ではモーメントと標本モーメントを一致させる
1次モーメント
$$
\frac{\alpha}{\lambda} = \bar{X}
$$2次モーメント
$$
\frac{\alpha}{\lambda^2} = S^2
$$2つの連立方程式を解くと
\displaylines{ \alpha = \frac{\bar{X}^2}{S^2}\\ \lambda = \frac{\bar{X}}{S^2} }
-
例4
-
十分統計量:データの情報を失わずにパラメータを要約できる統計量
求め方
-
尤度関数を求める
$L(\theta|X) = \prod^n_{i=1} f(X_i|\theta)$
-
ネイマン・フィッシャーの分解定理を適用
\displaylines{ L(\theta|X) = g\big(T(X),\theta \big)h(X) }
- $g(T(X),\theta)$ :$\theta$ に依存し、 $T(X)$ が無いと計算できない関数
- $h(X)$ : $\theta$ に依存しない関数
この形に分解できる時、 $T(X)$ は十分統計量である
-
尤度関数
\displaylines{ L(\mu, \sigma^2|X) = \prod^n_{i=1} f(X_i|\mu, \sigma^2) = \prod^n_{i=1} \frac{1}{\sqrt{2\pi \sigma^2}} \exp\big( - \frac{(X - \mu)^2}{2\sigma^2} \big) }
計算すると
\displaylines{ = \big( \frac{1}{\sqrt{2\pi \sigma^2}}\big)^n \exp\big( - \frac{1}{2\sigma^2} \sum^n_{i=1} (X - \mu)^2 \big)\\ = \big( \frac{1}{\sqrt{2\pi \sigma^2}}\big)^n \exp(-\frac{n\mu^2 - 2\mu \sum^n_{i=1}x_i + \sum^n_{i=1} x_i^2}{2\sigma^2})\\ = \big( \frac{1}{\sqrt{2\pi \sigma^2}}\big)^n \exp \big( -\frac{n\mu^2}{2\sigma^2} +\frac{\mu \sum^n_{i=1}x_i}{\sigma^2} -\frac{\sum^n_{i=1}x^2_i}{2\sigma^2} \big) }
$= h(x) g(T(X), \theta)$ の形になっている
フィッシャーネイマンの分解定理を用いて導出する
\displaylines{ L(\mu, \sigma^2, X) = g(T(X), \mu, \sigma^2)\cdot h(X) }
- $T(X)$:十分統計量
- $g(T(X), \mu, \sigma^2)$:パラメータ$\mu, \sigma^2$に依存
- $h(X)$:$X$のみに依存
$\mu, \sigma^2$ が未知のとき、
$T_1 = \sum^n_{i=1} x_i$
$T_2 = \sum^n_{i=1} x_i^2$
とすると
\displaylines{ g(T_1, T_2; \mu, \sigma^2) = \left(\frac{1}{\sqrt{2\pi\sigma^2}}\right)^n \exp\left(-\frac{n\mu^2 - 2\mu T_1 + T_2}{2\sigma^2}\right) }
$h(x_1, x_2,...,x_n)=1$ のように表現でき、$\sum^n_{i=1} x_i, \sum^n_{i=1} x_i^2$ が十分統計量になる。
-
例題
-
問 8.1
-
◯:統計量は標本か既知のパタメータのみで表現されるので正しい
-
◯:順序統計量:標本を並べ替えただけのもの
- 並べ替えても尤度は同じになるので順序統計量も十分統計量となる
-
✗:標本分散の不偏推定量は$\frac{1}{n-1}$で割る必要があるので
-
◯:
- 正規分布の最尤推定量と不偏推定量は別の値
-
最尤推定量:真の母分散の期待値に一致しない(不偏性がない)が、サンプルサイズが大きくなると真の値に近づく(一致性)
$\frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2$
-
不偏推定量:少ないサンプルでも真の母分散の期待値と一致するように設計
$\frac{1}{n-1}\sum_{i=1}^n (x_i - \bar{x})^2$
-
- 正規分布の最尤推定量と不偏推定量は別の値
-
✗:最尤推定量は一致性と漸近有効性を持つ
- 標本分散 $\frac{1}{n-1}\sum_{i=1}^n (x_i - \bar{x})^2$ は一致推定量
- 漸近有効性:
- 一致性を持つ
- 標本サイズが無限に大きくなるとき、クラメール・ラオの不等式を満たす(分散が最小)
-
-
問 8.2
-
(1)
対数尤度関数を求める
\displaylines{ L(\lambda) = \prod^n_{i=1}\frac{\lambda^{x_i} e^{-\lambda}}{x_i !}\\ }
$\lambda$ が関わらない $x_i!$ を除外する
\displaylines{ = \prod^n_{i=1}\lambda^{x_i} e^{-\lambda}\\ }
対数を取る
\displaylines{ = \log\ \lambda^{\sum^n_{i=1}x_i} + \log\ e^{-\lambda \cdot n}\\ = \sum^n_{i=1}x_i \cdot \log\ \lambda -n \lambda }
$\lambda$ で微分して $=0$ とする
\displaylines{ -n +\frac{\sum^n_{i=1}x_i}{\lambda } = 0\\ \lambda = \frac{\sum^n_{i=1}x_i}{n} }
よって$x$の平均となる
-
(2)
フィッシャー情報量について
スコア関数:対数尤度を偏微分したもの
\displaylines{ S = \frac{\partial}{\partial \theta} \log\ L(\theta|x) }
フィッシャー情報量$I(\lambda)$:
- スコア関数の分散(スコア関数の期待値は0):$V\big[\frac{\partial}{\partial \theta} L(\theta|x) \big]$
- 対数尤度関数の2回微分した期待値の負:$-E\big[ \frac{\partial^2}{\partial \theta^2} \log\ L(\theta|x) \big]$
対数尤度を2回微分した値は
1回微分した結果: $-n +\sum^n_{i=1}x_i \ \cdot \lambda^{-1}$
2回微分した結果:$-1\cdot \sum^n_{i=1}x_i\cdot \lambda^{-2}= -\sum^n_{i=1}x_i\cdot \lambda^{-2}$
$-E\big[ \frac{\partial^2}{\partial \theta^2} \log\ L(\theta|x) \big]$を計算する
\displaylines{ -E\big[ \frac{\partial^2}{\partial \theta^2} \log\ L(\theta|x) \big]\\ = -E[-\sum^n_{i=1}x_i\cdot \lambda^{-2}]\\ = E[\frac{\sum^n_{i=1}x_i}{ \lambda^{-2}}]\\ = \sum^n_{i=1}E[\frac{x_i}{\lambda^{-2}}]\\ = \sum^n_{i=1}\frac{E[x_i]}{\lambda^{-2}}\\ }
ポアソン分布の $E[x_i]$ は $\lambda$ なので
\displaylines{ = \sum^n_{i=1}\frac{\lambda}{\lambda^{-2}}\\= \frac{n\lambda}{\lambda^2}= \frac{n}{\lambda} }
-
(3)
クラメール・ラオの不等式$V[\lambda] \ge \frac{1}{I(\lambda)}$ を満たせば有効推定量といえる
1より標本平均が最尤推定量となり、平均$\lambda$の不偏推定量となる
\displaylines{ V[\lambda] = V[\frac{\sum^n_{i=1} x_i}{n}]=\frac{1}{n^2} \sum^n_{i=1} V[x_i]\\ V[x_i] = \lambdaより\\ = \frac{1}{n^2} n\lambda= \frac{\lambda}{n} }
\displaylines{ V[\lambda] \ge \frac{1}{I(\lambda)}\\ \frac{n}{\lambda} = \frac{n}{\lambda} }
となるため、最尤推定量$\frac{\sum^n_{i=1}x_i}{n}$は有効推定量である
-
(4)
-
漸近正規性:サンプルサイズが無限に$\infty$
$\hat{\lambda}\sqrt{n}(\hat{\lambda} - \lambda)→N(0, V(\hat{\lambda}))$の正規分布に収束する
最尤推定量は(1)より $\hat{\lambda} = \sum^n_{i=1}x_i/n =\bar{X}$
これより中心極限定理を適応して以下に収束する
\displaylines{ \sqrt{n}(\bar{X}- \lambda) →N(0, \lambda) }
よってこの最尤推定量は漸近正規性がある
-
漸近有効性:最尤推定量 $\hat{\lambda}$ の分散がクラメール・ラオの不等式の下限に一致する場合、最尤推定量は漸近有効である
(3)よりフィッシャー情報量$I(\lambda) = \frac{\lambda}{n}$ より、サンプルサイズが$\infty$ となるとき、$\lambda$ となる
漸近正規性より分散は$\lambda$ と一致しているので、漸近有効性が示される
-
* 問 8.3-
(1)
バイアス:$b(\theta)= E[\hat{\theta}] - \theta$
-
$T_1$ のバイアス $b_1(\mu, \sigma^2)$
$T_1 = \bar{X}^2$ より
\displaylines{ b_1(\mu, \sigma^2) = E[T_1]- \mu^2 }
$T_1 = \bar{X}^2$ 、$V[X] = E[X^2] - (E[X])^2$より
\displaylines{ E[T_1] = E[\bar{X}^2] = V[\bar{X}]+(E[X])^2\\ \bar{X} = \frac{1}{n}\sum^n_{i=1} x_i, \ \mu ,\ \sigma^2より\\ = \frac{1}{n^2} \cdot \sum^n_{i=1} V[ x_i] + \mu^2\\ = \frac{1}{n^2}\cdot n \cdot \sigma^2 + \mu^2\\ = \frac{\sigma^2}{n}+\mu^2 }
\displaylines{ b_1(\mu, \sigma_2)= E[T_1] - \mu^2\\ = \frac{\sigma^2}{n}+\mu^2- \mu^2\\ = \frac{\sigma^2}{n} }
-
$T_2$ のバイアス $b_2(\mu, \sigma^2)$
$T_2= \frac{1}{n}\sum^n_{i=1}X_i^2$、$V[X] = E[X^2] - (E[X])^2$より
\displaylines{ E[T_2] = E[\frac{1}{n}\sum^n_{i=1}X_i^2]= \frac{1}{n}\sum^n_{i=1} E[X_i^2]\\ = E[X^2]\\ V[X] = E[X^2] - (E[X])^2より\\ = V[X]+(E[X])^2\\ = \sigma^2 + \mu^2 }
\displaylines{ b_2(\mu, \sigma^2)= E[T_2] - \frac{1}{n}\cdot n\cdot \mu^2\\ = \sigma^2 + \mu^2 - \mu^2 = \sigma^2 }
-
-
(2)
コインの半径から求めた面積の平均を求めることは$\frac{1}{n}\sum^n_{i=1}\pi r^2 = \pi\frac{1}{n}r^2$ になる
こちらは(1)の$T_2$ のバイアスを求めることの$\pi$ 倍に等しいため、$\pi \sigma^2$ となる
こちらは$n$ を増やしてもバイアスが減ることは無いので、問題である
-
(3)
$\tilde{T} = \bar{X}^2 -b(\bar{X}, U)$を用いて$\pi r^2$ のバイアス補正推定値を求める
ここで$U$ は不偏分散
$r^2= \tilde{T}$ 、(1)より$b(\bar{X}, U) = \frac{U}{n}$ なので
面積$\pi r^2 = \pi \cdot \tilde{T}= \pi\cdot (\bar{X}^2 - \frac{U}{n})$
\displaylines{ \bar{X}= \frac{1}{5}(8.4+9.0+8.2+10.4+9.2)= 9.04\\ U = \frac{1}{5-1}\sum(X_i - 9.04)^2=0.748\\ \pi r^2 = 3.14 \cdot (9.04^2 - \frac{0.748}{5})\\ = 3.14\cdot (81.7216 -0.1496)= 256.14... }
-
(4)
ジャックナイフ推定量は一つを除いてそれぞれ計算し、平均を計算する
\displaylines{ T_1 = 9.2\\ T_2 = 9.05\\ T_3 = 9.25\\ T_4 = 8.7\\ T_5 = 9\\ \frac{1}{5}\sum_{i=1}^5 T_i\\ = 9.04\\ \pi r^2= 3.14 \cdot 9.04^2 = 256.6.. }
-
(5)
$\bar{X}^2$ は$\mu^2$ を推定するので$g(x) = x^2$ を適応してテイラー展開で1次近似を以下のように変換して近似できる
\displaylines{ g(\bar{X}) = g(\mu) + g'(\mu)(\bar{X} - \mu)\\ g(\bar{X})- g(\mu) = g'(\mu)(\bar{X} - \mu)\\ \bar{X}^2 - \mu^2 = 2\mu \cdot (\bar{X} - \mu) }
上記が無限に増えた場合、中心極限定理
\displaylines{ \sqrt{n}(\bar{X}- \mu) → N(0, \sigma^2) }
より
\displaylines{ \sqrt{n}\cdot 2\mu \cdot(\bar{X} - \mu)\\ =2\mu \big( \sqrt{n} (\bar{X} - \mu) \big)\\ こちらは以下に近似できる\\ 2\mu \big( \sqrt{n} (\bar{X} - \mu) \big)\approx N(0, (2\mu)^2 \sigma^2)\\ N(0, 4\mu^2\sigma^2)\\ }
よって分散は$4\mu^2\sigma^2$ となる。
-
9章 区間推定
例題
-
問 9.1
-
(1)
二項分布の標準偏差 $\sqrt{\frac{p(1-p)}{n}}$より
\displaylines{ 0.43\pm 1.96\sqrt{\frac{p(1-p)}{n}}\\ = 0.43\pm 1.96\sqrt{\frac{0.43(1-0.43)}{n}}\\ = 0.43\pm 0.02744..\\ 0.403.. 〜 0.457.. }
-
(2)
信頼区間幅 $\pm 1.96 \sqrt{\frac{p(1-p)}{n}}$ より
\displaylines{ 2(1.96 \sqrt{\frac{0.24}{n}})=0.02\\ \sqrt{n} = \frac{2\cdot 1.96 \cdot \sqrt{0.24}}{0.02}\\ n = 96.01^2\\ = 9218.84.. }
-
-
問 9.2
-
(1)
標準偏差 $\sqrt{\frac{p(1-p)}{n}}$より
\displaylines{ 0.262 \pm 1.96 \frac{\sqrt{0.262(1-0.262)}}{917}\\ 0.262 \pm 0.02846\\ 0.2335 〜 0.2904 }
-
(2)
多項分布の差の分散は
$V[p_1 - p_2] = \frac{p_1(1-p_1)}{n} + \frac{p_2(1-p_2)}{n} -2 \cdot \frac{-p_1 p_2}{n}$ より
$p_1 - p_2$ の信頼区間
\displaylines{ 0.262 - 0.08 \pm 1.96 \sqrt{\frac{0.262(1-0.262)}{917}+\frac{0.08(1-0.08)}{917}-2\cdot \frac{- 0.262 \cdot 0.08}{917}}\\ = 0.182 \pm 1.96 \sqrt{0.000210857 + 0.000080261 + 0.000045714}\\ = 0.182 \pm 1.96 \cdot 0.01835\\ 0.1460 〜 0.2180 }
-
10章 検定の基礎と検定法の導出
例題
-
問 10.1
検出力:$1- \beta$
\displaylines{ 0.45の場合の標準偏差\\ \frac{0.45 \cdot 0.55}{\sqrt{\frac{0.45 \cdot 0.55}{600}}}\\ = 0.02031... }
0.45の場合の上側95%信頼区間は
\displaylines{ 0.45 + 1.96 \cdot 0.02031 = 0.4898 }
0.5の標準偏差
\displaylines{ \frac{0.5 \cdot 0.5}{\sqrt{\frac{0.5 \cdot 0.5}{600}}}\\= 0.02041... }
0.4898のZ値は
\displaylines{ \frac{(0.4898 - 0.5)}{0.02041}\\ = 0.4997... }
標準正規分布表によると
0.308538となるので
\displaylines{ 1- 0.308538 = 0.691462 }
検出力:0.6914
-
(2)
検出力が0.8にするにはZ値が0.85以上にする必要があるので
\displaylines{ 1.96 \cdot \sqrt{\frac{0.45\cdot 0.55}{n}}+0.45 = -0.84 \cdot \sqrt{\frac{0.5 \cdot 0.5}{n}} + 0.5\\ または\\ \frac{1.96 \cdot \sqrt{\frac{0.45\cdot 0.55}{n}}+0.45 - 0.5}{\sqrt{\frac{0.5 \cdot 0.5}{n}}} = -0.84 }
となる
こちらを計算すると
$n = 778.51$
となる
-
-
問 10.2
-
(1)
分散の信頼区間はカイ二乗分布を用いる
カイ二乗統計量は$\frac{(n-1)U^2}{\sigma^2}$より信頼区間は以下となる
\displaylines{ X^2_{0.025}(n-1) < \frac{(n-1)U^2}{\sigma^2} < X^2_{0.975}(n-1) }
偏差平方和$T_2=100$より
\displaylines{ 27.488 < \frac{(16-1)\cdot \frac{100}{16-1}}{\sigma^2} < 6.262\\ \frac{100}{27.488}< \sigma^2 < \frac{100}{6.262}\\ 3.637..< \sigma^2 < 15.969.. }
-
(2)
F分布検定の問題
帰無仮説:$\sigma^2_A = \sigma^2_B$
対立仮説:$\sigma^2_A > \sigma^2_B$
2つの分散を対比してF統計量を作成する(分散を大きい方を分母にする)
$F = \frac{U_B}{U_A}$
\displaylines{ F = \frac{\frac{300}{15}}{\frac{100}{15}} = 3 }
上記は自由度(16-1, 16-1)のF分布に従う
この場合の片側5%点は2.403なので棄却する
-
-
問 10.3
抜き取り調査
-
(1)
表のそれぞれに入る計算方法は
${}_nC_r\cdot p^r \cdot (1-p)^{n-r}$ となる
例)$p=0.1, r=1$
\displaylines{ {}_5C_1 \cdot 0.1^1 \cdot (1-0.1)^4\\ \frac{5!}{1! \cdot 4!} \cdot 0.1 \cdot 0.9^4\\ = 0.328.. }
ア:0.168
イ:0.360
ウ:0.308
-
(2)
不良品率が0.1の場合の生産者危険
期待値的には合格なのに偶然不良品が多く出て不合格となる確率
$p=0.1$の場合は$r=2$以上の確率なので$0.08$
不良品率が0.2の場合の消費者危険
期待値的には不合格なのに偶然不良品が少なく合格になってしまう確率
$p=0.2$の場合は不良品が$1$以下の確率なので$0.74$
-
おわりに
いかがでしたでしょうか。
つたない記述もあったかもしれないですが、ご容赦いただけるとありがたいです。
11〜32章についても改めてまとめる予定なので今しばらくお待ち下さい!