はじめに
- 問4は実験計画法に関する出題だったが、理解するための手掛かりが全く掴めないため除外。
- 公式の略解 2018年11月25日試験(http://www.toukei-kentei.jp/pt/pt-5956/#seikai)
問1
生産ラインで不良が生じる時間間隔$X$がパラメータ$\lambda$の指数分布に従うとする。
$X$の確率密度関数は以下で与えられる。
\begin{align*}
f(x)=\begin{cases}
\lambda e^{-\lambda x}&(x\ge0)\\
\hfil 0&(x<0)
\end{cases}
\end{align*}
[1]指数分布の累積分布関数$F(x)$およびモーメント母関数$M_X(\theta)=E[e^{\theta X}]$を求めよ。
解答例
\begin{align*}
F(x)&=\int_0^x \lambda\exp(-\lambda u)d u=\left[-\exp(-\lambda u)\right]_0^x
=1-\exp(-\lambda x)\\
M_X(\theta)&=E[e^{\theta X}]=\int_0^\infty \lambda\exp(-(\lambda-\theta)x)d x\\
&=\left[-\frac{\lambda}{\lambda-\theta}\exp(-(\lambda-\theta)x)\right]_0^\infty
=\frac{\lambda}{\lambda-\theta}=(1-\lambda^{-1}\theta)^{-1}\
\end{align*}
[2]生産ラインの稼働開始から$n$個の不良品が生じるまでの時間を$W_n=X_1+\cdots+X_n$とする。
$X_1,\dots,X_n$が互いに独立にパラメータ$\lambda$の指数分布に従うとき、$W_n$の確率密度関数は以下となることを示せ。
\begin{align*}
g_n(w)&=\begin{cases}
\frac{\lambda^nw^{n-1}e^{-\lambda w}}{(n-1)!}&(w\ge0)\\
\hfil 0&(w<0)
\end{cases}
\end{align*}
またこの分布のモーメント母関数$M_W(\theta)=E[e^{\theta W}]$を求めよ。
解答例
\begin{align*}
M_W(\theta)&=M_X(\theta)^n=(1-\lambda^{-1}\theta)^{-n}\\
g_n(w)&=\frac{\lambda^n}{\Gamma(n)}w^{n-1}\exp(-\lambda w)
\end{align*}
[3]$U$を区間(0,1)上の一様分布に従う確率変数としたとき、$X=-\lambda^{-1}\log U$はパラメータ$\lambda$の指数分布に従うことを示せ。
解答例
\begin{align*}
\Pr(X\le x)&=\Pr(-\lambda^{-1}\log U\le x)\\
&=\Pr(U\ge\exp(-\lambda x))=1-\exp(-\lambda x)
\end{align*}
[4]不良品の生じる確率を$p$とする。良品・不良品の生起が独立であるとき、
生産ラインの稼働開始から初めて不良品が生じるまでの良品の個数$Y$は
パラメータ$p$の幾何分布に従い、確率関数は以下で与えられる。
\begin{align*}
g(y)=\Pr(Y=y)=p(1-p)^y\quad(y=0,1,2,\dots)
\end{align*}
$X$をパラメータ$\lambda=-\log(1-p)\ $の指数分布に従う確率変数としたとき、その整数部分、
すなわち$X$を超えない最大の整数を$Y$とすると、$Y$はパラメータ$p$の幾何分布に従うことを示せ。
解答例
\begin{align*}
\Pr(Y=y)&=\Pr(y\le X < y+1)=\int_y^{y+1}\lambda\exp(-\lambda x)d x\\
&=[-\exp(-\lambda x)]_y^{y+1}=\exp(-\lambda y)-\exp(-\lambda (y+1))\\
&=(1-p)^y-(1-p)^{y+1}=p(1-p)^y
\end{align*}
[5]互いに独立に区間(0,1)上の一様分布に従う確率変数の列を$U_1,U_2,\dots$としたとき、
それらを順にかけ合わせて初めて$e^{-\lambda}$より小さくなったときの一つ手前の個数を$M\ $とする。
\begin{align*}
U_1 \times \cdots \times U_m &>e^{-\lambda}>U_1 \times \cdots \times U_m \times U_{m+1}
\rightarrow M=m
\end{align*}
$M$はパラメータ$\lambda$のポアソン分布に従うことを示せ。
パラメータ$\lambda$のポアソン分布の確率関数は以下で与えられる。
\begin{align*}
p(m)&=\frac{\lambda^m}{m!}e^{-\lambda}\quad(m=0,1,2,\dots)
\end{align*}
また、ある事象の生じる時間間隔が互いに独立にパラメータ$\lambda$の指数分布に従うとき、
時刻$0$から$T\ $までの間に生じた事象の生起回数$N$はパラメータ$\lambda T$のポアソン分布に従うことを
証明なしに用いてもよい。
解答例
\begin{align*}
X_i&=-\log U_i\sim Exp(1)\\
X_1+\cdots+X_m&<\lambda<X_1+\cdots+X_m+X_{m+1}\\
p(n)&=\frac{(\lambda T)^n}{n!}e^{-\lambda T}\quad
n\rightarrow m,\lambda\rightarrow 1,T\rightarrow \lambda\ \\
p(m)&=\frac{\lambda^m}{m!}e^{-\lambda}
\end{align*}
問2
形状パラメータ$m>0$と尺度パラメータ$\eta>0$を持つワイブル分布$W(m,\eta)$の累積分布関数は以下で与えられる。
\begin{align*}
F(x)=\begin{cases}
1-\exp[1-(x/\eta)^m]&(x\ge0)\ \\
\hfil 0&(x<0)
\end{cases}
\end{align*}
[1]$W(m,\eta)$の確率密度関数$f(x)$および最頻値を求め、$W(2,10)$および$W(2,5)$の確率密度関数の概形を図示せよ。
解答例
\begin{align*}
f(x)&=\frac{d}{d x}F(x)=\frac{m}{\eta}\left(\frac{x}{\eta}\right)^{m-1}
\exp\left[-\left(\frac{x}{\eta}\right)^m\right]\\
\frac{d}{d x}\log f(x)&=\frac{m-1}{x}-\frac{m}{\eta}\left(\frac{x}{\eta}\right)^{m-1}=0\\
x_M&=\eta\left(\frac{m-1}{m}\right)^{\frac{1}{m}}
\end{align*}
[2]$W(m,\eta)$のハザード関数$h(x)=\frac{f(x)}{1-F(x)}$を求め、$m$の値による関数$h(x)$の特徴について論ぜよ。
解答例
\begin{align*}
h(x)&=\frac{f(x)}{1-F(x)}=\frac{m}{\eta}\left(\frac{x}{\eta}\right)^{m-1}
\end{align*}
[3]$k$個の部品からなる直列システムにおいて、各部品の寿命は互いに独立に$W(m,\eta)$に従うとする。
このシステムは$k$個の部品の一つでも壊れると稼働を停止する。
このシステムの稼働停止までの寿命がどのような分布に従うかを示せ。
解答例
\begin{align*}
\Pr(Y>y)&=\prod_{i=1}^k\Pr(X_i>y)=(1-F(y))^k
=\exp\left[-k\left(\frac{y}{\eta}\right)^m\right] \\\
&=\exp\left[-\left(\frac{y}{\eta'}\right)^m\right]
\quad(\eta'=\eta k^{-\frac{1}{m}})
\end{align*}
[4]ある部品Aの強度を表す確率変数を$X$とし、部品Aが受けるストレスを表す確率変数を$Y$とする。
$X$と$Y$は互いに独立で、それぞれ$W(2,10)$および$W(2,5)$に従うとする。
部品Aは$X<Y$のとき壊れるとしたとき、部品Aが壊れる確率を求めよ。
解答例
\begin{align*}
F_X(x)&=1-\exp[-(x/\eta_X)^m]\\
F_Y(y)&=1-\exp[-(y/\eta_Y)^m]\\
\Pr(X<Y)&=E_Y[\Pr(X<y)]=E_Y[F_X(Y)]\\
&=\int_0^\infty\left\{1-\exp\left[-\left(\frac{y}{\eta_X}\right)^m\right]\right\}
m\frac{y^{m-1}}{\eta_Y^m}
\exp\left[-\left(\frac{y}{\eta_Y}\right)^m\right]d y\\
&=1-\int_0^\infty m\frac{y^{m-1}}{\eta_Y^m}
\exp\left[-y^m\left(\frac{1}{\eta_X^m}+\frac{1}{\eta_Y^m}\right)\right]d y\\
&=1-\frac{1}{\eta_Y^m}\frac{1}{\frac{1}{\eta_X^m}+\frac{1}{\eta_Y^m}}
=\frac{\eta_Y^m}{\eta_X^m+\eta_Y^m}=\frac{5^2}{10^2+5^2}=0.2
\end{align*}
[5]寿命が互いに独立に$W(m,\eta)$に従うような$n$個の部品につき、
それぞれ独立に寿命試験を行い、観測値$x_1,\dots,x_n$を得たとする。
これらの観測値に基づく$W(m,\eta)$のパラメータ$m$および$\eta$の対数尤度関数を示せ。
また$\log\log\frac{1}{1-F(x)}$を求め、これを用いてパラメータを推定する方法について論ぜよ。
解答例
\begin{align*}
l(m,\eta)&=n\log\frac{m}{\eta}+(m-1)\sum_{i=1}^n\log \frac{x_i}{\eta}
-\sum_{i=1}^n\left(\frac{x_i}{\eta}\right)^m\\
\log\log\frac{1}{1-F(x)}&=m\log x-m\log\eta
\end{align*}
問3
正の値を取る確率変数$X$を自然対数で変換した$\log X$が$N(\mu,\sigma^2)$に従うとき、
$X$は対数正規分布に従うといい、$X\sim LN(\mu,\sigma^2)$と書く。確率密度関数は以下で与えられる。
\begin{align*}
f(x)=\frac{1}{\sqrt{2\pi}\sigma}\frac{1}{x}
\exp\left[-\frac{(\log x-\mu)^2}{2\sigma^2}\right]
\end{align*}
[1]$X\sim LN(\mu,\sigma^2)$のとき、$X$の期待値、中央値、最頻値をそれぞれ求め、大小関係を示せ。
解答例
\begin{align*}
E[X]&=\int_0^\infty \frac{x}{\sqrt{2\pi}\sigma}\frac{1}{x}
\exp\left[-\frac{(\log x-\mu)^2}{2\sigma^2}\right]d x\\
&\log x-\mu=y,x=\exp(y+\mu)\\
&=\int_{-\infty}^\infty \frac{1}{\sqrt{2\pi}\sigma}
\exp\left[-\frac{y^2}{2\sigma^2}+y+\mu\right]d y
=\exp\left[\mu+\frac{\sigma^2}{2}\right]\\
\frac{1}{2}&=\int_0^m \frac{1}{\sqrt{2\pi}\sigma}\frac{1}{x}
\exp\left[-\frac{(\log x-\mu)^2}{2\sigma^2}\right]d x\\
&=\int_{-\infty}^{\log m-\mu} \frac{1}{\sqrt{2\pi}\sigma}
\exp\left[-\frac{y^2}{2\sigma^2}\right]d y\rightarrow
\mathrm{Median}=\exp \mu\\
\frac{d}{d x}\log f(x)&=-\frac{1}{x}-\frac{\log x-\mu}{\sigma^2}\frac{1}{x}=0
\rightarrow\mathrm{Mode}=\exp(\mu-\sigma^2)\\
\mathrm{Mode}&\le \mathrm{Median} \le E[X]
\end{align*}
[2]$LN(\mu,\sigma^2)$からの$n$個の互いに独立な観測値を$x_1,\dots,x_n$としたとき、$\mu$の最尤推定量を導出せよ。
解答例
\begin{align*}
\frac{d}{d \mu}\log \prod_{i=1}^n f(x_i)&
=\sum_{i=1}^n \frac{\log x_i -\mu}{\sigma^2}=0\ \\
\hat{\mu}&=\frac{1}{n}\sum_{i=1}^n\log x_i
\end{align*}
[3]ベイズ流の推測において、$\sigma^2$は既知として$\mu$の事前分布を$N(\nu,\tau^2)$とする。
$LN(\mu,\sigma^2)$からの$n$個の互いに独立な観測値を$x_1,\dots,x_n$としたときの$\mu$の事後分布を導出せよ。
解答例
\begin{align*}
f(\mu)&\sim \exp\left[-\sum_{i=1}^n\frac{(\log x_i-\mu)^2}{2\sigma^2}\right]
\exp\left[-\frac{(\mu-\nu)^2}{2\tau^2}\right]\\
&\sim\exp\left[-\frac{n}{2\sigma^2}\mu^2-\frac{1}{2\tau^2}\mu^2
+\sum_{i=1}^n\frac{\log x_i}{\sigma^2}\mu
+\frac{\nu}{\tau^2}\mu\right]\\
E[\mu]&=\left(\sum_{i=1}^n\frac{\log x_i}{\sigma^2}+\frac{\nu}{\tau^2}\right)
\left(\frac{n}{\sigma^2}+\frac{1}{\tau^2}\right)^{-1}\\
V[\mu]&=\left(\frac{n}{\sigma^2}+\frac{1}{\tau^2}\right)^{-1}
\end{align*}
ある電子部品Dについて、それぞれ独立に寿命試験を行い、
$n=10,\bar{x}=2327.5,\frac{1}{n}\sum_{i=1}^n\log x_i=7.72$を得た。なお$\sigma^2=0.25^2$は既知とする。
[4]上問[2]で導出した$\mu$の最尤推定量$\hat{\mu}$を元に、上問[1]の結果を用いて$X$の期待値、中央値、最頻値の推定量をそれぞれ求めよ。
解答例
\begin{align*}
\hat{\mu}&=\frac{1}{n}\sum_{i=1}^n\log x_i=7.72\\
E[X]&=\exp\left[7.72+\frac{0.25^2}{2}\right]=2324.476\\
\mathrm{Median}&=\exp\left[7.72\right]=2252.96\\
\mathrm{Mode}&=\exp\left[7.72-0.25^2\right]=2116.46
\end{align*}
[5]ベイズ流の推測において、$\mu$の事前分布を$N(8,0.5^2)$とする。上問[3]の結果を用いて$\mu$の事後期待値を求めよ。
解答例
\begin{align*}
E[\mu]&=\left(\frac{77.2}{0.25^2}+\frac{8}{0.5^2}\right)
\left(\frac{10}{0.25^2}+\frac{1}{0.5^2}\right)^{-1}=7.7268
\end{align*}
[6]$X$の期待値の推定値としては$x_1,\dots,x_n$の標本平均$\bar{x}=\frac{1}{n}\sum_{i=1}^nx_i$が考えられる。
上問[4]で求めた期待値の推定量と標本平均$\bar{x}$をそれぞれ推定量(確率変数)と見たときの、
それらの推定量の統計的な特徴について述べよ。
解答例
\begin{align*}
E[X_i^2]&=\int_0^\infty \frac{x}{\sqrt{2\pi}\sigma}
\exp\left[-\frac{(\log x-\mu)^2}{2\sigma^2}\right]d x\\
&\log x-\mu=y,x=\exp(y+\mu)\\
&=\int_{-\infty}^\infty \frac{1}{\sqrt{2\pi}\sigma}
\exp\left[-\frac{y^2}{2\sigma^2}+2y+2\mu\right]d y\\
&=\exp\left[2\mu+2\sigma^2\right]\\
V[X_i]&=\exp\left[2\mu+2\sigma^2\right]-\exp\left[2\mu+\sigma^2\right]
=\exp\left[2\mu+\sigma^2\right](\exp\sigma^2-1)\\
T_1(X)&=\frac{1}{n}\sum X_i\\
V[\sqrt{n}T_1(X)]&=\exp\left[2\mu+\sigma^2\right](\exp\sigma^2-1)\\
T_2(X)&=\exp\left[\frac{1}{n}\sum \log X_i+\frac{\sigma^2}{2}\right]\\
E[\log T_2(X)]&=\mu+\frac{\sigma^2}{2}\\
V[\sqrt{n}\log T_2(X)]&=\sigma^2,
\quad g(x)=e^x,g'(x)=e^x\quad\text{Delta method}\\
V[\sqrt{n}T_2(X)]&=g'\left(\mu+\frac{\sigma^2}{2}\right)^2V[\sqrt{n}\log T_2(X)]
=\exp\left[2\mu+\sigma^2\right]\sigma^2\quad(n\to\infty)\ \\
V[\sqrt{n}T_1(X)]&\ge V[\sqrt{n}T_2(X)]\quad(n\to\infty)\quad\text{Asymptotic Variance}
\end{align*}
問5
母集団全体の分布Fは、分散は等しいが平均は異なる正規分布$N(\mu_1,\sigma^2)$と$N(\mu_2,\sigma^2)$の
混合率1/2ずつの混合であるとする。分布Fの確率密度関数は以下で与えられる。
\begin{align*}
f(x)&=\frac{1}{2}\{f_1(x)+f_2(x)\}\\
f_j(x)&=\frac{1}{\sqrt{2\pi}\sigma}\exp\left[-\frac{(x-\mu_j)^2}{2\sigma^2}\right](j=1,2)
\end{align*}
[1]分布Fに従う確率変数$X$の期待値$\xi$と分散$\tau^2$を求めよ。
解答例
\begin{align*}
f(x)&=\frac{1}{2\sqrt{2\pi}\sigma}
\left\{\exp\left[-\frac{(x-\mu_1)^2}{2\sigma^2}\right]
+\exp\left[-\frac{(x-\mu_2)^2}{2\sigma^2}\right]\right\}\\
E[X]&=\frac{\mu_1+\mu_2}{2},
E[X^2]=\sigma^2+\frac{\mu_1^2+\mu_2^2}{2}\\
V[X]&=\sigma^2+\frac{\mu_1^2+\mu_2^2}{2}
-\left(\frac{\mu_1+\mu_2}{2}\right)^2
=\sigma^2+\left(\frac{\mu_1-\mu_2}{2}\right)^2
\end{align*}
[2]以下の表から、Aクラス全体のデータを$x_i(i=1,\dots,100)$としたときの平均$\bar{x}$と標準偏差$s$を求めよ。
ここで$\bar{x}=\frac{1}{100}\sum_{i=1}^{100}x_i,s^2=\frac{1}{100}\sum_{i=1}^{100}(x_i-\bar{x})^2\ $とする。
表中の標準偏差は除数を50とした標本分散の正の平方根である。
Aクラス | Aクラス | Bクラス | Bクラス | |
---|---|---|---|---|
統計量 | 数学選択 | 数学非選択 | 数学選択 | 数学非選択 |
人数 | 50 | 50 | 50 | 50 |
平均 | 69.7 | 49.6 | 67.6 | 53.8 |
標準偏差 | 6.8 | 7.8 | 7.7 | 8.7 |
解答例
\begin{align*}
\bar{x}&=\frac{50\times 69.7+50\times 49.6}{100}=59.65\\
s^2&=\frac{50\cdot 6.8^2+50\cdot(69.7-59.65)^2
+50\cdot 7.8^2+50\cdot(49.6-59.65)^2}{100}\\
s&=12.431512
\end{align*}
[3]確率密度関数$f(x)$の一次導関数および二次導関数を求めよ、また$x=\xi$は$f(x)$の極値を与えることを示せ。
解答例
\begin{align*}
f'(x)&=\frac{1}{2\sqrt{2\pi}\sigma}
\left\{-\frac{x-\mu_1}{\sigma^2}\exp\left[-\frac{(x-\mu_1)^2}{2\sigma^2}\right]
-\frac{x-\mu_2}{\sigma^2}\exp\left[-\frac{(x-\mu_2)^2}{2\sigma^2}\right]\right\}\\
f''(x)&=\frac{1}{2\sqrt{2\pi}\sigma}
\left\{\left(\frac{(x-\mu_1)^2}{\sigma^4}-\frac{1}{\sigma^2}\right)
\exp\left[-\frac{(x-\mu_1)^2}{2\sigma^2}\right]\right.\\
&\left.\quad+\left(\frac{(x-\mu_2)^2}{\sigma^4}-\frac{1}{\sigma^2}\right)
\exp\left[-\frac{(x-\mu_2)^2}{2\sigma^2}\right]\right\}\\
f'\left(\frac{\mu_1+\mu_2}{2}\right)&=\frac{1}{2\sqrt{2\pi}\sigma}
\left\{\frac{\mu_1-\mu_2}{2\sigma^2}\exp\left[-\frac{(\mu_1-\mu_2)^2}{8\sigma^2}\right]
-\frac{\mu_1-\mu_2}{2\sigma^2}\exp\left[-\frac{(\mu_1-\mu_2)^2}{8\sigma^2}\right]\right\}\\
&=0
\end{align*}
[4]分布Fがふた山型(二峰性)を示すための$\mu_1,\mu_2,\sigma$の条件を求めよ。
解答例
\begin{align*}
f''\left(\frac{\mu_1+\mu_2}{2}\right)&=\frac{1}{\sqrt{2\pi}\sigma}
\left(\frac{(\mu_1-\mu_2)^2}{4\sigma^4}-\frac{1}{\sigma^2}\right)
\exp\left[-\frac{(\mu_1-\mu_2)^2}{8\sigma^2}\right]\\
f''\left(\frac{\mu_1+\mu_2}{2}\right)&>0\rightarrow
\frac{(\mu_1-\mu_2)^2}{4\sigma^4}-\frac{1}{\sigma^2}>0\rightarrow
|\mu_1-\mu_2|>2\sigma
\end{align*}
おわりに
- 冷静に振り返ってみると、解答漏れや計算間違いが多々あり、自己採点は厳しい状況。