LoginSignup
8
6

More than 5 years have passed since last update.

2018年統計検定一級(数理)略解

Posted at

はじめに

  • 東京大学本郷キャンパスで受験。学食は混むので事前にコンビニで購入が良い。
  • 解答用紙の横罫線が濃いため、数式を2行で書くと、自分で書いたマイナス記号を見落としてしまう。
  • 数式は3行使用して書くのが良いかもしれない。前の座席との間隔が狭い。
  • 問1のヒントに「デルタ法の適用」とあったが、行き詰ってしまった。
  • 問4の問題文に正規分布の定義式が書いてあり、確率密度関数を計算しようとして挫折。
  • 条件付き平均・分散公式を使わないと計算が大変なことになる。
  • 公式の略解 2018年11月25日試験(http://www.toukei-kentei.jp/pt/pt-5956/#seikai)

問1

互いに独立に正規分布に従う確率変数を$X_1,\dots,X_n\sim N(\mu,\sigma^2)$、$\bar{X}=\frac{1}{n}\sum_{i=1}^nX_i$、
$S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2\ $とする。

[1]$S^2$は母分散$\sigma^2$の不偏推定量であることを示せ。

解答例
\begin{align*}
S^2&=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2
=\frac{1}{n-1}\sum_{i=1}^n(X_i-\mu-(\bar{X}-\mu))^2\\
&=\frac{1}{n-1}\sum_{i=1}^n(X_i-\mu)^2-\frac{n}{n-1}(\bar{X}-\mu)^2\\
E[S^2]&=\frac{1}{n-1}n\sigma^2-\frac{n}{n-1}\frac{\sigma^2}{n}=\sigma^2
\end{align*}

[2]自由度$n-1$のカイ二乗分布に従う確率変数を$Y$とする。確率密度関数は以下で与えられる。

\begin{align*}
g(y)=\frac{1}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}y^{\frac{n-1}{2}-1}
\exp\left(-\frac{y}{2}\right)
\end{align*}

$Y$の期待値は$n-1$であり、分散は$2(n-1)$であることを示せ。それにより$S^2$の分散$V[S^2]\ $を求めよ。

解答例
\begin{align*}
E[Y]&=\int_0^\infty \frac{y}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}y^{\frac{n-1}{2}-1}
\exp\left(-\frac{y}{2}\right)d y\\
&=\int_0^\infty \frac{1}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}y^{\frac{n+1}{2}-1}
\exp\left(-\frac{y}{2}\right)d y\\
&=\frac{\Gamma(\frac{n+1}{2})2^\frac{n+1}{2}}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}
=\frac{n-1}{2}2=n-1\\
E[Y^2]&=\int_0^\infty \frac{y^2}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}y^{\frac{n-1}{2}-1}
\exp\left(-\frac{y}{2}\right)d y\\
&=\int_0^\infty \frac{1}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}y^{\frac{n+3}{2}-1}
\exp\left(-\frac{y}{2}\right)d y\\
&=\frac{\Gamma(\frac{n+3}{2})2^\frac{n+3}{2}}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}
=\frac{n-1}{2}\frac{n+1}{2}4=n^2-1\\
V[Y]&=n^2-1-(n-1)^2=2(n-1)\\
\frac{(n-1)S^2}{\sigma^2}&\sim\chi^2_{n-1},
 V\left[\frac{(n-1)S^2}{\sigma^2}\right]=2(n-1),
 V[S^2]=\frac{2\sigma^4}{n-1}
\end{align*}

[3]$Y$の平方根$\sqrt{Y}$の期待値を求めよ。それにより標本標準偏差$S\ $の期待値$E[S]$を求めよ。

解答例
\begin{align*}
E[\sqrt{Y}]&=\int_0^\infty \frac{\sqrt{y}}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}y^{\frac{n-1}{2}-1}
\exp\left(-\frac{y}{2}\right)d y\\
&=\int_0^\infty \frac{1}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}y^{\frac{n}{2}-1}
\exp\left(-\frac{y}{2}\right)d y\\
&=\frac{\Gamma(\frac{n}{2})2^\frac{n+1}{2}}{\Gamma(\frac{n-1}{2})2^\frac{n-1}{2}}
=\sqrt{2}\frac{\Gamma(\frac{n}{2})}{\Gamma(\frac{n-1}{2})}\\
E\left[\sqrt{\frac{(n-1)S^2}{\sigma^2}}\right]&=\sqrt{2}\frac{\Gamma(\frac{n}{2})}{\Gamma(\frac{n-1}{2})},
E[S]=\sigma\sqrt{\frac{2}{n-1}}\frac{\Gamma(\frac{n}{2})}{\Gamma(\frac{n-1}{2})}
\end{align*}

[4]$n$が十分大きいとして、母標準偏差$\sigma$の推定量としての$S$の偏り$E[S]-\sigma$を$n^{-1}$のオーダーまで求めよ。
ヒント:デルタ法の適用、あるいはスターリングの公式$\Gamma(z)\simeq\sqrt{2\pi}e^{-z}z^{z-1/2}$を用いる。

解答例
\begin{align*}
E[S]&\simeq \sigma\sqrt{\frac{2}{n-1}}
\exp{\left(-\frac{n}{2}\right)}
\left(\frac{n}{2}\right)^{\frac{n-1}{2}}
\exp{\left(\frac{n-1}{2}\right)}
\left(\frac{2}{n-1}\right)^{\frac{n-2}{2}}\\
&=\sigma\exp{\left(-\frac{1}{2}\right)}\left(\frac{n}{n-1}\right)^{\frac{n-1}{2}}
=\sigma\exp{\left(-\frac{1}{2}\right)}\left(1+\frac{1}{n-1}\right)^{\frac{n-1}{2}}\ \\
\log \frac{E[S]}{\sigma}&\simeq -\frac{1}{2}+\frac{n-1}{2}\log\left(1+\frac{1}{n-1}\right)\\
&\simeq -\frac{1}{2}+\frac{n-1}{2}\left(\frac{1}{n-1}-\frac{1}{2}\frac{1}{(n-1)^2}+\cdots\right)
\simeq-\frac{1}{4n}\\
E[S]&\simeq \sigma\exp\left(-\frac{1}{4n}\right)
\simeq \sigma\left(1-\frac{1}{4n}\right)
\end{align*}

問2

箱の中に$N$個の玉があり、$M$個は赤玉、$N-M$個は青玉である。
この箱から非復元無作為抽出により順に$n$個の玉を取り出す。
$X_i(i=1,\dots,n\le N)\ $を確率変数として、
第$i$回目が赤玉なら$X_i=1$、青玉なら$X_i=0$とする。

[1]$\Pr(X_i=1),\Pr(X_i=1,X_j=1)(i\neq j)$を求めよ。

解答例
\begin{align*}
\Pr(X_i=1)&=\frac{M(N-1)!}{N!}=\frac{M}{N}\\
\Pr(X_i=1,X_j=1)&=\frac{M(M-1)(N-2)!}{N!}=\frac{M(M-1)}{N(N-1)}
\end{align*}

[2]$E[X_i],V[X_i],\ Cov(X_i,X_j)(i\neq j)\ $を求めよ。

解答例
\begin{align*}
E[X_i]&=\frac{M}{N}\\
V[X_i]&=\frac{M}{N}\left(1-\frac{M}{N}\right)
=\frac{M(N-M)}{N^2}\\
E[X_iX_j]&=\frac{M(M-1)}{N(N-1)}\\
Cov(X_i,X_j)&=E[X_iX_j]-E[X_i]E[X_j]=-\frac{M(N-M)}{N^2(N-1)}
\end{align*}

[3]赤玉の個数$X=X_1+\dots+X_n$とする。$\Pr(X=x)$を求めよ。

解答例
\begin{align*}
\Pr(X=x)&=\frac{M!}{(M-x)!}\frac{(N-M)!}{((N-M)-(n-x))!}\binom{n}{x}\frac{(N-n)!}{N!}\\
&=\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}
\end{align*}

[4]$E[X],V[X]\ $を求めよ。

解答例
\begin{align*}
E[X_i^2]&=\frac{M}{N}\\
E[X_iX_j]&=\frac{M(M-1)}{N(N-1)}\\
E[X]&=\sum_{i=1}^nE[X_i]=n\frac{M}{N}\\
E[X^2]&=\sum_{i,j}E[X_iX_j]
=n\frac{M}{N}+n(n-1)\frac{M(M-1)}{N(N-1)}\ \\
V[X]&=n\frac{M}{N}+n(n-1)\frac{M(M-1)}{N(N-1)}-n^2\frac{M^2}{N^2}\\
&=\frac{n(N-n)M(N-M)}{(N-1)N^2}
\end{align*}

[5]箱の中に青玉のみが$N$個入っているとする。ただし$N$は未知とする。
$N$を推定するため、$K$個の赤玉を入れてよく混ぜる。ただし$K$は既知とする。
箱から非復元無作為抽出で$n$個の玉を取り出し、赤玉の個数を$X$とする。
$X$を用いて$N$の推定量$\hat{N}\ $を作れ。$N,X$がともに大きいとして、$\epsilon=\sqrt{V[\hat{N}]}/N$を求めよ。

解答例
\begin{align*}
E[X]&=n\frac{K}{N+K}=X\rightarrow
\hat{N}=\frac{n-X}{X}K\\
V[\hat{N}]&=V\left[\frac{n-X}{X}K\right]=n^2K^2V\left[\frac{1}{X}\right]\\
g(x)&=\frac{1}{x},g'(x)=-\frac{1}{x^2}\quad\text{Delta method}\\
V[\hat{N}]&=n^2K^2g'(E[X])^2V[X]=\frac{(N+K)^4}{n^2K^2}V[X]\\
\frac{V[\hat{N}]}{N^2}&=\frac{(N+K)^4}{n^2K^2N^2}
\frac{n(N+K-n)KN}{(N+K-1)(N+K)^2}\\
\epsilon&=\frac{\sqrt{V[\hat{N}]}}{N}\simeq
\sqrt{\frac{(N+K)(N+K-n)}{nKN}}
\end{align*}

問3

パラメータ$n,\theta$の二項分布に従う確率変数を$X$とする。確率関数は以下で与えられる。

\begin{align*}
p(x)=\Pr(X=x)=\binom{n}{x}\theta^x(1-\theta)^{n-x}\ 
\end{align*}

[1]$X$の期待値$E[X]\ $と分散$V[X]\ $はいくらか。

解答例
\begin{align*}
E[X]&=n\theta,V[X]=n\theta(1-\theta)\ 
\end{align*}

[2]$X\ge1\ $の条件の下での$X$の条件付き確率関数$\ h(x)=\Pr(X=x|X\ge1)\ $を求めよ。

解答例
\begin{align*}
h(x)&=\Pr(X=x|X\ge1)=\frac{\Pr(X=x)}{\Pr(X\ge1)}=\binom{n}{x}\frac{\theta^x(1-\theta)^{n-x}}{1-(1-\theta)^n}
\end{align*}

[3]$X$の条件付き期待値$\eta(\theta)=E[X|X\ge1]$と分散$\xi(\theta)=V[X|X\ge1]$を求めよ。

解答例
\begin{align*}
\eta(\theta)=E[X|X\ge1]&=\frac{1}{1-(1-\theta)^n}
\sum_{x=1}^nx\binom{n}{x}\theta^x(1-\theta)^{n-x}\\
&=\frac{1}{1-(1-\theta)^n}
\sum_{x=1}^n\frac{n(n-1)!}{(x-1)!(n-x)!}\theta\theta^{x-1}(1-\theta)^{n-x}\\
&=\frac{n\theta}{1-(1-\theta)^n}\\
E[X(X-1)|X\ge1]&=\frac{1}{1-(1-\theta)^n}
\sum_{x=1}^nx(x-1)\binom{n}{x}\theta^x(1-\theta)^{n-x}\\
&=\frac{1}{1-(1-\theta)^n}
\sum_{x=2}^n\frac{n(n-1)(n-2)!}{(x-2)!(n-x)!}\theta^2\theta^{x-2}(1-\theta)^{n-x}\\
&=\frac{n(n-1)\theta^2}{1-(1-\theta)^n}\\
\xi(\theta)=V[X|X\ge1]&=\frac{n(n-1)\theta^2}{1-(1-\theta)^n}
+\frac{n\theta}{1-(1-\theta)^n}-\left(\frac{n\theta}{1-(1-\theta)^n}\right)^2
\end{align*}

[4]$n=8$のとき、条件付き期待値$\eta(\theta)\ $が$E[X]$の2倍となる$\theta$を求めよ。

解答例
\begin{align*}
\eta(\theta)&=2E[X]\rightarrow
\frac{n\theta}{1-(1-\theta)^n}=2n\theta\\
\theta&=1-\left(\frac{1}{2}\right)^\frac{1}{n}
\end{align*}

[5]$X\ge1\ $の条件の下での独立な$m$個の観測値を$y_1,\dots,y_m$とし、$\bar{y}=\frac{1}{m}\sum_{i=1}^my_i$とする。
パラメータ$\theta$の最尤推定量$\hat{\theta}$の計算方法を示せ。
$\hat{\theta}$はモーメント法に基づく推定量でもあることを示せ。

解答例
\begin{align*}
L(\theta)&=\prod_{i=1}^mh(y_i),
\quad\bar{y}=\frac{1}{m}\sum_{i=1}^my_i\\
\frac{d}{d\theta}\log L(\theta)&=\frac{m\bar{y}}{\theta}
-\frac{m(n-\bar{y})}{1-\theta}-m\frac{n(1-\theta)^{n-1}}{1-(1-\theta)^n}=0\ \\
\bar{y}&=\frac{n\hat{\theta}}{1-(1-\hat{\theta})^n}
\end{align*}

問4

正規分布$N(\mu,\sigma^2)$と既知の実数$\rho(0<\rho<1)$について、以下の各問に答えよ。

[1]2次元確率ベクトル$(X,Y)$において、$X$は標準正規分布$N(0,1)$に従い、
$Y|X=x\ $は$N(\rho x,1-\rho^2)$に従うとき、$Y$の周辺分布を求めよ。

解答例
\begin{align*}
X&\sim N(0,1)\\
Y|X=x&\sim N(\rho x,1-\rho^2)\\
E[Y]&=E_X[E[Y|X=x]]=E_X[\rho X]=0\\
V[Y]&=V_X[E[Y|X=x]]+E_X[V[Y|X=x]]\\
&=V_X[\rho X]+E_X[1-\rho^2]=\rho^2+1-\rho^2=1\ \\
Y&\sim N(0,1)
\end{align*}

[2]$t$を$0$以上の整数とし、確率ベクトルの列を$(X_t,Y_t),t=0,1,2,\dots$とする。
$Y_t|X_t=x_t\sim N(\rho x_t,1-\rho^2)\ $とし、$X_{t+1}|Y_t=y_t\sim N(\rho y_t,1-\rho^2)\ $とする。
$X_{t+1}|X_t=x_t\sim N(\rho^2 x_t,1-\rho^4)$となることを示せ。

解答例
\begin{align*}
Y_t|X_t=x_t&\sim N(\rho x_t,1-\rho^2)\\
X_{t+1}|Y_t=y_t&\sim N(\rho y_t,1-\rho^2)\\
E[X_{t+1}|X_t=x_t]&=E_Y[E[X_{t+1}|Y_t=y_t,X_t=x_t]]\\
&=E_Y[\rho Y_t]=\rho^2 x_t\\
V[X_{t+1}|X_t=x_t]&=V_Y[E[X_{t+1}|Y_t=y_t,X_t=x_t]]\ \\
&\quad+E_Y[V[X_{t+1}|Y_t=y_t,X_t=x_t]]\ \\
&=V_Y[\rho Y_t]+E_Y[1-\rho^2]\\
&=\rho^2(1-\rho^2)+1-\rho^2=1-\rho^4
\end{align*}

[3]$X_t|X_0=x_0\sim N(\rho^{2t}x_0,1-\rho^{4t})$となることを示せ。
$t$が限りなく大きくなっていくとき$X_t|X_0=x_0$の分布はどのような分布に近づくかを論ぜよ。

解答例
\begin{align*}
X_k&\sim N(\rho^{2k} x_0,1-\rho^{4k})\\
X_{k+1}|X_k=x_k&\sim N(\rho^2 x_k,1-\rho^4)\\
E[X_{k+1}]&=E_K[E[X_{k+1}|X_k=x_k]]
=E_K[\rho^2 X_k]=\rho^{2(k+1)} x_0\\
V[X_{k+1}]&=V_K[E[X_{k+1}|X_k=x_k]]
+E_K[V[X_{k+1}|X_k=x_k]]\ \\
&=V_K[\rho^2 X_k]+E_K[1-\rho^4]=\rho^4(1-\rho^{4k})+1-\rho^4\\
&=1-\rho^{4(k+1)}\\
X_{k+1}&\sim N(\rho^{2(k+1)} x_0,1-\rho^{4(k+1)})\\
&\sim N(0,1)\quad(k\rightarrow\infty)
\end{align*}

問5

互いに独立に一様分布に従う確率変数を$X_1,X_2,X_3\sim U(0,1)$、順序統計量を$X_{(1)}\le X_{(2)}\le X_{(3)}\ $とする。
$Y_1=X_{(1)},Y_2=X_{(2)},Y_3=X_{(3)},Z=Y_3-Y_1$とする。

[1]$Y_1,Y_3$の確率密度関数と期待値を求めよ。

解答例
\begin{align*}
f_1(y)&=\frac{3!}{0!2!}(1-y)^2=3(1-y)^2\\
f_3(y)&=\frac{3!}{2!0!}y^2=3y^2\\
E[Y_1]&=\int_0^1 3y(1-y)^2d y=3\frac{1!2!}{4!}=\frac{1}{4}\\
E[Y_3]&=\int_0^1 3y^3d y=\frac{3}{4}
\end{align*}

[2]$Y_2$の確率密度関数を求めよ。$\Pr(Y_2<1/2)$はいくらか。

解答例
\begin{align*}
f_2(y)&=\frac{3!}{1!1!}y(1-y)=6y(1-y)\\
\Pr(Y_2<1/2)&=\int_0^{1/2} 6y(1-y)d y=\left[3y^2-2y^3\right]_0^{1/2}=\frac{1}{2}
\end{align*}

[3]$Z$の期待値と分散を求めよ。

解答例
\begin{align*}
E[Y_1^2]&=\int_0^1 3y^2(1-y)^2d y=3\frac{2!2!}{5!}=\frac{1}{10}\\
E[Y_3^2]&=\int_0^1 3y^4d y=\frac{3}{5}\\
f_{13}(y_1,y_3)&=\frac{3!}{0!1!0!}(y_3-y_1)=6(y_3-y_1)\quad(0\le y_1\le y_3\le 1)\ \\
E[Y_1Y_3]&=\int_0^1\int_0^{y_3} 6y_1y_3(y_3-y_1)d y_1d y_3\\
&=\int_0^1 (3y_1^4-2y_3^4)d y_3=\frac{1}{5}\\
E[Z]&=E[Y_3-Y_1]=\frac{1}{2}\\
E[Z^2]&=E[Y_3^2-2Y_3Y_1+Y_1^2]=\frac{3}{5}-\frac{2}{5}+\frac{1}{10}=\frac{3}{10}\\
V[Z]&=\frac{3}{10}-\left(\frac{1}{2}\right)^2=\frac{1}{20}
\end{align*}

おわりに

  • 冷静に振り返ってみると、解答漏れや計算間違いが多々あり、自己採点は厳しい状況。
8
6
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
8
6