2
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

統計検定1級統計数理2021解答

Last updated at Posted at 2021-12-07

2021年11月21日に行われた統計検定1級統計数理の解答です。問題はホームページに公開されています.間違いがあれば教えてください.
以下の表記を用いています.

  • pdf: 確率密度関数
  • i.i.d: 互いに独立に同一分布に従う
  • $E[X]$: Xの期待値
  • $V[X]$: Xの分散

解答

問1

[1]

$$
E[X] = \int_0^\infty xe^{-x}\mathrm{d}x = \Gamma(2)=1,\quad E[Y] = \int_0^1 y,\mathrm{d}y = \frac{1}{2}
$$
[2] 独立だから

E[XY] = E[X]E[Y] = \frac{1}{2}

[3] $Z=X+Y$ のpdfは $X$ のpdfと $Y$ のpdfの畳み込みである:

f_Z(z) = \int f_X(z-w)\,f_Y(w)\,\mathrm{d}w

被積分関数は $0<z-w$ かつ $0<w<1$ のときに0でない値をとる.

  • $z < 0$ のとき, $0<z-w$ かつ $0<w<1$を満たす $w$ は存在しないため $f_Z(z)=0$ .
  • $0 \leq z < 1$ のとき
    $$
    f_Z(z) = \int_0^z f_X(z-w),f_Y(w),\mathrm{d}w = \int_0^z e^{-(z-w)}\mathrm{d}w = 1-e^{-z}
    $$
  • $1\leq z$ のとき
    $$
    f_Z(z) = \int_0^1 f_X(z-w),f_Y(w),\mathrm{d}w = \int_0^1 e^{-(z-w)}\mathrm{d}w = (e-1)e^{-z}
    $$

(グラフ略)

[4] $h$ の単調性から
$$
F_X(x) = P(X\leq x) = P(h(X)\leq h(x)) = P(Y\leq h(x)) = F_Y(h(x))
$$

となる.また $0<x$ と $0<y<1$ に対し

\begin{array}{ll}
&F_X(x)=\int_0^x e^{-x'}\mathrm{d}x'=1-e^{-x} \\
&F_Y(y)=\int_0^y \mathrm{d}y' = y
\end{array}

であるから $h(x)=1-e^{-x}$ となる.この $h$ に対し
$$
E[XY] = E[Xh(X)] = E[X-Xe^{-X}] = E[X] - E[Xe^{-X}]
$$

となる.$E[X]$ は[1]から1. $E[Xe^{-X}]$ は

$$
E[Xe^{-X}] = \int_0^\infty xe^{-x}e^{-x}\mathrm{d}x = \frac{1}{4}\int_0^\infty 2xe^{-2x}\mathrm{d}(2x) = \frac{1}{4}\Gamma(2)=\frac{1}{4}
$$

となるから

$$
E[XY] = 1-\frac{1}{4} = \frac{3}{4}
$$

問2

[1] $X$は超幾何分布に従い,確率関数は

f_X(x) = \left\{
\begin{array}{ll}
 \frac{_{N_A}C_{x}\cdot{}_{100-N_A}C_{15-x}}{_{100}C_{15}}\quad &\max(0, N_A-85)\leq x \leq \min(15, N_A)\\
 0 &\mathrm{otherwise}
\end{array}
\right.

である.
[2] 尤度関数$L(N_A)$は

L(N_A) = \frac{_{N_A}C_{4}\cdot{}_{100-N_A}C_{11}}{_{100}C_{15}}

である.

\frac{L(N_A+1)}{L(N_A)} = \frac{_{N_A+1}C_{4}\cdot{}_{99-N_A}C_{11}}{_{N_A}C_{4}\cdot{}_{100-N_A}C_{11}} = \frac{(N_A+1)(89-N_A)}{(N_A-3)(100-N_A)} < 1

を解くと$N_A \geq 26$となるから$L(4)<\cdots < L(25) < L(26) > L(27) > \cdots$.よって$N_A$の最尤推定量は$26$.
[3]
$$
1 = \sum_{n=0}^{100} P(N_A=n) = C \sum_{n=0}^{100}(n+1) = C\frac{101}{2}(1+101)
$$
より$C=1/5151$.
[4] Bayesの定理より事後分布は

\pi(N_A|x=4)\propto f_X(x=4|N_A)P(N_A)\propto {}_{N_A}C_{4}\cdot{}_{100-N_A}C_{11}(N_A+1)

となる.

\frac{\pi(N_A+1|x=4)}{\pi(N_A|x=4)} = \frac{{}_{N_A+1}C_{4}\cdot{}_{99-N_A}C_{11}(N_A+2)}{{}_{N_A}C_{4}\cdot{}_{100-N_A}C_{11}(N_A+1)}=\frac{(N_A+1)(89-N_A)(N_A+2)}{(N_A-3)(100-N_A)(N_A+1)}<1

を解くと$N_A \geq 30$となるから$N_A$の事後モードは30.

問3

[1]
$$
M_X(s) = E[e^{sX}] = e^{-\lambda}\sum_{x=0}^\infty \frac{(\lambda e^s)^x}{x!} = e^{-\lambda}e^{\lambda e^s} = \exp[\lambda(e^s-1)]
$$

[2]
[2-1] $T=X_1+\cdots+X_n$ のモーメント母関数は,$X_1,...,X_n$ が i.i.d.であることから
$$
M_T(s)=E[e^{s(X_1+\cdots+X_n)}] = E[e^{sX_1}]\cdots E[e^{sX_n}] = (E[e^{sX_1}])^n = \exp[n\lambda(e^s-1)]
$$
となる.よって $T$ は $Po(n\lambda)$ に従う.
[2-2] $X_1,...,X_n$ の同時確率関数は
$$
p(\boldsymbol{x};\lambda)=\frac{1}{x_1!\cdots x_n!}\lambda^{x_1+\cdots+x_n}e^{-n\lambda}
$$
となるから因子分解定理より $T=X_1+\cdots+X_n$ は $\lambda$ の十分統計量である.
[2-3] 対数尤度は
$$
\log L(\lambda;\boldsymbol{x})= (x_1+\cdots+x_n)\log\lambda-n\lambda-\log(x_1!\cdots x_n!)
$$
となるから
$$
\frac{\partial}{\partial \lambda}\log L(\lambda;\boldsymbol{x})=\frac{x_1+\cdots+x_n}{\lambda}-n = 0
$$
を解いて $\hat{\lambda}=T/n$ を得る.
[3]
$$
\left|\frac{t-n\lambda}{\sqrt{n\lambda}}\right| \leq 2
$$
を両辺2乗して整理すると
$$
n^2\lambda^2-2n(t+2)\lambda + t^2 \leq0
$$
となり,これを解いて信頼区間
$$
\frac{t+2-2\sqrt{t+1}}{n} \leq \lambda \leq \frac{t+2+2\sqrt{t+1}}{n}
$$
を得る.
[4] 前問で求めた信頼区間の中点は
$$
\frac{t}{n}+\frac{2}{n}=\hat{\lambda}+\frac{2}{n}
$$
である.これは最尤推定量よりも大きな値をとり,$n$を十分大きくすると最尤推定量に近づいていく.

問4

[1] $X_1,...,X_n$がi.i.dであることから
$$
V[\bar{X}] = V\left[\frac{\sum_{i=1}^n X_i}{n}\right] = \frac{1}{n^2}V\left[\sum_{i=1}^n X_i\right] = \frac{1}{n^2}\sum_{i=1}^nV\left[ X_i\right] = \frac{1}{n}V[X_1] = \frac{\sigma^2}{n}
$$
[2]

\begin{array}{ll}
E[(X_1-X_2)^3] &\!\!\!\!= E[\{(X_1-\mu)-(X_2-\mu)\}^3]\\
&\!\!\!\!= E[(X_1-\mu)^3]-3E[(X_1-\mu)^2(X_2-\mu)] + 3E[(X_1-\mu)(X_2-\mu)^2]-E[(X_2-\mu)^3]\\
&\!\!\!\!= E[(X_1-\mu)^3]-3E[(X_1-\mu)^2]E[(X_2-\mu)] + 3E[(X_1-\mu)]E[(X_2-\mu)^2]-E[(X_2-\mu)^3]\\
&\!\!\!\!= \tau+0+0-\tau = 0
\end{array}

となる(2行目から3行目で独立性を用いた).
[3] 独立性を用いる.

\begin{array}{ll}
&E[Y_i^3] = E[(X_i-\mu)^3]=\tau \\
&E[Y_i^2Y_j] = E[Y_i^2]E[Y_j] = E[(X_i-\mu)^2]E[X_j-\mu] = 0 \\
&E[Y_iY_jY_k] = E[Y_i]E[Y_j]E[Y_k] = E[(X_i-\mu)]E[X_j-\mu]E[X_k-\mu] = 0 
\end{array}

[4] 前問の $Y_i$ を用いると
$$
X_i-\bar{X}=Y_i+\mu-\frac{Y_1+\cdots+Y_n+n\mu}{n} = \frac{(n-1)Y_i-\sum_{j\neq i}Y_j}{n}
$$
と表せるから

\begin{array}{ll}
E[\sum_{i=1}^n (X_i-\bar{X})^3] &\!\!\!\!= \sum_{i=1}^{n} E[(X_i-\bar{X})^3] = \frac{1}{n^3}\sum_{i=1}^n E[\{(n-1)Y_i-\sum_{j\neq i}Y_j\}^3] \\
&\!\!\!\!= \frac{1}{n^3}\sum_{i=1}^n \{(n-1)^3\tau-(n-1)\tau\}\\
&\!\!\!\!= \dfrac{(n-1)(n-2)}{n}\tau
\end{array}

となる(1行目から2行目で前問の結果を用いた).
[5]

\begin{array}{ll}
E[(\sum_{i=1}^n a_i X_i)^3]&\!\!\!\! = E[(\sum_{i=1}^n a_i (Y_i+\mu))^3] \\
&\!\!\!\! = E[(\sum_{i=1}^n a_iY_i)^3]+3\mu\sum_{i=1}^n a_i E[(\sum_{i=1}^n a_iY_i)^2] + 3\mu^2(\sum_{i=1}^n a_i)^2E[\sum_{i=1}^n a_iY_i] + \mu^3(\sum_{i=1}^n a_i)^3 
\end{array}

となり,第一項は[3]の結果を用いると
$$
E[(\sum_{i=1}^n a_i Y_i)^3] = \sum_{i=1}^n a_i^3E[Y_i^3] = \tau\sum_{i=1}^n a_i^3
$$
となるから,$\hat{\tau}$ が不偏推定量になるための条件は
$$
\sum_{i=1}^n a_i^3 = 1, \quad \sum_{i=1}^n a_i=0
$$
である.

問5

[1] $X_1,...,X_n$は独立に$N(0,1)$に従うから$V[\boldsymbol{x}]=I$(単位行列)である.よって
$$
V[\boldsymbol{y}] = V[L\boldsymbol{x}] = LV[\boldsymbol{x}]L^T = LL^T
$$
となる.
[2] $L\boldsymbol{x}$ と $M\boldsymbol{x}$ も多次元正規分布に従うから,$L\boldsymbol{x}$ と $M\boldsymbol{x}$の独立性は無相関性と同値である. よって $\mathrm{Cov}(L\boldsymbol{x}, M\boldsymbol{x})=O$ となる条件を求める.
$$
\mathrm{Cov}(L\boldsymbol{x}, M\boldsymbol{x}) = L\mathrm{Cov}(\boldsymbol{x}, \boldsymbol{x})M^T = LV[\boldsymbol{x}]M^T = LM^T
$$
よって条件は$LM^T=O$である.
[3] 前問の結果を用いると $L\boldsymbol{x}-AM\boldsymbol{x}$ と $M\boldsymbol{x}$が独立となる条件は
$$
(L-AM)M^T=O
$$
である.$M$はフルランクだから$MM^T$は正則であり,
$$
A=LM^T(MM^T)^{-1}
$$
と解ける.
[4] $M$ を直交行列 $U, V$ と対角行列 $\Sigma$ を用いて $M=U\Sigma V^T$ と特異値分解すると $A$ が満たす条件は
$$
LV\Sigma^TU^T = AU\Sigma V^T V\Sigma^TU^T
$$
となる.$\Sigma=\mathrm{diag}[\sqrt{\sigma_1},...,\sqrt{\sigma_p},0,...,0]$としてこれを整理すると
$$
A = LV\Sigma ,\mathrm{diag}[1/\sigma_1,...,1/\sigma_p,0,...,0]U^T
$$
とできるから,常に $A$ は存在する.

2
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?