2021年11月実施の統計検定1級 統計数理を解いてみました。
解答は色々な方がまとめられていますのでそちらに譲り、
ここでは解けなかった所を中心に感想・備忘をまとめようと思います。
以下の表記を用います;
- pdf: 確率密度関数
- ${\rm i.i.d}$: 互いに独立に同一分布に従う
- $E[X]$: $X$の期待値
- $V[X]$: $X$の分散
どの3問を選ぶべきか
解く前に眺めた印象
各問の小問[1]は大体解けるので、合否を分けそうな[2][3][4]を中心に見ます。
問1:期待値計算がメインで手が付けやすそう。特に[2]は暗算問題。
問2:確率・超幾何分布・ベイズ、で計算ミスが怖い。[3]簡単!
問3:[2-2]十分統計量の定義とか忘れた…。[3]長いが解き方書いてあるような?
問4:3乗がある…計算ミスが怖い。
問5:行列の代数計算がメインなので計算ミスは少なそう。行フルランクってなんだ?
計算ミス回避を最優先すると選ぶべきは問1,3,5か。
問3は十分統計量の定義が不安でしたがそこを落としても[2]の2/3は取れますし、
問5のフルランクは恐らく逆行列関連の条件だと予想できます。
解答後の感想
問1:[4]で迷走したのがイタかった。[3]も結構時間を食った。
問2:計算が複雑だったので何度も見直していて時間がかかった。しかもミスが出た。
問3:[2-2]以外は手詰まりにならず。[2-2]は自分の勉強不足。
問4:やはり3乗の計算で詰まった。
問5:[4]以外は10分で解けた。しかもミスの気配無し。
結論、やはり問2,4はミスの温床で個人的には手を出さないのが正解なのかなと。
行列計算はミスしにくい、確率求めよ・二項係数・ベイズ(特に正規分布)などはミスしやすい、
を改めて実感しました。
問1
[3]の解法は2通り
解法1) 変数変換を使う方法 → 参考[1]参照
解法2) 畳み込みを使う方法 → 参考[2]参照
解法1の公式は良く忘れるのでこちらにまとめました。
教訓:足し算のpdfに変数変換公式を使うな
解法1は2よりも機械的に(何も考えずに)できそうですが、
ヤコビアン計算などでミスのリスクがあり、ここでは解法2推しです。
過去の類題でも[3]、公式解答では2が採用されています。
なお、どちらの場合も最終的には下記の積分計算が必要になります。
$$ f_Z(z) = \int_{-\infty}^{\infty} f_X(z-y) f_Y(y) dy $$
pdf変数変換の際には定義域や積分区間の扱いに注意
小問の[3]以降でpdfの変数変換が問われる場合、
定義域や積分区間で場合分け等のややこしい扱いが必要になる場合が多いです。
今回も$y$の取りうる値の範囲を注意深く調べないといけません。
問題文にある定義式から、
$z-y>0$ かつ $0<y<1$ の場合以外は非積分関数が0だと分かりますので、
$z$と$0,1$の大小で場合分けが必要となり、
\left\{ \,
\begin{aligned}
\hspace{5pt} z \leqq 0 \hspace{5pt}の時\hspace{5pt} & \, 積分せず、f(z) = 0 \\
\hspace{5pt} 0<z<1 \hspace{5pt}の時\hspace{5pt} & [0,z]で積分 \\
\hspace{5pt} 1 \leqq z \hspace{5pt}の時\hspace{5pt} & [0,1]で積分
\end{aligned}
\right.
としてやればよい事が分かります。
…自分の場合はここで10分近くロスしました。。
なお場合分けが必要そうな事は問題文に「グラフを描け」がある事から推測できますね。
結果が単純な関数ならこのような問題は設けられないはず。
[4]迷走して解けず
前半については解法は2通りありそうです。
解法1) $P(X<x)=P(Y<h(x))$ を使う方法 → 参考[1]参照
解法2) $f_X(x)=f_Y(y)h^{\prime}(x)$ を使う方法 → 参考[2]参照
自分は解法2で$h(x)=-e^{-x}+C$までは出せましたが、
何を思ったか$\int_0^1ydy=1$から$C$を決めようとして失敗しました。
確率変数を積分しても1にはならないのに$\int f(y)dy=1$としょっちゅう混同してます(反省)
なおその後には$\int_0^1dy=1$から$C$を決めようとしてまた失敗。
この積分、$x$に変数変換して積分しても左辺に$C$が残りません。
恒等式だから$C$の値に関わらず成り立ちますもんね。アホみたい。。
後半は$E[XY]=\int xyf_{XY}(x,y)dxdy$を計算しようとして失敗($f_{XY}$が求められず)。
$Y=h(X)$の関係があるので同時分布など考えちゃダメなんですね。
当たり前ですが教訓でした。
なお、前半について、公式解答でも$h(x)=1-e^{-x}$となっておりますが、
厳密には、$x<0$の時は$h(x)=1-e^{-x}$である必要は無く、$h(x)$は任意の負の値なのでは。
問2
[2]はミスチェックできる
問題の趣旨は「15個中4個がAだった時、100個中Aは何個?」
なので答は$100 \times 4/15 = 26.66$程度と推測できます。
[4]もミスチェックできる
事前分布から分かる事は
・100個中、100個全てがAである確率が最も高い
・しかし鋭いピークは無い分布なので事前分布の影響は弱い
$\therefore$答は[2]よりもやや大きいぐらいだろうと予測できます。
問3
[2-2] フィッシャー・ネイマンの分解定理が出ず
Tが \lambda の十分統計量 \Leftrightarrow f(\boldsymbol{x})=h(\boldsymbol{x})\times g(\lambda, T)
$x$が$T, \lambda$から分離できるって定理ですよね。
個人的には覚えにくい定理ですので覚え方募集。。
[4] では何を述べるべきなのか
自分が答案で述べた内容は、信頼区間の中点を$\lambda_C$として、
①$\hat{\lambda}<\lambda_C$
②真値$\lambda$は$\lambda_C$よりも小さいと考えられる
③$n$が大きい時は$\hat{\lambda}$と$\lambda_C$の差はあまり無い
参考[1][2]や公式解答から察するに、①③あたりを書いておけば
ある程度の点数がもらえるのではないかと思います。
この問に限らず「論ぜよ」と来たらとりあえず
大小比較・$n$が大きい/小さい時の挙動を述べれば部分点は貰えるのかなと思います。
なお、②については、
公式解答の「$\lambda$は$\hat{\lambda}$よりもやや大きな値である可能性が大きい」と雰囲気似ていますが、
公式解答はOK、②は減点対象、だと思います。
公式解答の主張は超ざっくり言うと、$P(\lambda > \hat{\lambda})>1/2$ ですが、
これは、$P(\lambda > \lambda_C)=1/2$ と $\lambda_C > \hat{\lambda}$ から数学的に確かな内容です。
一方②の主張は、$P(\lambda < \lambda_C)>1/2$で、これは正しくありません(左辺$=1/2$です)。
正規分布近似から得られる信頼区間が左右対称であることを理解していないようで、減点対象でしょうね。
($\lambda$は確率変数じゃないので↑のような表記は厳密にはNGなのですがそこは無視で!)
問4
[4] の計算でやや苦戦
期待値 $=\Sigma_i E[(Y_i-\bar{Y})^3]$ と変形したあと、
自分は、$\Sigma_i E[Y_i^3 -3Y_i^2 \bar{Y} +3Y_i \bar{Y}^2 -\bar{Y}^3]$と展開したのですが、
展開前に、$\frac{1}{n^3}\Sigma_i E[\left\{(n^3-1)Y_i-\Sigma_{j\neq i}Y_j\right\}^3]$としてから展開した方が、
交差項がすべて消えて簡単ですね。
有名公式、$\Sigma_i E[(Y_i-\bar{Y})^2]=(n-1)\sigma^2$ を導く際にもその方が便利そうで、
新しい発見でした。
[5] の計算で苦戦
$E[(\Sigma a_iY_i)^3]=E[\Sigma a_i^3Y_i^3]$ とできる事を使うのが上手いようです(参考[2])。
これも今後使う機会がありそうなテクニックですね。
問5
[1] は公式で一撃
V[A\boldsymbol{y}] = AV[\boldsymbol{y}]A^T
これはいきなり使ってもOKな公式だと思っています。
こちらに思い出し方をまとめました。
[2] も定理・公式が活躍
正規分布に従う\boldsymbol{X},\boldsymbol{Y}が独立 \Leftrightarrow {\rm Cov}[\boldsymbol{X},\boldsymbol{Y}]=\boldsymbol{O}
正規分布に従う2変数が独立、と来たら必ず使うぐらいの定理だと思います。
[4] AX=BはAが正則でなくても解ける
特異値分解が何なのか知りませんでしたが、使わなくても、
$MM^T$は対象行列なので直行行列$U$で対角化可能、
\begin{aligned}
\therefore MM^T & =U^T\Lambda U \\
& \Lambda = {\rm diag}[\lambda_1, ..., \lambda_r, 0,...,0] \\
& \lambda_i \neq 0 \hspace{5pt} (i = 1,2,...,r) \\
& r = {\rm rank}(MM^T)
\end{aligned}
と置く事ができます。
ここで$\Lambda$には逆行列はありませんが、
\begin{aligned}
A \Lambda = B & \Rightarrow A = B \Lambda^{\prime} \\
& \Lambda^{\prime} = {\rm diag}[1/\lambda_1, ..., 1/\lambda_r, 0,...,0]
\end{aligned}
のように$A$について解く事ができる、というのがこの問題のポイントなのかなと思います。
なお、
問「$A$が存在するための条件を論ぜよ」に対して
答「どのような条件でも$A$は存在する」というのは若干気持ち悪いですが、
逆にこのような答にならない場合、問題文は
「$A$が存在するための条件を求めよ」になるのかもしれません。
問題文からこのような答になりそうな雰囲気も感じ取れそうですね。
参考
[1] 統計検定1級統計数理2021解答
https://qiita.com/ss8/items/19ccdfa0117fddcc80be
[2] 統計検定 1級 過去問 解答 解説
https://satolog.org/toukeikentei-grade1-kaitouitiran/
[3] 2018年の統計応用(理工学)の問1で以下のような問題が出題されている。
$$ X_{i} \hspace{1pt} ~ \hspace{1pt} {\rm Exp} (\lambda) \hspace{5pt} {\rm i.i.d.の時、}
W_n = X_1 + ... + X_nの分布関数求めよ。
$$