はじめに
2021年に行われた統計検定1級(統計数理)に合格したので、受験の際にまとめた公式集を公開します。
すべてを網羅しているわけではなく、過去問や参考書によく出てくるものを中心にまとめていました。
公式の確認や、合格者のレベル感を知る目的で見てもらえたら嬉しいです。
注)数学的に厳密ではない表現がある可能性があります。
もし間違い等あればコメントで指摘してください。
公式まとめ
分布関係
基本事項
分布 | 確率密度関数 | 平均 | 分散 |
---|---|---|---|
一様分布 | $$\frac{1}{b-a}$$ | $$\frac{a+b}{2}$$ | $$\frac{(b-a)^2}{12}$$ |
正規分布 | $$\frac{1}{\sqrt{2 \pi \sigma^2}} \exp \left(-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right)$$ | $$\mu$$ | $$\sigma^2$$ |
二項分布 | $$_nC_kp^k(1-p)^{n-k}$$ | $$np$$ | $$np(1-p)$$ |
ポアソン分布 | $$\frac{\lambda^k}{k!}e^{-\lambda}$$ | $$\lambda$$ | $$\lambda$$ |
指数分布 | $$\lambda e^{-\lambda x}$$ | $$\frac{1}{\lambda}$$ | $$\frac{1}{\lambda^2}$$ |
-
正規分布のモーメント母関数
$$\exp\left(\mu t+\frac{1}{2}\sigma^2t^2\right)$$ -
分布間の関係性
この図を参考にしていました(ありがとうございます)基本の確率分布・標本分布(復習用)。
— tota | 統計学/機械学習/確率/R (@tota13890499) March 25, 2021
これだけでもお腹いっぱいになりますね。 pic.twitter.com/heyZRUKovr
再生性
- 正規分布
$$\mathcal N(\mu_1,\sigma_1^2)+\mathcal N(\mu_2,\sigma_2^2)=\mathcal N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$$ - カイ二乗分布
$$\chi_a^2+\chi_b^2=\chi_{a+b}^2$$ - 二項分布
$$Bin(n_1,p)+Bin(n_2,p)=Bin(n_1+n_2,p)$$ - ポアソン分布
$$Po(\lambda_1)+Po(\lambda_2)=Po(\lambda_1+\lambda_2)$$
母関数
- 確率母関数
\begin{align}
G_X(t)&=E[t^X]\\
E[X]&=G'_X(1)\\
V[X]&=G''_X(1)+G'_X(1)-(G'_X(1))^2\\
(\because &G''_X(1)=E[X(X-1)])
\end{align}
- 積率(モーメント)母関数
\begin{align}
M_X(t)&=E[e^{tX}]\\
E[X]&=M_X'(0)\\
V[X]&=M''_X(0)-(M_X'(0))^2
\end{align}
- モーメント法
$$\frac{1}{n}\sum_{i=1}^nx_i^k=E[X^k]$$
期待値・分散
定義
\begin{align}
E^X[g(X)]&=\int_{-\infty}^{\infty}g(x)p(x)dx\\
V[X]&=E[(X-E[X])^2=E[X^2]-(E[X])^2\\
Cov.(X,Y)&=E[(X-\overline X)(Y-\overline Y)]\\
&=E[XY]-E[X]E[Y]\\
\rho_{xy}&=\frac{\sigma_{xy}}{\sigma_x\sigma_y}=\frac{E[XY]-E[X]E[Y]}{\sqrt{V[X]V[Y]}}
\end{align}
性質
\begin{align}
E[nX]&=nE[X]\\
V[nX]&=n^2V[X]\\
E[X\pm Y]&=E[X]\pm E[Y]\\
V[X\pm Y]&=V[X]+V[Y]\pm 2Cov.(X,Y)\\
E[XY]&=E[X]E[Y]\ (独立の場合)\\
\\
\end{align}
条件付き期待値・分散
\begin{align}
E^X[X]&=E^Y[E^{X|Y}[X|Y]]\\
V^X[X]&=E^Y[V^{X|Y}[X|Y]]+V^Y[E^{X|Y}[X|Y]]\\
\end{align}
推定
定義
\begin{align}
尤度\log L(\theta|\boldsymbol x)&=\sum_{i=1}^n\log p(x_i|\theta)\\
不偏E[\hat \theta]&=\theta\\
MSE&=E[(\hat \theta-\theta)^2]=V(\hat \theta)+(E[\hat\theta]-\theta)^2\\
フィッシャー情報量I_n(\theta)&=E\left[\left\{\frac{d}{d\theta}(\log L(\theta|\boldsymbol x))\right\}^2\right]\\
&=-E\left[\frac{d^2}{d\theta^2}\log L(\theta|\boldsymbol x)\right]\\
I_n(\theta)&=nI_1(\theta)
\end{align}
クラメールラオ
\begin{align}
Var(\hat \theta)\ge\frac{1}{I_n(\theta)}
\end{align}
指標の良さ
\begin{align}
一致性&\lim_{n\to\infty}\hat \theta\rightarrow_p\theta\\
有効性&Var(\hat\theta)=\frac{1}{I_n(\theta)}
\end{align}
統計量
-
順序統計量
$n=a+b+1$個の変数があり、$b+1$番目の順序統計量の確率密度関数を求める場合
$$f(y)=\frac{n!}{a!1!b!}(p(x<y))^a\cdot p(y)\cdot(p(y<x))^b$$ -
十分統計量
\begin{align}
&p(x|t;\theta)=p(x|t)\\
\Leftrightarrow &p(x|\theta)=h(x)g(t|\theta)\ (\because フィッシャー・ネイマンの因子分解定理)
\end{align}
定理・数式
マルコフの不等式
\begin{align}
E[X]&\ge ap(X\ge a)\\
\because E[X]\ge \int_a^\infty xp(x)dx&\ge \int_a^\infty ap(x)dx=ap(x\ge a)
\end{align}
チェビシェフの不等式
\begin{align}
\frac{\sigma^2}{b^2}&\ge p(|X-\mu|\ge b)\\
\because E[(X-\mu)^2]&\ge \int_{|X-\mu|\ge b}(x-\mu)^2p(x)dx\\
&\ge b^2\int_{|X-\mu|\ge b}p(x)dx
\end{align}
対数の弱法則
$$\overline X \rightarrow_pE[X]$$
中心極限定理
$$\overline X\sim\mathcal N(\mu,\frac{\sigma^2}{n})$$
テイラー展開
\begin{align}
f(x)&=\sum_{n=0}^\infty\frac{f^{(n)}(\alpha)}{n!}(x-\alpha)^n\\
e^x&=\sum_{n=0}^\infty\frac{x^n}{n!}
\end{align}
デルタ法
\begin{align}
E[g(x)]&=E\left[g(\mu)+g'(\mu)(x-\mu)+\frac{1}{2}g''(\mu)(x-\mu)^2\right]\\
&=g(\mu)+\frac{1}{2}g''(\mu)E[(X-\mu)^2]
\end{align}
ベイズの定理
p(x|y)=\frac{p(y|x)p(x)}{p(y)}
その他
変換
\begin{align}
f(s,t)=f(x,y)
\begin{vmatrix}
\frac{\partial x}{\partial s} & \frac{\partial y}{\partial s} \\
\frac{\partial x}{\partial t} & \frac{\partial y}{\partial t} \\
\end{vmatrix}
\end{align}
ガンマ関数
$$\Gamma(z)=\int_0^\infty t^{z-1}e^{-t}dt=(z-1)!$$
平方和
$$総平方和(SS_T)=郡内平方和(SS_W)+群間平方和(SS_B)$$
第一種の過誤
$$\int_Rf(x|\theta_0)dx$$
最後に
私の本番での失敗を記しておきたいと思います。具体的な言及は避けますが、私は以下の計算を間違えました。
$$\sum_{N=0}^{100}(N+1)$$
原因としてはpythonなどのプログラミング言語ではlen(a[0:100]) = 100
となるので、要素数を100個だと勘違いしました。小学校で学ぶことですよね…
どこででも言われている話ですが、試験中は平常心を持つことが一番大切だと改めて痛感しました。
皆さんのご健闘を祈っています。
参考文献
統計検定を受験するにあたって参考にしていたものを記載しておきます。記憶が古いので記載漏れがあったらすいません。