More than 1 year has passed since last update.

統計検定勉強個人的メモ

統計学

Last updated at 2023-06-06Posted at 2023-05-27

統計数理

独立
・独立な例：A:コインを投げて表の確率、B:さいころを投げて偶数の確率
・独立でない例：袋に1, 2, 3と書かれた玉がある。A→Bの順で球を引く（球は戻さない）。A：Aが偶数を引く確率。B：Bが偶数を引く確率。

A\perp Bなら
\\\
P(A\cap B)=P(A)P(B)
\\\
又、A\perp \overline{B}
\\\
\\\
A\perp B\perp Cなら
\\\
P(A\cap B\cap C)=P(A)P(B)P(C)

統計数理メモ

二変数の包含関係①

P(A\cap B)=P(B)-P(B\cap \overline{A})

二変数の包含関係②

max\{0, P(A) + P(B) - 1\} \leq P(A\cap B) \leq min\{P(A), P(B)\}

A=Bの時が一番でかい。AとBで全部覆えないなら、限界まで離せば0。覆えてしまうなら、限界まで引き離して残ったところが重なってるところ。

二変数の累積確率分布

f(x) = \int_{-\infty}^{\infty}f(x, y)dy \\
F(x) = \int_{-\infty}^{x}f(x')dx' \\
F(x, y) = \int_{-\infty}^{x}\int_{-\infty}^{y}f(x', y')dy'dx' \\
F(x) = F(x, y=\infty) = \int_{-\infty}^{x}\int_{-\infty}^{\infty}f(x', y')dy'dx' \\

累積確率分布の周辺化は、周辺化したい方の変数をmaxにする。

共分散

Cov(X, Y) = \int \int (X -E(X))(Y -E(X))f(X, Y)dxdy \\
= E((X-E(X))(Y-E(Y)) \\

分散

V(X) =  E((X-E(X))^2)\\
= E(X^2) - E(X)^2 \\
V(X+Y) = V(X) + V(Y) + 2Cov(X, Y)

相関係数

R(X, Y) =  \frac{Cov(X, Y)}{\sqrt{V(X)V(Y)}}

ポアソン分布
ある時間の中で平均$\lambda$回発生する事象が、同様の時間のなかで$k$回発生する確率。
電話が平均10分で5回なる場合、10分でk回なる確率は$\lambda=5$のポアソン分布

P(X=k)=\frac{\lambda^ke^k}{k!}

期待値は$\lambda$。普通に考えて、平均で$\lambda$回起きるんだから、そうなる。

E[X]=\lambda

$e^x=\Sigma_{n=0}^{\infty}\frac{x^n}{n!}$を使う。

分散も$\lambda$

ガンマ分布
所与の時間（例$\lambda$年）の間に1回起きることが、実際におきるまでにかかる時間。

条件付き期待値

E[X|Y=y] \\
= \int_x x P(X|Y=y) \\
=\int_x x \frac{P(X, Y=y)}{P(Y=y)}

又、

E_X[X] =E_Y[E_X[X|Y]]

つまり、Xの期待値はY=yの時のXの期待値をyの式で表し、y=E[Y]にしたもの、ということ。

条件付き分散

V[X|Y=y] = E[X^2|Y=y] - E[X|Y]^2

又、

V_X[X]=E_Y[V[X|Y]]+V_Y[E[X|Y]]

つまり、Xの分散はXの分散をyで表したときに、yに期待値を入れたもの足す、Xの期待値をyで表したもののyの分散になる。()

モーメント法
原点周りのn次のモーメントは以下になる。

\mu_n=\int x^nP(X=x|\theta)dx \\
n=1, 2, 3, ...

つまり原点周りの1次のモーメント($\mu_1$)は期待値である。また、期待値周りのn次のモーメントは以下になる

\mu'_n=\int (x-\mu_1)^nP(X=x|\theta)dx \\
n=1, 2, 3, ...

つまり期待値周りの2次のモーメント($\mu'_2$)は分散である。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up