#1.記述統計と推測統計
#3.期待値
事象X | x1 | x2 | ・・・ | xn |
---|---|---|---|---|
確率変数f(x) | f(x1) | f(x2) | ・・・ | f(xn) |
確率P(x) | P(x1) | P(x2) | ・・・ | P(xn) |
・公式
期待値 $ E(f) $
$$ E(f) = \sum_{k=1}^n P(X = x_k)f(X = x_k) $$
連続する値の場合
$$ \int P(X = x) f(X = x) dx $$
#4.分散と共分散
・データの散らばり具合
・データの各々の値が、期待値からどれだけズレているのか平均したもの
公式
分散 $Var(f)$
\begin{align}
Var(f) &= E\big((\, f_{(X=x)} - E_{(f)}\,)^2 \big) \\
&= E(\,f^2_{(X=x)}\,) - (E_{(f)})^2
\end{align}
\begin{align}
Cov(f,g) &= E\Big(\big(\, f_{(X=x)} - E_{(f)}\big) \big(g_{(Y=y)} - E(g)\,\big)\, \Big) \\
&=E(fg) - E(f)E(g)
\end{align}
\begin{align}
\sigma &= \sqrt {Var(f)} \\
&= \sqrt {E \big( \, (\, f_{(X=x)} - E_{(f)} \,) \, ^2 \big)}
\end{align}
#5.様々な確率分布
$$ P(x , | , \mu) = \mu^x , (1 - \mu)^{1-x} $$
$$ P(x | \lambda ,n) = \frac{n!}{x!(n-x)!} \lambda^x(1-\lambda)^{n-x} $$
N(x;\mu,\sigma^2)
= \sqrt{\frac{1}{2 \pi \sigma^2}} \exp \big(-\frac{1}{2 \sigma^2}(x-\mu)^2 \big)
#6.推定
\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
一致性は満たすが・・・
不偏性は満たさない
↓
不偏分散を使用する
\begin{align}
S^2 &= \frac{n}{n-1} × \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 \\
&= \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2
\end{align}
#7.情報科学
$$ I(x) = - \log \big( P(x) \big) = \log \big(W(x) \big) $$
\begin{align}
H(x) &= E \big( I(x) \big) \\
&= -E \Big( \log \big( P(x) \big) \Big) \\
&= - \sum \Big( P(x) \log \big( P(x) \big) \Big)
\end{align}
\begin{align}
D_{KL}(P||Q) &=\sum_x P(x) \Big( - \log \big( Q(x) \big) \Big) - \Big( - \log \big( P(x) \big) \Big)\\
&=\sum_x P(x) \log \frac{P(x)}{Q(x)}
\end{align}
\begin{align}
H(P,Q) = H(P) + D_{KL}(P||Q)
H(P,Q) = -\sum P(x) \log Q(x)
\end{align}