統計
確率

【ラビットチャレンジ】 応用数学 第二章 確率・統計 レポート


確率


頻度確率(客観確率)

発生する頻度.

例:10本のうち1本だけ当たりのクジの当選確率は10%.

  1回引く当たり0.1回当たっているという考え.

  実験的に確かめられる.


ベイズ確率(主観確率)

信念の度合い.

例:あなたは40%の確率でインフルエンザですという確率.

  あなたは一人しかいないので,実験的に確かめられない.


条件付き確率

ある事象$X=x$が与えられた下で,$Y=y$となる確率.

$$P(Y=y|X=x) = \frac{P(Y=y,X=x)}{P(X=x)}$$


独立な事象の同時確率

お互いに因果関係のない事象$X=x$と事象$Y=y$が同時に発生する確率.

$$P(X=x,Y=y)=P(X=x)P(Y=y)=P(Y=y,X=x)$$


ベイズ則

事象$X=x$と事象$Y=y$に対して,

$$P(X=x|Y=y)P(Y=y)=P(Y=y|X=x)P(X=x)$$


確率変数と確率分布


確率変数


  • 事象と結び付けられた数値.

  • 事象そのものを指すと解釈する場合も多い.


確率分布


  • 事象の発生する確率の分布.

  • 離散値であれば表に示せる.


期待値

その分布における確率変数の,平均の値 or 「ありえそう」な値.

事象$x$に対して,確率変数を$f(x)$,確率を$P(x)$とすると,

期待値は,$E(f)$は,


  • 確率変数が離散値の場合,
    $$E(f) = \sum_{k=1}^n P(X=x_k)f(X=x_k)$$

  • 確率変数が連続する値の場合,
    $$E(f) = \int P(X=x_k)f(X=x_k)dx$$


分散と共分散


分散

データの散らばり具合を表す.データの各々の値が,期待値からどれだけずれているのかを平均したもの.言い換えると,どれだけ期待通りになるかを表す.

分散$Var(f)$は,

\begin{align}

Var(f)&=E\Bigl(\bigl(f(X=x)-E(f)\bigr)^2\Bigr)\\
&=E\bigl(f^2(X=x)\bigr)-\bigl(E(f)\bigr)^2
\end{align}

絶対値を取ると面倒なので,2乗をとっている.分散の単位が元のデータの2乗になってしまうので,平方根を取る:偏差.

式変形は,期待値の線形性による.


共分散

2つのデータ系列の傾向の違いを表す.(正確に相関を表すわけではないが,傾向はつかめる.円のように点対称のデータではきれいな相関があるがゼロになる.)

- 正の値を取れば似た傾向.

- 負の値を取れば逆の傾向.

- ゼロを取れば関係性に乏しい.

共分散$Cov(f)$は,

\begin{align}

Cov(f,g)&=E\Bigl(\bigl(f(X=x)-E(f)\bigr)\bigl(g(Y=x)-E(g)\bigr)\Bigr)\\
&=E\bigl(fg\bigr)-E(f)E(g)
\end{align}

$f$と$g$のスケールを合わせるために,$Cov$を$f$,$g$のそれぞれの標準偏差の積で割る.その値を相関係数という.


様々な確率分布


ベルヌーイ分布

2種類のみの結果しか得られない試行の結果を0,1で表した分布.$\mu$は1の確率.

$$f(x) = x$$$$P(x|\mu)=\mu^x(1-\mu)^{1-x}$$すべての試行はベルヌーイ分布で表せる.

AとA以外,A以外=BとB以外,B以外=CとC以外,$\cdots$.


カテゴリカル分布(マルチヌーイ分布)

複数種の結果が得られる場合.$n$種類の結果が得られるとすると,

$$P(X=x)=\sum_{k=1}^n\lambda_k^{[x=k]}$$ただし,

[x=k] = \left\{

\begin{array}{ll}
1 & (x=k) \\
0 & (x \neq k)
\end{array}
\right.


二項分布

ベルヌーイ分布の多試行版.

$n$回試行して$x$回,確率$\lambda$の事象が起こる確率は

\begin{align}

P(x|\lambda,n)&=\frac{n!}{x!(n-x)!}\lambda ^x(1-\lambda )^{n-x} \\\\
&={}_xC_r \lambda ^x(1-\lambda )^{n-x}
\end{align}


ガウス分布

釣鐘型の連続分布

$$\mathscr{N}(x;\mu,\sigma^2)=\sqrt{\frac{1}{2\pi\sigma ^2}}\exp{\Bigl(-\frac{1}{2\sigma ^2}(x-\mu)^2}\Bigr)$$確率分布なので,全体で$1$となる.そのように係数が決められている.





DeepLearning ラビットチャレンジ