LoginSignup
3
2

More than 5 years have passed since last update.

PRML 2.4

Last updated at Posted at 2017-08-22

指数型分布族

$p(x|η)=h(x)g(η)exp(η^Tu(x))$ ・・・(2.194)
 $η$:分布の自然パラメータ
 $x$:ベクトル/スカラー・離散/連続 
 $u(x)$:xの任意の関数
 $g(η)$:正規化係数 (2.195)

ベルヌーイ分布

22767.jpg

(2.194)と比較して、
 $u(x)=x$
 $h(x)=1$
 $g(η)=σ(-η)$
とできるのでベルヌーイ分布は指数型分布族.

多項分布

22768.jpg

(2.194)と比較して、
 $u(x)=x$
 $h(x)=1$
 $g(η)=1$
とできる.
ただし、$\sum_{k=1}^Mμ_k=1$

より、パラメータ $μ_k$のうちM-1個の値が与えられると残りのパラメータは決定するため、 

$η_k$は独立ではない。

M$ を $μ_1~μ{M-1}$で表す。

22774.jpg
(2.212)を得る。
これを$μ_k$について解く。
22775.jpg
(2.213)を得る。これをソフトマックス関数、正規化指数関数と呼ぶ。
このもとで、
スクリーンショット 2017-08-22 16.53.19.png
より多項分布は(2.214)の形をとる。
(2.194)と比較して、
 $u(x)=x$
 $h(x)=1$

 $g(η)=(1+\sum_{k=1}^{M-1}exp(η_k))^1$
とでき、指数型分布族の標準形になっている。

ガウス分布

22778.jpg
よって(2.220)~(2.223)が得られ、ガウス分布は指数型分布族.

ηを最尤推定

正規化条件(2.195)の両辺の勾配を求める。→(2.224)
(2.224)の各項を(2.195)で割ると(2.225)が得られる。
$Δln g(η)=\frac{Δg(η)}{g(η)}$ より、
$E[u(x)]=-Δlng(η)$
○ $u(x)$の期待値は$g(η)$のみに依存することがわかるので、指数型分布族の分布を正規化できれば、その分布のモーメントは単に微分すれば求められる。

スクリーンショット 2017-08-22 18.56.17.png
$η_{ML}$は $\sum u(x)$のみに依存している。

十分統計量

$\sum_nu(x_n)をp(x|η)$の十分統計量と呼ぶ
○ データ集合全体を保持する必要はなく、この十分統計量の値だけ保持していれば良い.
(例)
ベルヌーイ分布
$u(x)=x$より、データ点{$x_n$}の総和を保持すれば良い.
ガウス分布
$u(x)=(x,x^2)^T$より、{$x_n$}の総和、{$x_n^2$}の総和を保持すれば良い.

共役事前分布

 尤度関数と掛けて事後分布を求めると、その関数形が同じになるような事前分布。
指数型分布族の任意の分布について、共役事前分布は
$p(η|χ,ν)=f(χ,ν)g(η)^νexp(νη^Tχ)$・・・(2.229) とかける。
 $f(χ,ν)$は正規化係数.
 $g(η)$は(2.195)と同じ.
確かに、事前分布(2.229)に尤度関数(2.227)をかけると(2.230)が得られる。
これは(2.229)と同じ関数形なので、この事後分布は共役である。

共役事前分布の例

スクリーンショット 2017-08-22 17.47.48.png

無情報事前分布

事前分布に対する知見がないとき、事後分布に用いる事前分布の影響が少なくなるような事前分布.

無情報事前分布の例

①平行移動不変性を持つ事前分布
$p(x|μ)=f(x-μ)$
μ:位置パラメータ
これはxを定数分移動しても同じ形式が保たれる=平行移動不変性

(特徴)
$p(σ)=const$

スクリーンショット 2017-08-22 18.30.43.png

②尺度不変性を持つ事前分布
$p(x|σ)=\frac{1}{σ}f(\frac{x}{σ})$
σ:尺度パラメータ
これはxを定数倍拡大縮小しても同じ形式が保たれる=尺度不変性

(特徴)
$p(σ)∽\frac{1}{σ}$ ・・・(1)
変則事前分布になる ・・・(2)
$p(lnσ)=const$ ・・・(3)
(1) $p(σ)=\frac{a}{σ}$(aは定数)を(2.)に代入
(2) 範囲は0以上→積分が発散するので規格化不可
(3) $p(σ)=\frac{a}{σ}$(aは定数)と置く。
 $t=lnσ$と置くと、
 $\frac{dt}{dσ}=\frac{1}{σ}$ ⇔ $\frac{dσ}{dt}=σ$
 より、$p(lnσ)=p(t)=p(σ)\frac{dσ}{dt}=\frac{a}{σ}σ=a$

スクリーンショット 2017-08-22 18.56.17.png

3
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
2