LoginSignup
3
3

More than 5 years have passed since last update.

「異常検知と変化検知」第7章 方向データの異常検知

Last updated at Posted at 2016-06-09

7.1 方向データの確率分布

方向データとは

長さ1に規格化されたM次元ベクトル。方向だけに情報がある。
b.png

フォン・ミーゼス・フィッシャー分布

$M(x|\mu, \kappa) = \frac{\kappa^{M/2-1}}{(2\pi)^{M/2}I_{M/2-1}(\kappa)} exp(\kappa\mu^{T}x)$

  • 平均方向$\mu$
  • 集中度$\kappa$
  • 第1種変形ベッセル関数$I_{\alpha}(\kappa)$

a.png

7.2 平均方向の最尤推定

分布のパラメータのうち、平均方向をデータから推定する。(集中度$\kappa$は直接求めない。)

尤度

$L(\mu, \kappa|D) = ln\Pi_{n=1}^{N}c_{M}(\kappa)exp(\kappa\mu^Tx^{(n)}) = \sum_{n=1}^{N}(lnc_{M}(\kappa) + \kappa\mu^Tx^{(n)})$

最尤推定

尤度$L$を最大化する平均方向ベクトル$\mu$を求める。

拘束条件 $\mu^T\mu = 1$をラグランジュ係数で取り込んでを解くと

$\hat{\mu} = \frac{m}{\sqrt{m^Tm}}$

$ m \equiv \frac{1}{N}\sum_{n=1}^{N}x^{(n)}$

結果は、データ平均ベクトルを長さ1に規格化したもの

7.3 方向データの異常度とその確率分布

異常度の定義

データ$x'$の異常度

$a(x') = 1- μ^Tx'$

平均方向ベクトル$\mu$との距離を、内積を用いて表現。

異常度の確率分布

結論:異常度$a$の確率分布はχ二乗分布となる

$M(\mu, \kappa)$に従う$x'$がある時、異常度$a$の分布は

$p(a) = \int_{S_M}dx\delta(a-(1-\mu^Tx)) C_M(\kappa)exp(\kappa\mu^Tx)$

$u=\cos\theta_1$を用いて置換積分し、$a\ll1$を用いると

$p(a)\propto a^{(M-1)/2-1}exp(-\kappa a)$

これは、自由度$M-1$, スケール因子$1/2\kappa$のχ二乗分布

7.4 積率法によるχ二乗分布の当てはめ

χ二乗分布のパラメータ $m, s$を、データから推定する。

$m, s$のχ二乗分布の1次・2次モーメントは

$<a> = \int_0^{\infty}a\chi^2(a|m,s)da = ms$

$<a^2> = \int_0^{\infty}a^2\chi^2(a|m,s)da = m(m+2)s^2 $

データから求めた以下のaの1次・2次モーメントをこれらと等置して、$m, s$を求める

$<a> = \frac{1}{N}\sum_{n=1}^{N}a^{(n)}$

$<a^2> = \frac{1}{N}\sum_{n=1}^{N}a^{(n)^2}$

求めた$\hat{m}_{mo}$は一般にMよりも小さい事が多く、データの有効次元と解釈できる。

3
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
3