KDD2015 A PCA-Based Change Detection Framework for Multidimensional Data Streamsを読んだ
どんなもの?
多次元データストリームの変化検知の手法を提案
先行研究と比べると?
- PCAを使うことを利用して分布の比較を行う
- 閾値を自動で更新していく
技術や手法のキモはどこ?
- PCAで次元を落とすと同時に、各次元で比較(スコアの計算)することで並列計算できるようにした
- PCA計算で得られる固有値からスコア計算ができるので計算が楽になる
どうやって有効だと検証した?
人工データと実データで精度と実行時間で比較。計算コストも算出した。
精度
- True positive
- late detection
- false negative
- true negative
F1値とPCAでどこまで次元を削れるか、その時どのくらい時間がかかるかを示した