#本記事のモチベーション
- 製造業では異常検知が結構案件として出てくる
- 異常検知は時系列系にも役立つ、というか見方を変えると異常検知のタスクだったとかある
といことで異常検知を学んでいきましたので備忘録
読んだ本
#1冊目:統計的工程管理―製造のばらつきへの新たなる挑戦
著者:仁科 健
出版社: 朝倉書店
発売日: 2009/12/1
#感想
- 製造業向け、QC工程表とか腐らせずに管理できている会社ならこのレベルまで実現できているのか?
- やはり管理コストをかける半導体の話が多い様子
- X-bar管理などは有名だけど、累積和やV-maskのような単純な考え方で生成してくるデータの異常を知る方法は大変に面白かった
- 重回帰やARIMAも一部アリ
- 異常検知の異常度判定基準がISOやJISで参考に決められていることを初めて知った
余談
現実は管理手法よりも、「管理していこう」という合意を取り付けて危機感を持ってもらってデータ化するという壁がある...
#2冊目:異常検知と変化検知
著者:井手剛
出版社: 講談社
発売日: 2015/8/7
#感想
- 紹介されている方法が多い
- 初心者からするとレベルはかなり高かった
- 異常検知でのアプローチの方法はパターンがありそうで、特定の特徴量空間に落としてから異常なデータとの距離を測る
- 距離は確率分布で確率値を計算したりする場合もある
- ラベルがない場合は1class-SVMのように正常データの超球を定義してそこから外れたかどうかを判別する
- EMアルゴリズムの説明が非常にわかりやすかった
#3冊目:入門 機械学習による異常検知―Rによる実践ガイド
著者:井手剛
出版社: コロナ社
発売日: 2015/2/19
#感想
- この本を一番初めに読んでおけばよかった
- 数学的な記述も多くて初心者にはレベルが高いかと思ったけれども、時間をかければ理解できるように工夫されていた
- 統計や線形代数の入門本をおさらいすることで読み進められる
- 付録参照の部分はさすがにレベルが高い
- タイトルにもある通り、Rを使って動かせるのでパッケージの中身まで確認できる程度にRに詳しければより理解しやすい
#4冊目:データマイニングによる異常検知
著者:山西 健司
出版社: 共立出版
発売日: 2009/5/23
#感想
- EMアルゴリズムや平滑化を使って確率分布求めて珍しさを求める
- コマンドの遷移確率からロボットを検知する
- 自己相関からありえない波形を判断する
- など、他の本でも似たような記述はあるが、セキュリティやリアルタイムに増え続けるデータを想定した話が多くて具体的な使い道をイメージしやすかった
#5冊目:Pythonと実例で学ぶ機械学習 識別・予測・異常検知
著者:福井健一
出版社: オーム社
発売日: 2018/11/27
#感想
- amazonレビューがすこぶる悪くて買う前に心配した
- どの本にも言えることだけど、悩んだら図書館で借りて様子見してからの購入をオススメする
#以上