SPSS Modelerで、データ量が膨大である一方、故障など対象事象が極めて少ない場合の分析はどうすればいいでしょうか。
Q&A
Closed
1
Q&A
Closed
1.不均衡データを増幅したり、減少させるという方法があります。
バランスノードやSMOTEを使います。
SPSS Modeler ノードリファレンス 2-8 バランス - Qiita
機械学習時代の申し子「SMOTEノード」が不均衡データの壁を突破する
2.データ量が少なすぎて検証データを確保できない場合には交差検証という方法があります。
[Q&A] SPSS Modelerで交差検証は可能でしょうか? - Qiita
3.対象事象があまりにも少なすぎる
対象事象があまりにも少ない場合や故障といっても様々なバリエーションがある場合は故障予測は難しいかもしれません。
異常検知の手法を使うという方法もあると思います。
SPSS Modelerで異常検知 - Qiita
書籍「実践! 異常検知と故障予測―IBM SPSS ModelerによるIoT時系列データ活用」の1章「異常を検知する」では様々な手法や実践例が紹介されています。また2章の「故障を予測する」の2-3でもアンバランスなデータの処理ということで1や2の点についても解説があります。