2-8 バランスノード[レコード設定タブ]
1.ノードの目的
アンバランスな対象を予測しモデルの実効性が確保できない場合にバランス調整します。
2.解説動画(60秒)
3.クイックスタート
極端にアンバランスなデータを補正します。
*データは[5.参考情報]からダウンロードできます。
生成メニューの[バランスノード(増加)]を選択します。
*NGの数が相当数確保できる場合は(減少)を利用してOKのレコードをサンプリングします。
NGをオーバーサンプリング(60倍)して比率を1:1にしています。
棒グラフからではなく[バランス]ノードに直接設定しても結構ですがこの方法が便利です。
4.Tips
モデル評価はアンバランスなオリジナルの分布で実施する
モデル構築はバランスさせても(赤枠)、評価は本来の分布(青枠)に従います。
バランスを利用しなかった場合
すべてOKと予測する意味のないモデルが作られています。(見かけ上の精度は悪くない)
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次