LoginSignup
3
1

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 2-8 バランス

Last updated at Posted at 2022-03-22

2-8 バランスノード[レコード設定タブ]

107_89バランス.png

1.ノードの目的

アンバランスな対象を予測しモデルの実効性が確保できない場合にバランス調整します。
スクリーンショット 2022-03-15 15.56.32.png
スクリーンショット 2022-03-15 16.03.43.png

2.解説動画(60秒)

3.クイックスタート

極端にアンバランスなデータを補正します。
*データは[5.参考情報]からダウンロードできます。

スクリーンショット 2022-03-15 16.20.23.png

[可変長ファイル]、[棒グラフ]の順でノードを接続します。
スクリーンショット 2022-03-15 16.22.57.png

[判定]の棒グラフを表示します。
スクリーンショット 2022-03-15 16.23.25.png

生成メニューの[バランスノード(増加)]を選択します。
スクリーンショット 2022-03-15 16.24.47.png
*NGの数が相当数確保できる場合は(減少)を利用してOKのレコードをサンプリングします。

[バランス]ノードが自動生成されました。
スクリーンショット 2022-03-15 16.26.41.png

NGをオーバーサンプリング(60倍)して比率を1:1にしています。
棒グラフからではなく[バランス]ノードに直接設定しても結構ですがこの方法が便利です。
スクリーンショット 2022-03-15 16.26.56.png

自動生成した[バランス]ノードをバインドします。
スクリーンショット 2022-03-15 16.30.21.png

ほぼ等数に補正されました。
スクリーンショット 2022-03-15 16.30.53.png

4.Tips

モデル評価はアンバランスなオリジナルの分布で実施する

モデル構築はバランスさせても(赤枠)、評価は本来の分布(青枠)に従います。
スクリーンショット 2022-03-15 16.38.48.png

[精度分析]の結果は以下の通りです。
スクリーンショット 2022-03-15 16.42.58.png

バランスを利用しなかった場合

スクリーンショット 2022-03-15 16.41.56.png
すべてOKと予測する意味のないモデルが作られています。(見かけ上の精度は悪くない)
スクリーンショット 2022-03-15 16.42.13.png

5.参考情報

利用データ

右クリックでリンク先を保存してください。

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1