無作為に/層別にサンプリング(バランス/コンプレックス)
1.想定される利用目的
・サンプリングの精度を確保
・学習データとテストデータの品質確保
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
ランダムにサンプリング
c.[サンプリング]ノードを編集します。3割を無作為抽出します。

d.[棒グラフ]ノードを実行します。元データの規模があるため無作為でも分布はほぼ維持されます。

層別にサンプリング
e.[バランス]ノードを編集します。それぞれの値の比率を確定します。

サンプリングノードのコンプレックスを利用する
g.[サンプリング]ノードを利用するとeと同じことやさらに複雑な設定が可能です。

注意事項
Mac版の18.3と18.4ではコンプレックスサンプル機能の動作が安定しないので注意してください。
4.参考情報
[サンプリング]ノードを扱った記事
[バランス]ノードを扱った記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)





