1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

レコードを無作為に/層別にサンプリングする(SPSS Modeler データ加工逆引き7-10)

1
Last updated at Posted at 2022-08-18

無作為に/層別にサンプリング(バランス/コンプレックス)

スクリーンショット 2022-08-03 17.34.55.png

1.想定される利用目的

・サンプリングの精度を確保
・学習データとテストデータの品質確保

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-08-03 17.37.33.png

a.入力するデータは以下の通りです。
スクリーンショット 2022-08-03 17.39.19.png

b.[棒グラフ]ノードを編集します。
スクリーンショット 2022-08-03 17.41.13.png

[実行]します。
スクリーンショット 2022-08-03 17.29.16.png

ランダムにサンプリング

c.[サンプリング]ノードを編集します。3割を無作為抽出します。
スクリーンショット 2022-08-03 17.40.12.png

d.[棒グラフ]ノードを実行します。元データの規模があるため無作為でも分布はほぼ維持されます。
スクリーンショット 2022-08-03 17.40.53.png

層別にサンプリング

e.[バランス]ノードを編集します。それぞれの値の比率を確定します。
スクリーンショット 2022-08-03 17.41.39.png

f.[棒グラフ]ノードを実行します。
スクリーンショット 2022-08-03 17.29.50.png

サンプリングノードのコンプレックスを利用する

g.[サンプリング]ノードを利用するとeと同じことやさらに複雑な設定が可能です。
スクリーンショット 2022-08-03 17.42.48.png

注意事項

Mac版の18.3と18.4ではコンプレックスサンプル機能の動作が安定しないので注意してください。

4.参考情報

[サンプリング]ノードを扱った記事

[バランス]ノードを扱った記事

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?