値をZスコアに標準化する(標準化と正規化)
1.想定される利用目的
・異なる尺度をもつフィールド(列)間の比較
・特徴量への変換(予測アルゴリズムに応じて)
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
[データの自動準備]ノードでZスコアに変換する
[設定]タブを編集します。[zスコア変換]が選ばれています。
c.[ヒストグラム]ノードを実行します。形状を変えずにフィールド間の単位に影響を受けないように標準化しています。
[レコード集計]と[レコード結合]でZスコアに変換する
d.[レコード集計]ノードを編集します。[キー]はブランクで[平均]と[標準偏差]を求めます。
e.[レコード結合]ノードを編集します。[レコード結合方法]を[キー]にして[結合キー]をブランクのままにします。
[プレビュー]します。全てのレコードに[平均]と[標準偏差]が追加されました。
f.[フィールド作成]ノードを編集します。それぞれのレコードの平均と差を標準偏差で割ります。
[min-max normalization]で正規化する
g.[データの自動準備]ノードを編集します。最小0で最大1で標準化を行うと正規化になります。
注意点
[データの自動準備]ノードをコピーして設定を変更して試す場合には[データ分析]ボタンを押して再計算させます。
4.参考情報
SPSS ModelerでZスコアを扱った記事
データの自動準備
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)