値の最頻値を残して重複を削除する(代表価格の算出)
1.想定される利用目的
・事実上の定価(代表価格)の算出
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。 顧客の商品購入履歴情報の一部です。
b.[重複]ノードを編集します。[グループ化のキーフィールド]は[商品]を選択します。
[複合]タブで[次を基準とする値を入れる]に[カスタム...]を選択します。

[出現頻度で選択]を選びます。[使用]に [最も高い頻度]を [結合基準]には[最後を使用]を選びます。
以下のように設定されます。
[テーブル]を実行します。
注意事項
最大値を定価とする場合もありますが、誤った値が偶発的に含まれることを想定して最頻値をを紹介しました。
[価格]を連続値にしておくとカスタムで最頻値選択ができません。入力時に[順序尺度]のようなセット値(カテゴリデータ) にしておく必要があります。
4.参考情報
重複する不要なレコード(行)を削除する
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)







