値を任意の閾値でランクに分割する
1.想定される利用目的
・優良顧客の定義
・異常検知/故障予測のための特徴量作成
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
名義型の定義をヒストグラムから自動生成させる方法
b.[ヒストグラム]ノードを実行します。[表示]メニューから[インタラクティブ]をオンにして以下のように赤い縦棒を大よそ10万、20万、40万の3カ所に配置します。
[生成]メニューから[バンドのフィールド作成ノード]を選択します。
以下のようにフィールド名と設定値、式を整えるとCになります。
式を整える時には電卓アイコン(式ビルダ)を利用すると簡単に入力できます。
d.[ヒストグラム]ノードを編集します。[rank]をオーバーレイします。
Clem式で条件式を記述する方法
注意点
DからBまでのランクに該当しないデフォルト値をAランクにしましたが、業務で予期せぬ値が含まれる場合がある時は、全てのランクを定義しデフォルト値は[undef]としてNull値にするのが安全です。
4.参考情報
年齢から年代を作る
ランク分けに関する記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)