0
0

値を任意の閾値でランクに分割する(SPSS Modeler データ加工逆引き3-15)

Last updated at Posted at 2022-10-18

値を任意の閾値でランクに分割する

スクリーンショット 2022-10-14 9.35.57.png

1.想定される利用目的

・優良顧客の定義
・異常検知/故障予測のための特徴量作成

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-10-14 9.47.26.png

a.入力するデータは以下の通りです。
スクリーンショット 2022-10-14 9.38.16.png

名義型の定義をヒストグラムから自動生成させる方法

b.[ヒストグラム]ノードを実行します。[表示]メニューから[インタラクティブ]をオンにして以下のように赤い縦棒を大よそ10万、20万、40万の3カ所に配置します。
スクリーンショット 2022-10-14 9.39.05.png

[生成]メニューから[バンドのフィールド作成ノード]を選択します。
スクリーンショット 2022-10-14 9.40.40.png

ストリーム領域左上に新しいノードが生成されます。
スクリーンショット 2022-10-14 9.41.27.png

生成されたノードをダブルクリックします。
スクリーンショット 2022-10-14 9.42.09.png

以下のようにフィールド名と設定値、式を整えるとCになります。
スクリーンショット 2022-10-14 9.42.59.png

式を整える時には電卓アイコン(式ビルダ)を利用すると簡単に入力できます。
スクリーンショット 2022-10-14 9.43.51.png

c.[プレビュー]します。ランクが作成されました。
スクリーンショット 2022-10-14 9.46.24.png

d.[ヒストグラム]ノードを編集します。[rank]をオーバーレイします。
スクリーンショット 2022-10-14 9.45.07.png

実行します。
スクリーンショット 2022-10-14 9.45.42.png

Clem式で条件式を記述する方法

cのノードを以下のように直接式で定義してもOKです。
スクリーンショット 2022-10-14 10.15.26.png

注意点

DからBまでのランクに該当しないデフォルト値をAランクにしましたが、業務で予期せぬ値が含まれる場合がある時は、全てのランクを定義しデフォルト値は[undef]としてNull値にするのが安全です。

4.参考情報

年齢から年代を作る

ランク分けに関する記事

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0