ヒストグラムからマウスで外れ値を除外/フラグ化する
1.想定される利用目的
・ 特徴量作成のために分布を確認しながら値をカテゴリやフラグに分割する
・ 予測モデル構築の際に精度の安定性を求めて外れ値を除外する
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
[実行]します。値が160を超えると外れ値と認定することにします。
分布を確認しながら外れ値を除去する
[表示]メニューから[インタラクティブ]にチェックを入れて、ツールボタンを表示させます。
赤い縦棒の右側で右クリックし[バンドの条件抽出ノード]を選択します。cのノードが自動生成されます。
c.[条件抽出]ノードを編集します。閾値をキリの良い値に編集することも可能です。
d.[ヒストグラム]ノードを実行します。外れ値が除去できました。
分布を確認しながら外れ値にフラグを立てる
先のbのヒストグラムで以下のように[生成]メニューから[バンドのフィールド作成ノード]を選択します。dのノードが自動生成されます。
e.[フィールド作成]ノードを編集します。閾値をキリの良い値に編集することも可能です。
注意事項
ビンを2本立てて中央のみ抽出や除去も同じ手続きで可能です。
4.参考情報
ヒストグラムをマウスでビン分割しバンドを作成する
値を25%(四分位)のランク毎に集計する
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)