1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ヒストグラムからマウスで外れ値を除外/フラグ化する(SPSS Modeler データ加工逆引き10-15)

Posted at

ヒストグラムからマウスで外れ値を除外/フラグ化する

スクリーンショット 2024-05-07 8.54.34.png

1.想定される利用目的

・ 特徴量作成のために分布を確認しながら値をカテゴリやフラグに分割する
・ 予測モデル構築の際に精度の安定性を求めて外れ値を除外する

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2024-05-07 8.54.49.png

a.入力するデータは次の通りです。
スクリーンショット 2024-04-22 10.56.17.png

b.[ヒストグラム]ノードを編集します。
スクリーンショット 2024-04-22 10.57.56.png

[実行]します。値が160を超えると外れ値と認定することにします。
スクリーンショット 2024-05-07 8.59.10.png

分布を確認しながら外れ値を除去する

[表示]メニューから[インタラクティブ]にチェックを入れて、ツールボタンを表示させます。
スクリーンショット 2024-04-22 10.58.55.png

赤枠のボタンを押して、マウスで以下のように分割します。
スクリーンショット 2024-05-07 8.59.51.png

赤い縦棒の右側で右クリックし[バンドの条件抽出ノード]を選択します。cのノードが自動生成されます。
スクリーンショット 2024-05-07 9.00.40.png

c.[条件抽出]ノードを編集します。閾値をキリの良い値に編集することも可能です。
スクリーンショット 2024-05-07 9.01.40.png

d.[ヒストグラム]ノードを実行します。外れ値が除去できました。
スクリーンショット 2024-05-07 9.01.29.png

分布を確認しながら外れ値にフラグを立てる

先のbのヒストグラムで以下のように[生成]メニューから[バンドのフィールド作成ノード]を選択します。dのノードが自動生成されます。

スクリーンショット 2024-05-07 9.01.04.png

e.[フィールド作成]ノードを編集します。閾値をキリの良い値に編集することも可能です。
スクリーンショット 2024-05-07 9.01.51.png

f.[ヒストグラム]ノードを編集します。
スクリーンショット 2024-05-07 9.02.09.png

[実行]します。
スクリーンショット 2024-05-07 9.02.25.png

注意事項

ビンを2本立てて中央のみ抽出や除去も同じ手続きで可能です。

スクリーンショット 2024-05-07 10.14.02.png

4.参考情報

ヒストグラムをマウスでビン分割しバンドを作成する

値を25%(四分位)のランク毎に集計する

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?