1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

IQR(四分位範囲)の1.5倍を外れ値として削除/抽出する(SPSS Modeler データ加工逆引き3-16)

Last updated at Posted at 2022-10-19

IQR(四分位範囲)の1.5倍を外れ値として削除/抽出する

スクリーンショット 2022-10-14 13.54.49.png

1.想定される利用目的

・予測モデルの精度安定化のための前処理
・異常検知のためのデータ理解

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-10-14 18.24.59.png

a.入力するデータは以下の通りです。[Cate]は箱ヒゲ図を表示させるための便宜的なグループ番号です。
スクリーンショット 2022-10-14 14.29.00.png

[データ検査]ノードを利用する方法

b.[データ検査]ノードを編集します。外れ値を4分位から1.5倍で設定し[実行]します。
スクリーンショット 2022-10-14 18.28.02.png

[アクション]の項目を[破棄]に選択します。
スクリーンショット 2022-10-14 18.29.10.png

[生成]メニューからスーパーノードを生成します。cが自動生成されます。
スクリーンショット 2022-10-14 18.30.05.png

c.ズームインして条件が[破棄]されていることを確認します。
スクリーンショット 2022-10-14 18.30.46.png

[テーブル]を実行します。外れ値を除外した99,351レコードが抽出されました。
スクリーンショット 2022-10-14 18.32.04.png

d.ズームインして条件が[含める]になっていることを確認します。
スクリーンショット 2022-10-14 18.31.17.png

[テーブル]を実行します。外れ値に該当する649レコードが抽出されました。
スクリーンショット 2022-10-14 18.32.49.png

[レコード集計]ノードと[レコード結合]ノードを利用する方法

e.[グラフボード]ノードを実行します。箱ヒゲ図の上下にプロットされた丸を外れ値と定義して削除/抽出します。
スクリーンショット 2022-10-14 14.03.05.png

f.[レコード集計]ノードを編集します。第1四分位と第3四分位を求めます。
スクリーンショット 2022-10-14 14.03.48.png

g.[レコード結合]ノードを編集します。全てのレコードにcで求めたふたつの値を全て付与するために[レコード結合方法]は[キー]にしながら[結合キー]はブランクにします。
スクリーンショット 2022-10-14 14.04.21.png

h.[フィールド作成]ノードを編集します。四分位範囲を作成します。
スクリーンショット 2022-10-14 14.05.15.png

[プレビュー]します。
スクリーンショット 2022-10-14 14.06.00.png

i.[フィールド作成]ノードを編集します。外れ値フラグを作ります。
スクリーンショット 2022-10-14 14.08.03.png

j.[ヒストグラム]ノードを実行します。
スクリーンショット 2022-10-14 14.08.47.png

k.[条件抽出]ノードを編集します。iと同じ式で外れ値を破棄しています。
スクリーンショット 2022-10-14 14.10.43.png

[プレビュー]します。iで作成した外れ値フラグがないものだけが抽出されています。
スクリーンショット 2022-10-14 14.11.19.png

l.[条件抽出]ノードを編集します。kと同じ式でモードを反転し外れ値を抽出しています。
スクリーンショット 2022-10-14 14.09.32.png

[プレビュー]します。iで作成した外れ値フラグがあるものだけが抽出されています。
スクリーンショット 2022-10-14 14.10.02.png

注意点

今回は箱ヒゲ図で利用するIQRを外れ値として利用しましたが、標準偏差を利用する方法も一般的です。

4.参考情報

データの自動準備の外れ値処理

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?