2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

欠損値を周囲中央値で置換する(SPSS Modeler データ加工逆引き5-14)

Last updated at Posted at 2023-04-19

欠損値を周囲中央値(スパン2)で置換する

スクリーンショット 2023-04-19 9.15.24.png

*時系列ストリーミングノードやStatistics変換によっても実現可能ですが、加工ノードの組み合わせで実現する方法を紹介します。

1.想定される利用目的

・突発的な異常値が想定される欠損レコードの補間

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2023-04-19 9.05.02.png

a.入力するデータは以下の通りです。
スクリーンショット 2023-04-19 9.07.34.png

b.[条件抽出]ノードを編集します。欠損値を意図的に破棄します。@￰NULL(フィールド)でフィールド=欠損の状態を表します。
スクリーンショット 2023-04-19 9.16.24.png

c.[フィールド作成]ノードを編集します。@￰OFFSET(フィールド,1)でフィールドの1レコード上(1期前)を参照します。
スクリーンショット 2023-04-19 9.17.02.png

[プレビュー]します。
スクリーンショット 2023-04-19 9.17.54.png

d.1期後を参照するために@￰OFFSET(フィールド,-1)でCと同じものを作成します。

e.2期後を参照するために@￰OFFSET(フィールド,-2)でCと同じものを作成します。

f.[フィールド作成]ノードを編集します。①1レコード前②現在のレコード③1レコード後④2レコード後の4つのメンバーから最小と最大を排除して、残る二つの平均を計算し中央値を求めます。
スクリーンショット 2023-04-19 9.19.04.png

[プレビュー]します。
スクリーンショット 2023-04-19 9.20.23.png

g.[レコード結合]ノードを編集します。完全外部結合でキーを[日付]と[最高気温]にします。
スクリーンショット 2023-04-19 9.20.37.png

h.[データ型]ノードを編集します。[欠損値]項目をオンにします。
スクリーンショット 2023-04-19 9.21.14.png

i.[フィールド作成]ノードを編集します。@￰LAST_NON_BLANKで欠損値には直前の値を代入します。
スクリーンショット 2023-04-19 9.22.11.png

[プレビュー]します。
スクリーンショット 2023-04-19 9.22.54.png

j.[フィールド作成]ノードを編集します。
スクリーンショット 2023-04-19 9.23.13.png

[テーブル]を実行します。
スクリーンショット 2023-04-19 9.23.47.png

注意点

スパン2でストリームを作成しましたが、スパンの長さに応じてノードや関数を変更します。また時系列の開始や終了は関数の整合性が保たれているかを注意します。

4.参考情報

空白に直前の値を代入する

Statisticsの加工機能で周囲中央値による欠損の補間を行う

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?