欠損値を周囲中央値(スパン2)で置換する
*時系列ストリーミングノードやStatistics変換によっても実現可能ですが、加工ノードの組み合わせで実現する方法を紹介します。
1.想定される利用目的
・突発的な異常値が想定される欠損レコードの補間
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
b.[条件抽出]ノードを編集します。欠損値を意図的に破棄します。@NULL(フィールド)でフィールド=欠損の状態を表します。

c.[フィールド作成]ノードを編集します。@OFFSET(フィールド,1)でフィールドの1レコード上(1期前)を参照します。

d.1期後を参照するために@OFFSET(フィールド,-1)でCと同じものを作成します。
e.2期後を参照するために@OFFSET(フィールド,-2)でCと同じものを作成します。
f.[フィールド作成]ノードを編集します。①1レコード前②現在のレコード③1レコード後④2レコード後の4つのメンバーから最小と最大を排除して、残る二つの平均を計算し中央値を求めます。

g.[レコード結合]ノードを編集します。完全外部結合でキーを[日付]と[最高気温]にします。

h.[データ型]ノードを編集します。[欠損値]項目をオンにします。

i.[フィールド作成]ノードを編集します。@LAST_NON_BLANKで欠損値には直前の値を代入します。

注意点
スパン2でストリームを作成しましたが、スパンの長さに応じてノードや関数を変更します。また時系列の開始や終了は関数の整合性が保たれているかを注意します。
4.参考情報
空白に直前の値を代入する
Statisticsの加工機能で周囲中央値による欠損の補間を行う
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)







