欠損値を前後の値の平均で補間する(重複レコード)
*逆引き5-20で関数@SCINCEを利用して処理するストリームを紹介しています。
1.想定される利用目的
・時系列モデル作成のための欠損値の処理
・設備IoTデータの欠損値の処理
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。
b.[フィールド作成]ノードを編集します。欠損値の連続を考慮した通し番号を作成します。列方向に参照するオフセット関数を利用します。[@OFFSET(フィールド,1)]でフィールドの値の1行上を参照します。
[プレビュー]します。何期連続しても欠損値はひとつのグループだと識別しています。
c.[重複レコード]ノードを編集します。
[プレビュー]します。
d.[フィールド作成]ノードを編集します。置換では1期先読みができないので新しい列として欠損補間します。
[プレビュー]します。
e.[フィルター]ノードを編集します。
f.[レコード結合]ノードを編集します。欠損値の連続をまとめて計算していますので本来のレコードに割り当てます。
[プレビュー]します。
g.[フィルター]ノードを編集します。
h.[ソート]ノードを編集します。
[テーブル]を実行します。
注意点
レコードの最初と最後が欠損値ではない前提で作成されています。そのような可能性がある場合には
平均ではなく同じ値を補うなどのルールを設定する必要があります。
4.参考情報
時系列の欠損値を線形補間する
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)














