欠損値を前後の値の平均で補間する(@SCINCE)
*逆引き5-19で重複ノードを利用して処理するストリームを紹介しています。
1.想定される利用目的
・時系列モデル作成のための欠損値の処理
・設備IoTデータの欠損値の処理
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。
b.[ソート]ノードを編集します。ID順序を反転させます。
c.[フィールド作成]ノードを編集します。欠損していないレコードが何行上にあるかを示します。先頭レコードは2が入る仕様になっています。
[プレビュー]します。
d.[フィールド作成]ノードを編集します。1行上が欠損値で、該当行は欠損していない場合、非欠損までのレコードを参照して平均値を作成します。
[プレビュー]します。
e.[ソート]ノードを編集します。元のID順に戻します。
[プレビュー]します。
f.[置換]ノードを編集します。非欠損までのレコードを本来のID順で再度求め直します。
[プレビュー]します。
g.[置換]ノードを編集します。
[プレビュー]します。
h.[フィルター]ノードを編集します。
[テーブル]を実行します。
注意点
レコードの最初と最後が欠損値ではない前提で作成されています。そのような可能性がある場合には平均ではなく同じ値を補うなどのルールを設定する必要があります。
4.参考情報
時系列の欠損値を線形補間する
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)