データ周期の集約
1.想定される利用目的
・センサーデータの周期の統一
・時系列データのデータ量削減
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
入力するデータは以下の通りです。1分おきにセンサーデータが発生しています。
①.[フィールド作成]ノードを編集します。取り出したい周期でグループ化するインデックスを作ります。
CLEM式に「(@INDEX-1) div 15」を入力します。
ここでは15回で1サイクルの周期にしています。divで割る値で周期は調整可能です。例えば(@INDEX-1) div 10にすれば10分おきの周期にできます。
②.[レコード集計]ノードで[キーフィールド]を[周期]に設定します。そして、[TS]の[最小値]と[VAL]の[平均]を求めます。[平均]ではなく[中央値]で代表値を作ることもできます。
[テーブル]を実行します。15分周期でデータを平均や中央値で集約することができました。
TIPS
逆にデータの周期をより細かいデータに統一したいこともあると思います。その場合には線形補間をすることが可能です。
時系列の欠損値を線形補間する(SPSS Modeler データ加工逆引き5-9)
4.参考情報
線形補間について解説した記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)