2-10 ストリーミング時系列分析[レコード設定タブ]
1.ノードの目的
実行するたびに時系列予測を更新し異常値検知や、特徴量の補完を行います。
*5-8時系列ノードは確定したモデルを新規データにスコアリングしますが、このストリーミング時系列分析は定期バッチで最新データを学習、予測し続けるのに向いています。
2.解説動画(60秒)
3.クイックスタート
本日9月27日現在の気温33度が異常かどうかを判断します。
*データは[5.参考情報]からダウンロードできます。
[可変長ファイル]、[ストリーミング時系列分析]、[フィールド作成]、[テーブル]の順でノードを接続します。
[可変長ファイル]を編集し、[データ型]タブで[値の読み込み]ボタンを押して、型を確定しておきます。
[ストリーミング時系列分析]ノードを編集します。予測対象は[最高気温]です。
[データ指定]タブで[日付/時刻フィールド]と[時間区分]を以下のように設定します。
[プレビュー]を実行します。Autoモデリング(エキスパートモデラー)によってモデルの自動選択とパラメータの最適化が行われています。予測値($TS-最高気温)と予測下限(LCI)上限(UCI)の3つのフィールドが追加されています。
95%の予測区間に実績含まれるかどうかを[フィールド作成]のフラグフィールドで表現します。
[テーブル]を実行します。最新の9月26日の最高気温が95%の予測上限を超えたために異常フラグが立ちました。
4.Tips
[サンプリング]ノードでは古い200レコード(行)を破棄します。
[時系列グラフ]を実行します。設備の異常検知業務では異常の発報と併せてグラフを表示すると現場での取り組みが円滑になります。
予測区間の設定
予測区間については以下の記事で詳しく扱っています。
Autoモデリングではなく手動でモデリングする場合
5-8 時系列ノードを参照ください。
欠損値の線形補間に利用する。
欠損値の線形補間については以下の記事で詳しく扱っています。
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次