95%予測区間を求める
1.想定される利用目的
・時系列予測モデルの性能評価と異常値検知
・実装後の時系列モデルメンテナンスのための性能確認
・機械学習モデルによる時系列予測を行った場合の性能評価と異常値検知
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。日毎の来場者の実績と予測のフィールドの3列です。

*逆引き8-11/12と予測値が異なったサンプルデータです。
c.[レコード集計]ノードを編集します。[キー]をブランクにして誤差平方和を求めます。

d.[レコード結合]ノードを編集します。[結合キー]をブランクにしてcで求めた1レコードの誤差平方和をオリジナルデータの全てに付与します。

e.[フィールド作成]ノードを編集します。各レコードの推定値の標準誤差を求めます。

f.[フィールド作成]ノードを編集します。各レコードの予測フィールドからeを引いて95%予測下限が作られます。

g.[フィールド作成]ノードを編集します。各レコードの予測フィールドにeを加えて95%予測上限が作られます。式は[予測 + (1.96 * 推定値の標準誤差)]です。
[プレビュー]します。予測区間の下限と上限が作成されました。

h.[条件抽出]ノードを編集します。[日付 >= datetime_date(2022, 8, 15)]で8月15日以降にフォーカスします。
注意事項
時系列予測ノードを利用すると95%予測区間は求まります。この手続きが必要なのは、実装後に異常検知を行う場合や、機械学習モデルでトレンド分析を実施ているケースです。
4.参考情報
95%予測区間を扱った記事
ストリーミング時系列ノードで95%予測区間の外側を異常値判定する
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)




