5-8 時系列[モデル作成タブ]
1.ノードの目的
統計アルゴリズムを使って過去の時系列トレンド(実績値)をモデル化し将来の予測値を求めます。ARIMAや指数平滑を手動でモデリングできますが、Autoモデリングが便利です。
2.解説動画(60秒)
3.クイックスタート
コンビニ3店舗の清涼飲料の販売数データです。販売数に影響する3種類の天候データ(連続値)と近隣の大学開講有無と特売有無が含まれています。1月1日から11月22日までが実績。11月23日から7日間は将来のため、販売数はヌル値で予報や予定のみ記録されています。
*サンプルデータ(CSV)は[5.参考情報]からダウンロードできます。
[可変長ファイル]で[データ型]タブを開きます。[大学講義]と[特売]はの尺度を[フラグ]にして[値の読み込み]ボタン(赤枠)を押してデータ型を確定させます。[データ型]ノードを用いても結構です。[日付](青枠)がカレンダーのアイコンになってストレージが[日付]になっていることを確認します。
[文字列]を[日付]に変換したい場合
[2021-01-01]や[20210101]は可変長ファイルが自動的に日付と認識しますが、別の読み込みで日付にしたい場合は[置換]ノードで to_date(変数) を使い変換します。
[データ指定]タブは[日付]を選択して、時間の単位を[日]に指定します。
ARIMAモデルのパラメータや指数平滑のアルゴリズムを選択することもできますが、[エキスパート]モデラーでAutoモデリングします。
最後の7レコード(行)は未来(計画)なので学習対象から外します。
[時系列]ノードを実行して、生成されたナゲットに[テーブル]を接続します。
[テーブル]を実行します。3つの店舗に対して予測と上限・下限の3つのフィールドが追加されています。
ナゲットをダブルクリックするとモデル結果が表示されます。店舗1は[ARIMA]が採用され、MAPEは9.2%でした。プラスマイナス9%の誤算をもつと判断できます。
4.Tips
[時系列グラフ]で結果を確認する
領域の条件抽出(フォーカス)は以下で解説してます。
95%予測上限と下限を自分で作る
[時系列]ノードを取り上げた記事
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler ノードリファレンス目次