RMSE(二乗平均平方根誤差)を求める
1.想定される利用目的
・時系列予測モデルの性能評価
・実装後の時系列モデルメンテナンスのための性能指標の算出
・機械学習モデルによる時系列予測を行った場合の性能評価
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。日毎の来場者の実績と予測のフィールドの3列です。
b.[時系列]グラフノードを実行します。予測の精度を表すRMSEを求めます。
c.[時系列]モデルナゲットを編集します。時系列ノードで予測すると[RMSE]が出力されます。値は小さいほど予測精度が高いことを示します。
[時系列]ノードを利用した予測モデルの作成は以下を参照ください。
RMSEを計算する
f.[フィールド作成]ノードを編集します。一般に利用される式を利用しています。
g.[フィールド作成]ノードを編集します。SPSS Modelerが採用している式を利用しています。
SPSS Modelerでは予測モデルに利用されたパラメータの数から1を引いた数で按分する処理を加えることで過学習を回避する工夫がなされています。
[プレビュー]します。調整済みRMSEが表示されました。cの値と一致しています。
注意事項
今回はモデルナゲットのMAPEと比較するために[メニュー]>[ストリームのプロパティ]で表示する小数点桁数を揃えています。
4.参考情報
RMSEを取り上げている記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)