MER(誤差率の中央値)を求める
1.想定される利用目的
・時系列予測モデルの性能評価
・数値予測モデルの性能評価
*平均ではなく中央値を利用することで外れ値の影響を受けにくいメリットがあります。
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。日毎の来場者の実績と予測のフィールドの3列です。
b.[フィールド作成]ノードを編集します。誤差の絶対値を求めています。
[プレビュー]します。
c.[レコード集計]ノードを編集します。
[プレビュー]します。MERが表示されました。
注意事項
中央値を求める処理はSQL自動生成に対応していないため、大規模データの場合処理に時間がかかります。その際はソートやサンプリングを利用して別の出力方法を検討します。
逆引き8-16の絶対値を絶対誤差率にすることで規模の異なる複数系列の精度比較がしやすくなりました。
4.参考情報
RMSEを取り上げている記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)