1-3 ユーザー入力ノード[入力タブ]
1.ノードの目的
データを直接生成することができます。欠損のない時系列マスターデータを作成し、以下のように欠落したレコードを補完するのに利用します。
他にも想定できる全ての組み合わせのデータを生成し、①予測モデルが最も高収益を期待できるパターンの抽出や、価格弾力カーブの生成に利用できます。また予測モデルに検査したいシミュレーション用レコードの作成にも使われます。
2.解説動画(60秒)
3.クイックスタート
[フィールド]に[番号]と入力し、[ストレージ]は[整数]を選択。[値]に[ 1 ; 13 ]を入力します。
[テーブル]を実行すると1から13までの連番レコードができています。
[フィールド]に[絵柄]を追加し、[ストレージ]は[文字列]を選択。[値]に[ "スペード" "クラブ" "ハート" "ダイヤ" ]と入力します。[画面下]のラジオボタンが[すべての組み合わせ]になっていますので13の番号に4つの絵柄の52通りのデータが生成されます。
[テーブル]を実行すると13ある番号に4つの絵柄の総当たりで52種類のレコードができています。
ユーザー入力ノードの注意点
フィールドと値の組み合わせ次第で何百万件という膨大なデータを生成することができます。不必要なレコード生成はパフォーマンスの低下につながるため、赤枠の生成後レコード数に注意してください。
4.Tips
予測モデルのスコアリングデータを作成(1レコード)
ノードリファレンス5-1の重回帰モデルを例にします。
目的変数は[馬力]で説明変数には4つのフィールドを用いています。
[可変長入力]ノード上で右クリックして[ユーザー入力ノードの生成]を選択します。
生成された[ユーザー入力]を以下のようにモデルに接続します。
[燃費][エンジン][車体重量][加速性]に以下の値を入力します。
[テーブル]を実行します。説明変数を確定したので、この1レコードで予測値を求められました。
予測モデルのスコアリングデータを作成(複数レコード)
[燃費]を3種類、[エンジン]4種類、[車体重量]が2種類で[加速性]を4種類の240パターン準備します。想定する範囲で最も高い馬力が期待できる変数の組み合わせを特定することができます。燃費はスペースを空けて3種類を記述していますが(赤矢印)、加速性(4種類)のように[12.5,12.8,0.1]のように開始,終了,単位で効率良く増幅することが可能です。
[フィールド作成]でレコード番号[case]を作ります。関数は@INDEX。予測値の高い順にソートします。
価格弾力を推定するためにユーザー入力ノードを利用する
##5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次