出力フィールドは連続型です(判別モデル)
1.想定されるトラブル
・ロジスティック回帰/C5.0などの判別予測モデル作成時にエラーが起きる
*判別モデルにカテゴリカルやフラグ型ではなく間違えて数値を予測対象にしてしまった場合に生じるエラーのハンドリング
2.ストリームとデータのダウンロード
ストリーム
データ
3.サンプルストリームの説明
a.入力は以下の通りです。
b.[データ型]ノードを編集します。[解約フラグ]の[ロール]を[対象]にして解約を予測する判別モデルを作成します。
エラーの現象を確認する
c.[ロジステック回帰]ノードを実行します。
問題を解決する
d.[データ型]ノードを編集します。[解約フラグ]の[尺度]を [連続型]から[フラグ型]に変更して[値の読み込み]ボタンを押します。
d.[ロジステック回帰]ノードを実行します。モデルが生成/更新されます。
注意事項
CHAIDやランダムフォレストなど連続量を予測できる判別モデルをこのストリームで実行するとエラーにならずモデル作成します。しかし予測値として0から1までの連続量として出力し、本来の2値いずれかを予測してスコアを求める本来の目的とは異なる結果になります。
CSVなどのテキストデータを入力すると1と0の整数2値をフラグとして判別しませんが以下のように読み込み時点で強制的に文字列にする回避策もあります。
4.参考情報
可変長ファイルノード
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)