3-3 データ型ノード[フィールド設定タブ]
1.ノードの目的
データの型を定義し、後続の加工プロセスに必要な情報(カテゴリ値)を記憶します。またモデリングにあたって予測対象や入力変数を定義します。
2.解説動画(60秒)
3.クイックスタート
[可変長ファイル]から[データ型]に接続します。
*入力データは[5.参考情報]からダウンロードできます。
[データ型]を編集し[値の読み込み]ボタンを押します。
自動的に[尺度]が判別され、値の範囲や種類が識別されました。
予測モデルを作るのに[ロール]を定義します。例では[燃費][エンジン][車体重量][加速性]で[馬力]を予測します。
数値予測のできるモデル作成ノードに接続すると、[データ型]のロール設定に従って同じ目的のモデルを作ることができます。
データ型のヒント
後続でデータ型を要求する代表的なノード
[データ型]で予め[値の読み込み]を行うことでデータが認識され、適切に処理されます。これがないと候補フィールドにリストアップされない場合やエラーになります。
SPSS Modeler のデータ尺度
SPSS Modelerの尺度には次のものが存在します。
尺度[不明]を名義型にする
例えば256種類存在するカテゴリデータを予測の入力にするには、[ツール]>[ストリームのプロパティ]>[オプション]から以下の[名義型の最大メンバー]を256以上に変更します。
4.Tips
モデル分割
3つの生産国ごとにモデルを内部で作り分けることが可能です。[生産国]の[ロール]を[分割]にします。
モデルナゲットはひとつですが分割しているバッジが右下についています。
モデルは内部的に3つに分割して作られています。
以下の記事で[データ型]の[分割]を利用したモデルの出し分けを解説しています。
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次