3-14 データの自動準備ノード[フィールド作成]
1.ノードの目的
事前に定義された予測対象にあうようにフィールド(列)を変換します。Zスコアによる値の標準化や欠損値の処理などを実施します。
2.解説動画(60秒)
3.クイックスタート
以下の[NGフラグ]の予測精度を高めるために各フィールド(列)を自動変換します。
*入力データは[5.参考情報]からダウンロードできます。
[可変長ファイル]に[データ区分]、[Random Trees]を接続します。
*データ区分は学習と検証データに自動振り分けするノードです。詳しくはノードリファレンス3-7を参照ください。
[可変長ファイル]を編集します。[データ型]タブで[値の読み込み]ボタンを押してから[NG]フラグを[対象]に変更して予測対象にします。[ID]も[レコードID]に変更します。
[Random Trees]を実行します。モデルナゲットができたら[精度分析]を接続します。
[データの自動準備]ノードをバインドして、もう一度[Random Trees]を実行します。
4.Tips
自動変換のための速度と精度のバランスを選択
予測モデルと同等の処理をするために、精度と時間のどちらを優先するかが選択可能です。
不要なフィールドの選定
特徴量選択ノード(ノードリファレンス5-14)の機能を一部ここで利用できます。
データの品質の改善と値の標準化
カテゴリのメンバー統合と特徴量選択
カテゴリグループの統合や特徴量選択(特徴量選択ノードと同じ働き)を行います。
Autoモデリングとの併用を紹介した記事
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次