1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 3-14 データの自動準備

Last updated at Posted at 2022-06-26

3-14 データの自動準備ノード[フィールド作成]

194-161自動準備.png

1.ノードの目的

事前に定義された予測対象にあうようにフィールド(列)を変換します。Zスコアによる値の標準化や欠損値の処理などを実施します。

以下のイメージを実現します。
スクリーンショット 2022-06-21 9.14.01.png

2.解説動画(60秒)

3.クイックスタート

以下の[NGフラグ]の予測精度を高めるために各フィールド(列)を自動変換します。
*入力データは[5.参考情報]からダウンロードできます。
スクリーンショット 2022-06-21 10.00.09.png

[可変長ファイル]に[データ区分]、[Random Trees]を接続します。
スクリーンショット 2022-06-21 10.05.04.png

*データ区分は学習と検証データに自動振り分けするノードです。詳しくはノードリファレンス3-7を参照ください。

[可変長ファイル]を編集します。[データ型]タブで[値の読み込み]ボタンを押してから[NG]フラグを[対象]に変更して予測対象にします。[ID]も[レコードID]に変更します。
スクリーンショット 2022-06-21 10.08.27.png

[Random Trees]を実行します。モデルナゲットができたら[精度分析]を接続します。
スクリーンショット 2022-06-21 10.13.23.png

[精度分析]の[一致行列]にチェックを入れ実行します。
スクリーンショット 2022-06-21 10.14.24.png

検証データでの精度は98.66%でした。
スクリーンショット 2022-06-21 10.15.25.png

[データの自動準備]ノードをバインドして、もう一度[Random Trees]を実行します。
スクリーンショット 2022-06-21 10.17.16.png

リニューアルされたモデルの精度が向上しています。
スクリーンショット 2022-06-21 10.17.36.png

4.Tips

自動変換のための速度と精度のバランスを選択

予測モデルと同等の処理をするために、精度と時間のどちらを優先するかが選択可能です。
スクリーンショット 2022-06-21 10.20.55.png

不要なフィールドの選定

特徴量選択ノード(ノードリファレンス5-14)の機能を一部ここで利用できます。
スクリーンショット 2022-06-21 10.23.35.png

データの品質の改善と値の標準化

欠損値や外れ値の置換え、Zスコアによる標準化を行います。
スクリーンショット 2022-06-21 10.27.02.png

カテゴリのメンバー統合と特徴量選択

カテゴリグループの統合や特徴量選択(特徴量選択ノードと同じ働き)を行います。
スクリーンショット 2022-06-21 10.30.02.png

Autoモデリングとの併用を紹介した記事

5.参考情報

利用データ

右クリックでリンク先を保存してください。

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?