LoginSignup
0
0

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 3-5 フラグ設定

Last updated at Posted at 2022-02-22

3-5 フラグ設定ノード[フィールド設定タブ]

107_89フラグ設定.png

1.ノードの目的

縦持ちデータを横持ちに変換します。時系列IoTデータやID付POS取引データからID毎にフラグ化を行います。統計モデルのためのダミー変数作成にも利用します。

スクリーンショット 2022-02-22 10.01.53.png

2.解説動画(60秒)

3.クイックスタート

顧客の1年分の取引履歴(ID付POSデータ)から顧客毎に中分類の購入有無をフラグ化します。
*入力データは[5.参考情報]からダウンロードできます。
スクリーンショット 2022-02-22 10.08.51.png

[可変長ファイル]から[フラグ設定]、[テーブル]の順に接続します。
スクリーンショット 2022-02-22 10.08.05.png

[可変長ファイル]で[データ型]タブの[値の読み込み]ボタンを押して[中分類]のメンバーを認識させます。[データ型]ノードを用いても結構です。
スクリーンショット 2022-02-22 10.09.16.png

[フラグ設定]を編集します。[セット型フィールド:]に[中分類]を選択して、左のボックスから60種類全ての中分類メンバーを右のボックスに黄色矢で移動させます。
青枠と緑枠をそれぞれ設定します。
スクリーンショット 2022-02-22 10.11.03.png

[テーブル]を実行します。
スクリーンショット 2022-02-22 10.14.34.png

フラグ設定の注意点とヒント

真と偽の扱い

デフォルトでは真がT、偽をFとしますが、後続処理で平均や合計を求めるなどが可能になるため
1と0にしておきます。

フラグ化するべきフィールドが表示されない

事前にデータ型を確定しないとメンバーとして表示されないので注意します。また250種類以上のメンバーをもつ場合にはデータ型が[不明]と識別してフラグ化できないため、ツール>ストリームのプロパティで変更しておきます。
スクリーンショット 2022-02-22 10.15.26.png

4.Tips

IDで要約しないでダミー化

集計キーを選ばずブランクにします。
スクリーンショット 2022-02-22 10.51.50.png

レコードを要約せず、該当するフィールドにフラグをたてます
スクリーンショット 2022-02-22 10.51.29.png

フラグの数を数える

以下のブログの「おまけ」で紹介されています。sum_n(@￰FIELDS_BETWEEN(item_A, item_C))

SPSS ModelerのフラグノードをPythonで書き換える。購入商品カテゴリのフラグ化

5.参考情報

利用データ

右クリックでリンク先を保存してください。

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0