3-5 フラグ設定ノード[フィールド設定タブ]
1.ノードの目的
縦持ちデータを横持ちに変換します。時系列IoTデータやID付POS取引データからID毎にフラグ化を行います。統計モデルのためのダミー変数作成にも利用します。
2.解説動画(60秒)
3.クイックスタート
顧客の1年分の取引履歴(ID付POSデータ)から顧客毎に中分類の購入有無をフラグ化します。
*入力データは[5.参考情報]からダウンロードできます。
[可変長ファイル]から[フラグ設定]、[テーブル]の順に接続します。
[可変長ファイル]で[データ型]タブの[値の読み込み]ボタンを押して[中分類]のメンバーを認識させます。[データ型]ノードを用いても結構です。
[フラグ設定]を編集します。[セット型フィールド:]に[中分類]を選択して、左のボックスから60種類全ての中分類メンバーを右のボックスに黄色矢で移動させます。
青枠と緑枠をそれぞれ設定します。
フラグ設定の注意点とヒント
真と偽の扱い
デフォルトでは真がT、偽をFとしますが、後続処理で平均や合計を求めるなどが可能になるため
1と0にしておきます。
フラグ化するべきフィールドが表示されない
事前にデータ型を確定しないとメンバーとして表示されないので注意します。また250種類以上のメンバーをもつ場合にはデータ型が[不明]と識別してフラグ化できないため、ツール>ストリームのプロパティで変更しておきます。
4.Tips
IDで要約しないでダミー化
フラグの数を数える
以下のブログの「おまけ」で紹介されています。sum_n(@FIELDS_BETWEEN(item_A, item_C))
SPSS ModelerのフラグノードをPythonで書き換える。購入商品カテゴリのフラグ化
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次