3-6 再構成ノード[フィールド設定タブ]
1.ノードの目的
縦持ちデータを横持ちに変換します。時系列IoTデータやID付POS取引データから対象カテゴリをフィールドに展開して該当する値を埋めます。後続でIDを要約する[レコード集計]や欠損処理の[置換]をセットで用います。
2.解説動画(60秒)
3.クイックスタート
顧客の1年分の取引履歴(ID付POSデータ)から顧客毎に大分類の利用金額を求めます。
*入力データは[5.参考情報]からダウンロードできます。
[可変長ファイル]から[再構成]、[テーブル]の順に接続します。
[可変長ファイル]で[データ型]タブの[値の読み込み]ボタンを押して[大分類]のメンバーを認識させます。[データ型]ノードを用いても結構です。
[再構成]を以下のように設定します。利用可能なフィールドに[大分類]が表示されない場合には一つ前のプロセスで[データ型]で[値の読み込み]をします。
[テーブル]を実行します。7フィールドが新規に追加され、該当する小計が埋め込まれています。該当のないレコードは欠損値になっています。
[レコード集計]ノードでは[小計]と7つの大分類の小計の合計を求めます。
再構成の注意点とヒント
欠損値の扱い
[再構成]は該当のないセルは欠損値としますが、後続で比率を求めることを想定して0に置換しておきます。
再構成するべきフィールドが表示されない
事前にデータ型を確定しないとメンバーとして表示されないので注意します。また250種類以上のメンバーをもつ場合にはデータ型が[不明]と識別してフラグ化できないため、ツール>ストリームのプロパティで変更しておきます。
4.Tips
クラスタ分析のために大分類比率を求める
ID付POSやIoT時系列データから特徴量を生成するスゴ技職人「再構成ノード」
複雑な集計表を作成する
SPSS Modelerの再構成ノードをPythonで書き換える。購入商品カテゴリごとの集計
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次