LoginSignup
0
0

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 3-6 再構成

Last updated at Posted at 2022-02-22

3-6 再構成ノード[フィールド設定タブ]

107_89再構成.png

1.ノードの目的

縦持ちデータを横持ちに変換します。時系列IoTデータやID付POS取引データから対象カテゴリをフィールドに展開して該当する値を埋めます。後続でIDを要約する[レコード集計]や欠損処理の[置換]をセットで用います。

スクリーンショット 2022-02-22 11.28.24.png

2.解説動画(60秒)

3.クイックスタート

顧客の1年分の取引履歴(ID付POSデータ)から顧客毎に大分類の利用金額を求めます。
*入力データは[5.参考情報]からダウンロードできます。
スクリーンショット 2022-02-22 10.08.51.png

[可変長ファイル]から[再構成]、[テーブル]の順に接続します。
スクリーンショット 2022-02-22 11.36.06.png

[可変長ファイル]で[データ型]タブの[値の読み込み]ボタンを押して[大分類]のメンバーを認識させます。[データ型]ノードを用いても結構です。
スクリーンショット 2022-02-22 11.44.11.png

[再構成]を以下のように設定します。利用可能なフィールドに[大分類]が表示されない場合には一つ前のプロセスで[データ型]で[値の読み込み]をします。
スクリーンショット 2022-02-22 11.37.44.png

[テーブル]を実行します。7フィールドが新規に追加され、該当する小計が埋め込まれています。該当のないレコードは欠損値になっています。
スクリーンショット 2022-02-22 11.38.57.png

ストリームに[レコード集計]と[置換]を繋げます。
スクリーンショット 2022-02-22 11.41.57.png

[レコード集計]ノードでは[小計]と7つの大分類の小計の合計を求めます。
スクリーンショット 2022-02-22 11.41.09.png

欠損値ヌルを0に置換します。
スクリーンショット 2022-02-22 11.41.32.png

[テーブル]を実行します。
スクリーンショット 2022-02-22 11.40.40.png

再構成の注意点とヒント

欠損値の扱い

[再構成]は該当のないセルは欠損値としますが、後続で比率を求めることを想定して0に置換しておきます。

再構成するべきフィールドが表示されない

事前にデータ型を確定しないとメンバーとして表示されないので注意します。また250種類以上のメンバーをもつ場合にはデータ型が[不明]と識別してフラグ化できないため、ツール>ストリームのプロパティで変更しておきます。
スクリーンショット 2022-02-22 10.15.26.png

4.Tips

クラスタ分析のために大分類比率を求める

[置換]ノードを追加して次のように設定します。
スクリーンショット 2022-02-22 12.03.46.png

スクリーンショット 2022-02-22 12.03.22.png

ID付POSやIoT時系列データから特徴量を生成するスゴ技職人「再構成ノード」

複雑な集計表を作成する

SPSS Modelerの再構成ノードをPythonで書き換える。購入商品カテゴリごとの集計

5.参考情報

利用データ

右クリックでリンク先を保存してください。

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0