1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

カテゴリ値を列に展開してIDで集約 縦持ちを横持ちへ(SPSS Modeler データ加工逆引き7-2)

Last updated at Posted at 2022-07-01

カテゴリ値を列に展開してIDで集約(縦持ちを横持ちへ)

スクリーンショット 2022-07-01 11.09.02.png

1.想定される利用目的

・顧客の商品購買履歴から特徴量を作成
・設備ログから異常や故障に関連する特徴量の作成

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-07-01 13.57.53.png

a.入力するデータは以下の通りです。
スクリーンショット 2022-07-01 13.59.56.png

[再構成]ノードを利用する方法

b.[再構成]ノードを編集します。商品を列に展開して金額を埋め込みます。
スクリーンショット 2022-07-01 14.06.23.png

[プレビュー]します。3列追加されて該当セルに金額が入りました。
スクリーンショット 2022-07-01 14.00.23.png

c.[レコード集計]ノードを編集します。[顧客ID]を[キー]にして列に展開した各商品の金額を合計します。
スクリーンショット 2022-07-01 14.09.50.png

[プレビュー]します。購入履歴がないと欠損値Nullが入ります。
スクリーンショット 2022-07-01 14.01.07.png

d.[置換]ノードを編集します。後続処理を想定してNullはゼロに置換します。商品金額の比率を求めるなどの場合に計算を成立させるためです。
スクリーンショット 2022-07-01 14.01.26.png

[プレビュー]します。
スクリーンショット 2022-07-01 14.13.13.png

[行列入替]ノードを利用する方法

e.[行列入替]ノードを編集します。[行列入替方法]は[レコードからフィールドへ]を選択します。
スクリーンショット 2022-07-01 14.02.08.png

[プレビュー]します。金額が実数になってしまいます。
スクリーンショット 2022-07-01 14.02.43.png

f.関数to_integer(フィールド)で整数化するために[置換]ノードを利用します。@￰FIELDはワイルドカードです。3つのフィールドを同時に処理することが可能です。
スクリーンショット 2022-07-01 14.19.52.png

g.dと同じ設定です。

[テーブル]を実行します。
スクリーンショット 2022-07-01 14.29.00.png

注意事項

サンプルストリームでは入力ノードで[商品]のデータの型を確定してあります。新たなデータを適用する際に[再構成]の[利用可能なセット値]がリストされない場合には[データ型]ノードで[値の読み込み]ボタンを押してカテゴリメンバーを確定してください。

[行列入替]ノードを利用する方法はSQLプッシュバックが効きません。SQLプッシュバックについて以下の記事が詳しく解説しています。

4.参考情報

[再構成]の解説記事

[行列入替]の解説記事

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?