LoginSignup
0
0

ID毎に初期値からの比率を求める(SPSS Modeler データ加工逆引き4-13)

Last updated at Posted at 2022-09-26

ID毎に初期値からの比率を求める

スクリーンショット 2022-09-04 10.36.12.png

1.想定される利用目的

・顧客の特定行動から特徴量を作成する
・設備ログから特定イベントの経過日数を特徴量にする

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-09-04 10.36.56.png

a.入力するデータは以下の通りです。7レコード目からIDが入れ替わります。
スクリーンショット 2022-09-04 10.39.12.png

b.[フィールド作成]ノードを編集します。関数[@￰OFFSET(ID,1)]はIDの1行上を参照する関数です。IDが1行上と異なったら1つカウントアップすることになります。
スクリーンショット 2022-09-04 10.39.40.png

式ビルダーから@￰関数を探すと簡単に入力できます。
スクリーンショット 2022-09-04 10.40.08.png

[プレビュー]します。
スクリーンショット 2022-09-04 10.40.40.png

c.[フィールド作成]ノードを編集します。ID毎の初期値の列を作成します。
スクリーンショット 2022-09-04 10.41.05.png

d.[フィールド作成]ノードを編集します。値を初期値で割り算して比を求めます。
スクリーンショット 2022-09-04 10.54.23.png

[プレビュー]します。完成しました。
スクリーンショット 2022-09-04 10.44.25.png

e.[フィールド作成]ノードを編集します。c と d をひとつにまとめています。
スクリーンショット 2022-09-04 10.42.29.png

[プレビュー]します。
スクリーンショット 2022-09-04 10.43.16.png

注意点

元データが適切にソートされていない場合には、あらかじめソートで確実な順序を確保します。

4.参考情報

ID毎にカウントアップするインデックスの作成

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0