1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ID毎に最大値からの比率を求める(SPSS Modeler データ加工逆引き4-14)

Last updated at Posted at 2022-09-28

ID毎に最大値からの比率を求める

スクリーンショット 2022-09-04 14.35.26.png

*①は各時系列の時点でのIDの最大値、②は事後の集計後のIDの最大値と比較します。

1.想定される利用目的

・顧客の特定行動から特徴量を作成する
・設備ログから特定イベントの経過日数を特徴量にする

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-09-04 14.23.12.png

a.入力するデータは以下の通りです。7レコード目からIDが入れ替わります。
スクリーンショット 2022-09-04 14.25.27.png

b.[フィールド作成]ノードを編集します。関数[@￰OFFSET(ID,1)]はIDの1行上を参照する関数です。IDが1行上と異なったら1つカウントアップすることになります。
スクリーンショット 2022-09-04 14.26.30.png

式ビルダーから@￰関数を探すと簡単に入力できます。
スクリーンショット 2022-09-04 14.27.35.png

[プレビュー]します。
スクリーンショット 2022-09-04 14.26.02.png

c.[フィールド作成]ノードを編集します。ID毎に各時点での最大値を関数[@￰MAX(値,レコード数)]で求めます。レコード数は現在のレコードから何行上まで参照するかを指定するためindexをそのまま使います。
スクリーンショット 2022-09-04 14.26.56.png

[プレビュー]します。①が完成しました。
スクリーンショット 2022-09-04 14.28.19.png

d.[レコード集計]ノードを編集します。[キーフィールド]には[ID]を選択して最大値を求めます。
スクリーンショット 2022-09-04 14.28.40.png

[プレビュー]します。それぞれのIDの最大値が得られました。
スクリーンショット 2022-09-04 14.29.05.png

e.[レコード結合]ノードを編集します。[レコード結合方式]を[キー]にして[ID]を[結合キー]で内部結合します。
スクリーンショット 2022-09-04 14.29.37.png

[プレビュー]します。時系列が崩れるので整えます。
スクリーンショット 2022-09-04 14.30.09.png

f.[ソート]ノードを編集します。
スクリーンショット 2022-09-04 14.30.59.png

g.[フィールド作成]ノードを編集します。最大値を分母に各レコードの値を割り算します。
スクリーンショット 2022-09-04 14.31.17.png

[プレビュー]します。②が完成しました。
スクリーンショット 2022-09-04 14.31.45.png

注意点

予測や異常検知の仕組みがリアルタイムに処理できる場合には①を、バッチ処理による実装の場合②を検討します。

4.参考情報

ID毎にカウントアップするインデックスの作成

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?