ID毎に初回から3回目までのイベントを列に展開する
1.想定される利用目的
・設備のログの順序を特徴量として加工する
・顧客の初動を特徴量として加工する
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
b.[ソート]ノードを編集します。ID毎の時系列に並び替えます。

c.[フィールド作成]ノードを編集します。ID毎に順序番号を作ります。赤枠の[派生]モードを[カウント]にしてカウントアップするための条件を記述します。[@OFFSET(ID,1)]は設備の1行上を参照する関数です。IDが1行上と異なったら1つカウントアップすることになります。

式ビルダーのライブラリから@関数を探すと簡単に入力できます。

d.[データ型]ノードを編集します。後続fの準備として強制的に[seq]の型を順序型または名義型にします。変更後 [値の読み込み]ボタンを押します。

e.[再構成]ノードを編集します。1回目から3回目までを列に展開して、[値フィールド]を[Event]にします。

[プレビュー]をします。新しいフィールド(列)が3つ作成されて、該当するセルにイベントが埋められました。

f.[レコード集計]ノードを編集します。本来集計するべき値ではありませんが、最小値か最大値を利用します。

注意点
IDから同日にイベントが起きない前提でデータが準備されています。もしそれが起こる場合にはタイムスタンプを利用します。
4.参考情報
カウント型を解説した記事
フィールド(列)への展開を解説した記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)





