Webグラフでカテゴリの上位アイテム間の同時購入を確認する
1.想定される利用目的
・ 関連性の高いアイテムの同時併買を促す施策の立案
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
アイテム数をカウントする
a.入力するデータは次の通りです。顧客IDのある購買実績データです。誰がいつ、何を買ったかが分かります。

b.[レコード集計]ノードを編集します。[キーフィールド]に[Product]を選択します。

[プレビュー]します。ウインドウヘッダーから16,284種類のアイテムが存在することがわかります。

カテゴリ毎に上位20アイテムに絞り込んでWebグラフを描画する
c.[レコード集計]ノードを編集します。[キーフィールド]に[Product]とカテゴリを選択します。処理はbと変わらないのですが、それぞれのアイテムがどのカテゴリかがわかります。

d.[ソート]ノードを編集します。各カテゴリの実績の高いアイテムが順番に表示されます。

e.[フィールド作成]ノードを編集します。[派生]を[カウント型]に選択して、カウントアップとリセット条件を設定します。
列方向に参照するオフセット関数を利用します。[@OFFSET(フィールド,1)]でフィールドの値の1行上を参照します。カテゴリが1行上と一緒ならカウントアップします。

f.[条件抽出]ノードでランキングを20以下に絞り込みます。
g.[レコード結合]ノードを編集します。7つのカテゴリの20位まで140アイテムを内部結合して該当レコードのみを対象にします。

h.[データ型]ノードを編集します。[値の読み込み]ボタンでProductをカテゴリ型に確定します。

i.[フラグ設定]ノードを編集します。140アイテムを列に展開して顧客が同じ日にアイテムを併買したかどうかを記述します。

j.[Webグラフ]ノードを編集します。真のフラグだけを表示します。

注意事項
フラグ設定ノードでフィールド展開できるデフォルトアイテム数は250です。ストリームのプロパティで名義型メンバー上限を変えられますが、1万を超えると表示しても意味がなくなるため、今回のように絞り込みを行います。
4.参考情報
Webグラフノード
ランキング表を作成する
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)






