値を10%(デシル)のランク毎に集計する
*デシルとはdl(デシリットル)でも知られるように10分の1の意味です。
1.想定される利用目的
・優良顧客の定義
・商品需要予測のための稼働状況の分類
・異常検知/故障予測のための特徴量作成
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
b.[データ分割]ノードを編集します。[データ分割手段]を[分位(等カウント)]に切り替え[10分位]を選択します。
c.[フィールド作成]ノードを編集します。[10]がTop10%に[1]がBottom10%になります。一般的にデシル分析では1が最高ランクになるため11から引き算して値を反転させます。
d.[レコード集計]ノードを編集します。[キー]はデシルで[合計]から[最大]を求めます。[レコード度数]は[人数]と名称を変更します。
f.[フィールド作成]ノードを編集します。関数@SUMで列方向に金額を累積します。
g.[レコード集計]ノードを編集します。[キー]はブランクにして金額の全体での合計を求めます。
h.[レコード結合]ノードを編集します。[レコード結合方法]は[キー]にしますがブランクのまま1対Nで内部結合します。
[プレビュー]します。集計表に金額の合計が列として追加されました。
i.[フィールド作成]ノードを編集します。金額の比率を求めます。
注意点
今回は購入した商品やカテゴリの情報がありませんでしたが、最後の集計表に購入カテゴリの列を作るのが一般的なデシル分析です。
4.参考情報
デシル分析を扱った記事
ランク分けに関する記事
データの分割ノード
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)