2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 5-15 TwoStep(クラスター)

Last updated at Posted at 2022-07-10

5-15 TwoStepノード[モデル作成タブ]

194_161twostep

1.ノードの目的

クラスターモデルを作成します。最大と最小値を設定すると自動でクラスタ数(k)を選択します。
顧客行動や設備挙動から類似グループを作成します。

2.解説動画(60秒)

3.クイックスタート

顧客の部門別購入金額でクラスターモデルを作ります。
*サンプルデータ(CSV)は[5.参考情報]からダウンロードできます。
スクリーンショット 2022-06-27 14.09.12.png

[可変長ファイル]ノードから[TwoStep]ノードに接続します。
2022-06-27

[可変長ファイル]ノードを編集します。[データ型]タブでクラスタモデルに投入するフィールドを確定します。アクセサリから食品の7つのフィールドを[入力]しにます。
スクリーンショット 2022-06-27 14.04.53.png

[TwoStep]を接続して編集します。
スクリーンショット 2022-06-27 14.15.10.png

[TwoStep]を実行してテーブルを接続します。
スクリーンショット 2022-06-27 14.17.21.png

[テーブル]を実行します。クラスタ列が追加され、購入の類似性で顧客を分類しています。
スクリーンショット 2022-06-27 14.18.53.png

4.Tips

個々のクラスターに含まれるレコード数のばらつきを制御

クラスター分析は異常検知のように小さなクラスターを探す場合を除くと、多くの場合、施策の出しわけに利用されます。そのため極端にレコードの多い/少ないクラスターが作られないように工夫をします。
今回のモデルでは6割を超えるクラスタができてしまいましたので、作り直します。
2022-06-27

代表的な方法に比率や偏差を利用する方法があります。
スクリーンショット 2022-06-27 14.30.11.png

[フィールド作成]ノードで比率フィールドを作成します。
スクリーンショット 2022-06-27 14.30.59.png

顧客毎の合計金額から部門別に按分した7つの比率フィールドが作られました。
スクリーンショット 2022-06-27 14.37.07.png

[データ型]ノードで比率フィールドをクラスターモデルの入力にします。
スクリーンショット 2022-06-27 14.39.32.png

[TwoStep]ノードを実行してモデルナゲットを編集します。極端に大きな/小さなクラスターがなくなりました。
2022-06-27

クラスタービューから[クラスター3]はマルチユーザーで[クラスター5]は化粧品メイン等はっきり特徴が出ています。
スクリーンショット 2022-06-27 14.43.09.png

Kohonenのノードリファレンスでは最初から比率を利用しています。

5.参考情報

TwoStepを解説した記事

利用データ

右クリックでリンク先を保存してください。

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?