評価グラフを利用して傾向スコアを求める
*傾向スコアはModeler搭載のほとんどのアルゴリズムで自動計算されますが、XGboost TreeのようなPythonライブラリには存在しません。
*この記事は以下の8-14ように関数を自分で定義しない方法を紹介しています。
1.想定される利用目的
・XgboostTreeのようなPython由来のモデルで傾向スコアを利用する
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。このデータから解約を予測するモデルを作成します。
b.[データ区分]ノードを編集します。デフォルトのまま5割を学習、5割をテストに割り当てます。
c.[データ型]ノードを編集します。[解約]を[フラグ]型にして値を読み込み、[ロール]を[対象]とします。
d.[XGboost Tree]ノードを実行します。
e.[XGboost Tree]ナゲットを[プレビュー]します。確信度 [$XGTC-解約]はありますが傾向スコアは出力されません。
f.[評価グラフ]ノードを実行します。[表示]メニューから[インタラクティブ]グラフにチェックします。
縦の赤棒をグラフ内にひとつだけ配置して右クリックから[バンドの条件抽出ノード生成]を選択します。
画面右上にgが自動生成されます。
g.[条件抽出]ノードを編集します。カッコ内が傾向スコアを求める式なのでコピーします。
h.[フィールド作成]ノードを編集します。コピーした式をそのままペーストしてあります。
[テーブル]を実行します。
注意事項
ほとんどのモデルでは作成時またはナゲットに傾向スコアの出力が準備されています。
4.参考情報
傾向スコアを扱った記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)











