1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ROC曲線の全ての座標を求めて散布図で描画する(SPSS Modeler データ加工逆引き8-5)

1
Last updated at Posted at 2022-09-08

ROC曲線の全ての座標を求めて散布図で描画する

スクリーンショット 2022-08-18 8.58.12.png

1.想定される利用目的

・予測モデルの性能評価
・実装後のモデルメンテナンスのための性能指標の算出

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-08-18 8.59.13.png

a.入力するデータは以下の通りです。故障有無と予測、傾向スコアの3列のデータです。
スクリーンショット 2022-08-18 8.46.18.png

*ROC曲線でカットオフポイントを決めるためこの時点では予測列[$￰R-故障]は全て1にしています。

評価グラフでROC曲線を描画する

b.[評価グラフ]ノードを編集します。
スクリーンショット 2022-08-18 9.05.11.png

[実行]します。ROC曲線が描画されました。
スクリーンショット 2022-08-18 9.06.27.png

ROC曲線の座標を求めて散布図で描画する

c.[フィールド作成]ノードを編集します。[派生]モードを[フラグ型]にして真になる条件を記述します。
スクリーンショット 2022-08-18 9.07.47.png

FPは故障を疑ったが、実際には故障ではなかったケースです。以下の混同行列を参照ください。
スクリーンショット 2022-08-18 13.41.46.png

*同じ目的のノードをc、d、e、fと作成します。

g.[フィールド作成]ノードを編集します。関数@￰SUMで4つの分類の累積を作成します。@￰FIELDはワイルドカードです。13のフィールドを同時に処理することが可能です。
スクリーンショット 2022-08-18 9.08.17.png

式ビルダーの@￰関数を利用すると簡単に入力できます。
スクリーンショット 2022-08-18 9.09.03.png

[プレビュー]します。混同行列の4つの分類の累積ができました。
スクリーンショット 2022-08-18 9.09.36.png

h.[レコード集計]ノードを編集します。各分類の最大値を求めます。
スクリーンショット 2022-08-18 9.10.18.png

[プレビュー]します。
スクリーンショット 2022-08-18 9.10.45.png

i.[レコード結合]ノードを編集します。[キー]をレコード結合方式に選択しますが[キー]はブランクにして全てのレコードにhで求めた累積値を結合します。
スクリーンショット 2022-08-18 9.11.09.png

[プレビュー]します。
スクリーンショット 2022-08-18 9.11.52.png

j.[フィールド作成]ノードを編集します。感度を求めます。計算式は再現率と同じです。True Positive Rate(TPR)とも呼ばれます。
スクリーンショット 2022-08-18 9.12.18.png

k.[フィールド作成]ノードを編集します。1-特異度を求めます。特異度は故障がなかったレコードの中で故障が疑われることもなかったレコードの比率=TN/(TN+FP)です。1-特異度は逆に故障がないのに故障が疑われた比率であるためFales Positive Rate(FPR)と呼ばれます。式ではFPを分子にしています。
スクリーンショット 2022-08-18 9.12.47.png

ここまでのデータは以下の通りです。
スクリーンショット 2022-08-18 9.13.40.png

l.[散布図]ノードを編集します。
スクリーンショット 2022-08-18 9.14.17.png

スクリーンショット 2022-08-18 9.14.29.png

[実行]します。ROC曲線が描かれました。
スクリーンショット 2022-08-18 9.15.01.png

注意事項

別の目的でストリームにアレンジしやすいように、今回は直接計算に不要な処理(TNとFN)を含めています。

4.参考情報

モデルの性能指標について解説した記事

SPSS StatisticsでROC分析を行う

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?