6-4a 精度分析ノード:判別[出力タブ]
1.ノードの目的
予測精度を出力します。予測モデルの精度を確認する際に、[データ分割]ノードや[評価]グラフノードと共に利用します。
2.解説動画(60秒)
3.クイックスタート
判定を予測するモデルを作り精度分析を行います。
*入力データは[5.参考情報]からダウンロードできます。
[可変長ファイル]に[データ区分]、[Random Trees]を接続します。
[可変長ファイル]の[データ型]タブで[値の読み込み]ボタンを押した後に、予測の[ロール]を設定します。
[データ区分]には何も設定をしません。
50%のレコードをランダムに学習、残りを検証としてアサインしてます。
[Random Trees]を実行します。出来上がったモデルナゲットに[精度分析]を接続します。
Confusion Matrixが学習用と検証(テスト)用分けて表示されます。
今回はテストで121(TP)+615(TN)/746(テスト全体)=98.66%の精度が確保できました。
また学習での精度と比較的差が少ないため安定したモデルといえます。
4.Tips
ROC曲線の下の面積AUC(Area Under Curve)
[精度分析]で[評価メトリック]にチェックします。
AUCが学習とテストに分かれて出力されます。
精度分析ノードでPrecision(適合率)/Recall(再現率)を計算する
予測対象と予測結果を[フィールドによる評価対象分析:]に含めます。
Precision(適合率) は121/127=95.28%
この方法は以下の記事でも解説されています。
Precision/Recallの考え方
精度分析ノードと評価グラフノードをPythonで書き換える
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次