3-12 アンサンブルノード[フィールド作成]
1.ノードの目的
複数のモデルの予測を多数決(評決)や平均で合成します。例えば5つのモデルのうち3つ以上が「異常」と判断するとアンサンブルノードは「異常」判定します。
*ノードリファレンス5-11[自動分類]ノードと5-12[自動数値]ノード(Autoモデリング)はアンサンブルを内部で行うため、このノードは不要です。PythonやRの外部アルゴリズムやビジネスルールを組み込んだ場合を想定しています。
以下のイメージを実現します。
*フラグを予測する場合には多数決ですが、数値予測の場合には平均を利用します。
2.解説動画(60秒)
3.クイックスタート
製造条件からNG(不良品)になる予測モデルを自動分類で作成します。
*入力データは[5.参考情報]からダウンロードできます。
[可変長ファイル]に[データ区分]、[データ型]を接続し[CHAID][XGBoostツリー][ニューラルネット]を繋げます。①ではdefect.csvに接続するのみ。②は何も編集せず5割を学習、5割を検証に割り当てます。
③の[データ型]では[値の読み込み]ボタンを押して、[ID]を[レコードID]に[NGフラグ]を[対象]にします。
④⑤⑥を実行し、モデルナゲットから以下のように[アンサンブル]と[テーブル]を接続してストリームを拡張します。
[テーブル]を実行すると3つのモデルを合成(アンサンブル)した予測結果と確信度の2列が追加されます。
[アンサンブル]を編集して以下の赤枠からチェックを外すと、各モデルの予測と確信度が表示されます。
モデルが奇数個のため、[評決が同じ場合・・・]については選択しないでOKです。
フラグ型を予測している場合のアンサンブルは1か0を多数決(評決)によって確定します。確信度は満場一致の場合は平均で、票が割れると以下のように計算します。
4.Tips
自動分類ノードでアンサンブルを行う
例えば[自動分類]で上位5つのモデルを選択します。
モデルナゲットを編集し、以下の3つのアルゴリズムにチェックを入れればアンサンブルを実行して、クイックスタートと全く同じスコアリングを行います。
アンサンブルについて解説した記事
5.参考情報
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次