5-10 SVMノード[モデル作成タブ]
1.ノードの目的
SVM(サポートベクターマシン)は、2クラスや多クラスのカテゴリ型の分類問題や連続型の回帰問題を解く予測モデルを作成します。
2.解説動画(60秒)
3.クイックスタート
製品に同梱されているサンプルストリームsvm_cancer.strを開きます。データはcell_samples.data です。このストリームのシナリオは、患者の細胞の特性に基づき、クラスが良性か悪性かを判定することです。SVMを用いて早期に良性または悪性を特定できるモデルを開発することが目的です。
データ型ノードで、ロールを確認します。IDは「なし」、Classは「対象」、それ以外は「入力」です。
モデル作成パレットのSVMノードをデータ型ノードに接続します。SVMノードの編集ダイアログで、[モデル]タブを選択します。[モデル名]で[ユーザー設定]を選択し、生成するモデルナゲット名を「class-rfb」と入力します。
[エキスパート]タブを選択します。デフォルトの[モード]、[単純]ではカーネルタイプでRadial Basis Function(放射基底関数)が適用されます。RBFの特徴は、非線形なモデルを実現します。また、[分析]タブで[予測変数の重要度を計算]を選択します。
SVMノードを実行すると「class-rfb」と名前が付いたモデルナゲットが生成されます。モデルナゲットを参照します。予測変数の重要度が確認できます。
$S-Class;予測値
$SP-Class;確信度
多くのレコードの確信度の値が高いことがわかります。しかし、レコード13は、0.514と確信度の値が低くなっています。また、予測値に注目してみるとレコード2,4は確信度の値は高いのですが、実測値と予測値が異なっていて、間違って予測しているレコードも見受けられます。
4.Tips
ここでは、精度の改善ができるか別のカーネル関数でモデルを作成してみます。先程のSVMノードの編集ダイアログの[モデル]タブを選択します。[モデル名]で[ユーザー設定]を選択し、生成するモデルナゲット名を「class-poly」と入力します。
[エキスパート]タブを選択し、[モード]を[エキスパート]にします。[カーネルタイプ]を[多項式]にします。
SVMノードを実行すると「class-poly」と名前が付いたモデルナゲットが生成されます。テーブルノードをリンクして実行します。
先程とは異なり、レコード13の確信度の値が高くなっています。また、レコード2,4の予測値は実測値と一致しています。
2つのモデルナゲットを接続して、さらにその後に精度分析ノードを接続します。
精度分析ノード実行します。
関数を変更したことで、モデルの精度が改善されました。
なお、SPSS ModelerのSVMノードでは4種類のカーネル関数が用意されています。
5.参考情報
チュートリアル
利用データ
SPSS Modeler 同梱のcell_samples.data
ノードのヘルプ
SPSS Modelerノードのリファレンス