5-16 因子分析(主成分)ノード[モデル作成タブ]
1.ノードの目的
主成分分析は、いくつかのフィールド(列)を縮約して合成変数を作ります。極端に列が多い実験系のデータでは変数削減を目的とした特徴量として利用されます。
2.解説動画(60秒)
3.クイックスタート
39フィールドのデータを主成分分析で6フィールドに縮約します。
*サンプルデータ(CSV)は[5.参考情報]からダウンロードできます。
[可変長ファイル]ノードから[因子分析]ノードに接続します。
[可変長ファイル]ノードを編集します。[データ型]タブで[値の読み込み]ボタンを押してデータタイプを確定します。[ロール]では全てのフィールドを[入力]のままにします。
[因子分析]ノードを編集します。[抽出方法]は[主成分分析]にします。
[テーブル]を実行します。第1から第6主成分までが追加されました。
4.Tips
抽出した主成分の評価
今回のデータでは39あるフィールドを第1主成分のみで20.57%情報を縮約できています。以下第6主成分までの累積で85.16%の情報をカバーしていることがわかります。
例えば第1主成分がどのように計算されたかはナゲットに表示されます。
どのフィールドが主成分に効いたかは以下の成分行列で理解できます。
5.参考情報
主成分分析でフィールドの縮約を解説した記事
利用データ
右クリックでリンク先を保存してください。
ノードのヘルプ
SPSS Modeler 逆引きストリーム集(データ加工)
SPSS Modeler ノードリファレンス目次