概要
どちらも多変量データの要約という目的には変わりないが、要約へのモチベーションとアプローチが異なる。
数式的には大きな違いはないが、因子分析は得られる結果が人によって異なりうるが、主成分分析は同じになる。
主成分分析
アプローチ
偏差の平方和が最大になるような座標軸を順々に定義していく(例:$x,y,z$)。
基本的にその数は十分な累積寄与率になった時点で決まる。
モチベーション
主成分分析では元のデータに対する損失が平方和として発生するが、寄与率が高ければ、つまり全体的に特徴を捉えられていれば良い。
その他
誰が分析しても同じ結果になる。そのため客観性があり、物理/化学/医学などの分野で利用される。
因子分析
アプローチ
事前にデータに潜在する共通因子と呼ばれる変量とその数を仮定する(例:$f_1, f_2$)。
その後、仮定した共通因子の変量とその重み、そして損失を独自因子を求める。
モチベーション
因子分析においても損失が独自因子として発生するが、因子分析では元データに潜在する共通因子自体を発見することに主眼が置かれる。
その他
因子についての仮定が分析者によって異なるため、同じ分析結果にならない。つまり分析の仕方に自由度があるということでもあり、分析者の意図を表現するためにマーケティングや心理学などで利用される。
参考
- 意味がわかる多変量解析