因子分析におけるスクリー基準では、観測データの相関行列に対する固有値をもとに因子数を決定するが、なんのための固有値なのかを解説する.
$p$次元観測変数$\boldsymbol{x}$の相関行列を$R^{p\times p}$とする.
$R$は(半正定値)対称行列より、直交行列$Q^{p\times p}$, 固有値を対角成分にもつ対角行列
$\Sigma^{p\times p}$を用いて$R = Q\Sigma Q^T$として対角化可能.
また, 因子分析モデルでは$p$個の各変数の分散を1に標準化した観測変数$\boldsymbol{x}$ を,因子負荷行列$\Lambda$と共通因子$f$を用いて
$\boldsymbol{x} = \Lambda f + \boldsymbol{\varepsilon}$ ,
その相関行列(=共分散行列)を $R = \Lambda \Lambda^T$ と表現する($f$の共分散行列は単位行列を仮定).
よって, $\Lambda = Q \Sigma^{1/2}$ とすれば$R$を表現できる.
ここで、$R$のスペクトル分解より,固有値$\lambda_1, \lambda_2, \cdots, \lambda_p$ とそれに対応する固有ベクトル$q_1, q_2, \cdots, q_p$ を用いて,
$R = \lambda_1 q_1 q_1^T + \lambda_2 q_2 q_2^T + \cdots + \lambda_p q_p q_p^T$ と表現できる.
上記では$Q$, $\Sigma$ をそれぞれ$p$次元正方行列としたが,
Q^{p\times 2} = [q_1, q_2],
\Sigma^{2\times 2} = \begin{bmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{bmatrix}
とすると,
$\Lambda \Lambda^T$は$R$のうち$\lambda_1q_1q_1^T + \lambda_2q_2q_2^T$の部分を表せているということになり, 大きい$\lambda$とそれに対応する固有ベクトルを選ぶことで, 少ない次元で$R$を近似できることがわかる.
カイザー基準では, 固有値が1以上のものを選ぶことで, 因子数を決定している.