More than 3 years have passed since last update.

機械学習　第四章　主成分分析

Posted at 2021-02-11

変量の個数を減らすことに伴う、情報の損失はなるべく小さくしたい。
少数変数を利用した分析や可視化（２、３次元の場合）が実現可能。

x_i=(x_{i1},x_{i2},...,x_{im})\in\mathbb{R}^m

\hat{x}=\frac{1}{n}\sum_{i=1}^{n}x_i

\hat{x}=\frac{1}{n}\sum_{i=1}^{n}x_i

-分散共分散行列

\sum=Var(\overline{X})=\frac{1}{n}\overline{X}^T\overline{X}

S_j=(S_1j,...,S_nj)^T=\overline{X}a_j\\
a_j\in\mathbb{R}^m

情報の量を分散の大きさと捉える。
線形変換後の変数の分散が最大となる射影軸を探索