####アウトライン
- 多変量データの持つ構造をより少数個の指標に圧縮
変量の個数を減らすことに伴う、情報の損失はなるべく小さくしたい。
少数変数を利用した分析や可視化(2、3次元の場合)が実現可能。
- 学習データ
x_i=(x_{i1},x_{i2},...,x_{im})\in\mathbb{R}^m
- 平均ベクトル
\hat{x}=\frac{1}{n}\sum_{i=1}^{n}x_i
- データ行列
\hat{x}=\frac{1}{n}\sum_{i=1}^{n}x_i
-分散共分散行列
\sum=Var(\overline{X})=\frac{1}{n}\overline{X}^T\overline{X}
- 線形変換後のベクトル
S_j=(S_1j,...,S_nj)^T=\overline{X}a_j\\
a_j\in\mathbb{R}^m
- 係数ベクトルが変われば線形変換後の値が変化
情報の量を分散の大きさと捉える。
線形変換後の変数の分散が最大となる射影軸を探索