統計科学輪講 [The Elements of Statistical Learning]
- これは慶応義塾大学数理科学科 - 火2統計科学輪講で使う資料です。
--- 記号まわりを中心にちょっと整理... ---
$K$個のクラス、たとえば ${\cal G} = \{1,2...,K\}$ があって、$\boldsymbol{x} \in \mathbb{R}^p$ を引数にとって $1, 2, ... K$ を返してくれるような関数 $\hat{G}(\boldsymbol{x})$($\hat{G}(\boldsymbol{x})\in {\cal G}$)を$N$個の学習データから構築したい。学習データは$N\times(p+1)$行列$\boldsymbol{X}$ と$N\times K$行列の$\boldsymbol{Y}$(指示行列)として与えられている。
N個の学習データはそれぞれのデータを列に格納したN*(p+1)行列XとN*K行列Yとして与えられている。
今回新たに登場登場
各クラス毎に線形回帰を行い
\hat{f}_k(\boldsymbol{x}) = \hat{\beta}_{k0}
+ \hat{\boldsymbol{\beta}}_{k}^T \boldsymbol{x}
を得れば
\hat{G}(\boldsymbol{x}) = argmax_{k \in {\cal G}}( \hat{f}_k(\boldsymbol{x}))
としてひとまず $\hat{G}(\boldsymbol{x})$ を得ることが出来る、が改善の余地がありそう。
そこで...
Gˆ(x) = argmax fˆ (x).
$\hat{f}k(x) = x{y^2}$
...おこあしい!
fˆ (x) = βˆ + βˆT x.
$\pi_k$...事前確率,
...N_k/N: 事前確率、クラスkがどのくらいの割合で含まれているか
G(x)...