サポートベクターマシン (SVM)とは
機械学習(教師あり学習)の手法の1つ.分布しているデータの適切な境界線を求めるアルゴリズム.
一般的には2クラスに分類する手法として使われることが多いが,回帰手法にも使用されることがある.多クラス分類問題は,決定木やニューラルネットワークを用いることが多い.
マージン最大化
異なるクラスの各データ点の距離が,最大化すること.
スラック変数
誤分類やマージンをはみ出た場合の誤差を測る変数のこと.
ハイパーパラメータ
誤分類をどの程度許容するかを学習の前段階で決める変数(パラメータ)のこと.
参照:ハイパーパラメータの最適な探索
⇢ ゼロから作るディープラーニング(Pythonで学ぶディープラーニングの理論と実装)のp.197〜
カーネル関数
データをあえて高次元に写像(カーネルトリック)することで,線形分離不可能な問題を線形分離可能な問題へ変換する.
- 線形カーネル:任意の2つの観測間の内積として使用.
- 多項式カーネル:湾曲した入力データ空間と,非線形の入力データ空間を区別.
- 動径基底関数(RBF)カーネル:主にSVM分類で使用されるRBFカーネルは、入力データ空間を不定次元空間にマッピングします.
見るべき解説動画
数式を交えた解説動画
ハンズオンによる説明