kNN(k-nearest neighbor algorithm、k近傍法)の考え方
- 参考にしたもの:機械学習のエッセンスの第05章「機械学習アルゴリズム」
k-Means法とは
- 機械学習のうち、教師なし学習のクラスタリングに用いられるアルゴリズムの一種
- クラスタリング: 与えられたデータを外的基準なしに自動的に分類する手法
考え方
- 与えられたデータをいくつのグループ(クラスタ)に分けるか決める(これは手動)
- ランダムにデータをクラスタに割り振る
- 各クラスタの重心を計算する
- 全データに対して、各クラスタの重心までの距離を計算し、一番近いクラスタに割り振りなおす
- 割り振りなおしの前後で全データのクラスタが変わらなくなるまで、3,4を繰り返す
↓が実際にクラスタが割り振りなおされていく過程。紫の菱形が重心。計算は簡単(重心と距離だけ)なので割愛