階層的クラスタリング
- 教師なし学習
- クラスタリング
- 非階層的・・・グループ分けのみ
- 階層的
- 似たもの同士が階層的に集められている
- ちょうどよいレベルで切れば任意の数のクラスターを作れる
- 用途
- 似たデータ同士を集めたい・・・同じクラスター内は似ている、異なるクラスター同士は異なる
- 「似ている」の評価方法(類似度)
- 距離・・・教師データを用いずに距離で類似度を測る
- ユークリッド距離
- √(nΣi=1(ai-bi)^2)
- マンハッタン距離
- nΣi=1(|ai-bi|)
- ミンコフスキー距離・・汎用的
- チェビシェフ距離・・差の最大値
- マハラノビス距離・・データ群同士のばらつき
- ユークリッド距離
- コサイン類似度
- ベクトル同士の角度からベクトルの類似度・・・同じ方向を向いていれば似ている
- 距離・・・教師データを用いずに距離で類似度を測る