LoginSignup
2
1

More than 5 years have passed since last update.

Mini-batch-k-means とk-means

Posted at

使う必要が出てきたのでMini-batch-k-meansとk-meansとの比較お勉強し、備忘録
Béjar Alonso, Javier. "K-means vs Mini Batch K-means: a comparison." (2013).

どうやらk-meanと比べると同時にデータセットを分析に使わず固定されたサイズで
部分分にやる事で大規模データへの高速化をしているようだ。

ml_map-680x424.png

ただしPythonのScikit-learnのクラスタリングの使い分けを見ると小規模データ
への適用のときに勧められるアルゴリズムがMini-batch-k-means法になっている。
論文の最後の方にも10未満のクラスターは2%クオリティーが落ち、20以上のクラスターは8%クオリティーが落ちるとあり、大きなクラスタリングのときや精度を求められる際には不向きであるのかなと思ってしまう。
ただしここでいうクオリティーとは何を持って言っているのかは不明である。

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1