Jubatus Advent Calender 15日目の記事でblobsのデータをk-meansがどうして上手くクラスタリングしないのか,点の追加と重心位置の変化をアニメーションにすることで確認してみました.
mp4データ(Qiitaはvideoタグの埋め込みに対応していないようなので)
データは乱数から生成するため,15日目の記事と同じ結果にはならず,
今回のデータでは最終的には期待する結果になりました.
しかし,途中で左右に分割される場面も見受けられます.
このグラフをよくよく見てみると縦軸と横軸のスケールが結構違うんですね.
15日目の記事中にも以下のような言及がありました.
おそらく分布が楕円状になっているため今回はうまくクラスタリングできなかったものと考えられます。
なので,縦軸と横軸のスケールが違うので,
上下でクラスタが別れることが必ずしも正解とは限らないデータだったようです.