mahoutとか使ってなんか分析してみたいけど、そもそもの分析手法を知らないので学習してみる。(とりあえず自分なりに学習過程を書き残す。)
基本的にはインターネット上の情報で学習する。
K平均法(Kへいきんほう、k-means clustering)
基本的なクラスタリング手法。
非階層的な手法の代表例である。
kはクラスタの数を表す。
大量のデータを処理する場合に階層的なクラスタリングより適した手法。
簡単に言うと?
最初にクラスタの中心(重心)を仮定する(適当に)。
計算して徐々に重心をずらして行き、重心が動かなくなったところで終了させる。
↓わかりやすい!(๑╹ڡ╹๑)
http://tech.nitoyon.com/ja/blog/2013/11/07/k-means/
http://www.antecanis.com/texts/group_04/
何に使えるか、何に使われているか
(教えて下さい)
参考
http://msdn.microsoft.com/ja-jp/magazine/jj891054.aspx
http://www.cs.osakafu-u.ac.jp/hi/honda/k-means.htm
http://www-01.ibm.com/support/knowledgecenter/SSLVMB_22.0.0/com.ibm.spss.statistics.help/spss/base/idh_quic.htm?lang=ja
http://image.onishi-lab.jp/004.html
まだまだ
全然ワカランチンなので何かオススメの本があれば教えて下さい。