3

More than 5 years have passed since last update.

【ざっくり】KMeansによるクラスタリング

Posted at 2017-07-25

概要

目的：購買履歴などから顧客をクラスタリングして、それぞれの特徴を把握
方法：KMeansによるクラスタリング
アウトプット：各クラスタの人数、顧客クラスタ毎の特徴
利用分野：マーケティング

アプローチ

データをdataframeに格納
クラスタ数の決定
KMeansでクラスタリング
クラスタリング結果を出力

コード

import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
from collections import Counter

##dataframeを準備　df ###

num_clus = 4 #クラスタ数を設定
kmeans = KMeans(n_clusters=num_clus, random_state=0).fit(df)

print(Counter(kmeans.labels_)) #各クラスタの人数を出力

df['cluster_id']=kmeans.labels_ #元のdataframeにクラスタ番号を追加

for i in range(0,num_clus): #各クラスタの平均値を出力
    print(df[df['cluster_id']==i].mean())

3

Register as a new user and use Qiita more conveniently

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

3