我们先演示K-Means的基础使用,完整演示代码请见本书GitHub上的10-1.py。
加载K-Means库:
import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import K-Means from sklearn.datasets import make_blobs
生成测试样本:
n_samples = 1500 random_state = 170 X, y = make_blobs(n_samples=n_samples, random_state=random_state)
进行聚类,指定聚类个数为3:
y_pred = KMeans(n_clusters=3, random_state=random_state).fit_predict(X)
可视化结果如下,图10-3为实例图。
plt.subplot(221) plt.scatter(X[:, 0], X[:, 1], c=y_pred) plt.title("hello word!") plt.show()
图10-3 K-Means算法实例图