10.4 DBSCAN算法概述

还是前面讲的这群猴子,这回不限制小团体个数,也不指定初始的猴王是哪些,只限定最小的猴群成员个数,只要猴子有能耐,可以召集足够数量的追随者,都可以自立为王。于是,经过几轮打拼,形成了好几拨小猴群,每个猴群都有自己的猴王。这就是DBSCAN做聚类。

具有噪声的基于密度的聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。

与K-Means方法相比,DBSCAN不需要事先知道要形成的簇类的数量,就可以发现任意形状的簇类,并能够识别出噪声点。