0
实现步骤
(1)给定数据集X={x_1,…,x_n } (2)初始化,每个样本形成一个簇 (3)计算任意两个簇之间的距离; (4)合并距离最近的两个簇,形成新的簇,返回步骤 (5)如果整个数据集已经在一个簇内,算法停止
优点
- 聚类速度快且能够有效处理噪声点,发现任意形状的空间聚类。
- 不需要输入划分聚类个数
- 可以通过调节超参数过滤数据中的噪声
缺点
- 当数据量增大时,要求较大的内存支持且I/O消耗也大
- 当空间聚类的密度不均匀、聚类间距差相差很大时,聚类质量较差,MinPts和ε选取困难。
- 算法聚类效果依赖于距离公式选取
收藏