DBSCAN算法如何实现?有哪些优缺点?
0 863
1
该提问暂无详细描述
收藏
2021-01-28 18:13 更新 小眼的铁板烧 •  3526
共 1 个回答
高赞 时间
0

实现步骤

(1)给定数据集X={x_1,…,x_n } (2)初始化,每个样本形成一个簇 (3)计算任意两个簇之间的距离; (4)合并距离最近的两个簇,形成新的簇,返回步骤 (5)如果整个数据集已经在一个簇内,算法停止

优点

  • 聚类速度快且能够有效处理噪声点,发现任意形状的空间聚类。
  • 不需要输入划分聚类个数
  • 可以通过调节超参数过滤数据中的噪声

缺点

  • 当数据量增大时,要求较大的内存支持且I/O消耗也大
  • 当空间聚类的密度不均匀、聚类间距差相差很大时,聚类质量较差,MinPts和ε选取困难。
  • 算法聚类效果依赖于距离公式选取

收藏
2021-01-28 18:16 更新 空心人 •  3374