1
每个聚类算法都是不同的,可能适合也可能不适合特定的应用。与其寻求最佳的聚类算法,不如专注于识别不同类型的聚类算法,这可以让我更好地了解我想尝试哪种聚类算法: 基于质心的算法:K均值、GMM、模糊c均值和任何其他使用EM寻找参数的变化。聚类数量的知识在这里很重要,它们的复杂度大多是O(N),但初始化是其中的一个问题。 基于连通性的算法:所有的分层聚类算法,其中大多数复杂度是O(N^2)或更多,但可以在任何数量的聚类中停止。 基于密度的算法:包括DBSCAN、OPTICS等。 概率:LDA等。 降维:tSNE、PCA、KPCA-->然后可视化。 神经网络/深度学习:自动编码器、自组织图。
收藏