如何评价聚类结果的好坏
1、聚类没有统一的评价指标,因为不同聚类算法的目标函数相差很大,有些是基于距离,有些是假设先验分布,有些是带有图聚类和谱分析性质,还有些是基于密度的拿谱聚类距离。
2、应该嵌入到问题中进行评价,很多实际问题中,聚类仅仅是其中的一步,可以对比不聚。
聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。