摘要: 传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度dλ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。
张霞,王素贞,尹怡欣,赵海龙. 基于模糊粒度计算的K-means文本聚类算法研究[J]. 计算机科学, 2010, 37(2): 209-211. https://doi.org/
ZHANG Xia,WANG Su-zhen,YIN Yi-xin,ZHAO Hai-long. Research of Text Clustering Based on Fuzzy Granular Computing[J]. Computer Science, 2010, 37(2): 209-211. https://doi.org/