计算机科学 ›› 2016, Vol. 43 ›› Issue (Z11): 368-372.doi: 10.11896/j.issn.1002-137X.2016.11A.085
马银方,张琳
MA Yin-fang and ZHANG Lin
摘要: K-medoids算法对初始中心点敏感,不能有效地对动态数据进行聚类,且需要对相关的隐私数据进行保护。针对这些问题,提出了基于差分隐私保护的KDCK-medoids动态聚类算法。该算法在采用差分隐私保护技术的基础上将KD-树优化选取出的k个聚类中心和增量数据相结合建立新的KD-树,然后采用近邻搜索策略将增量数据分配到与其相应的聚类簇中,从而完成最终的动态聚类。通过实验分别对小数据集和多维的大数据集的聚类准确率及运行时间进行了分析,同时也对采用差分隐私保护技术的KDCK-medoids算法在不同数据集上的有效性进行了评估。实验结果表明,基于差分隐私保护的KDCK-medoids动态聚类算法能够在实现隐私保护的同时快速高效地处理增量数据的动态聚类问题。
[1] 夏宁霞,苏一丹,覃希.一种高效的K-medoids聚类算法[J].计算机应用研究,2010,7(12):4517-4519 [2] Sabzi A,Farjami Y,ZiHayat M.An improved fuzzy k-medoids clustering algorithm with optimized number of clusters[C]∥Proceedings of the 11th International Conference on Hybrid Intelligent Systems.IEEE,2011:206-210 [3] 孟颖,罗可,刘建华,等.一种基于差分演化的K-medoids聚类算法[J].计算机应用研究,2012,9(5):1651-1653 [4] Zhu Y T,Wang F Z,Shan X H,et al.K-medoids clusteringbased on MapReduce and optimal search of medoids[C]∥Proceedings of the 9th International Conference on Computer Science and Education.IEEE,2014:573-577 [5] 谢娟英,高瑞.方差优化初始中心的K-medoids聚类算法[J].计算机科学与探索,2015,9(8):973-984 |
No related articles found! |
|