计算机科学 ›› 2011, Vol. 38 ›› Issue (10): 166-168.
赵卫中,马慧芳,傅燕翔,史忠植
ZHAO Wei-zhong,MA Hui-fang,FU Yan-xiang,SHI Zhong-zhi
摘要: 随着数据库技术的发展和Intcrnct的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临 许多新的问题和挑战,如海量数据和新的计算环境等。深入研究了基于云计算平台Hadoop的并行k-means聚类算 法,给出了算法设计的方法和策略。在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、 扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘。
No related articles found! |
|