计算机科学 ›› 2009, Vol. 36 ›› Issue (2): 207-209.

• • 上一篇    下一篇

密度偏差抽样技术在聚类算法中的应用研究

余波 朱东华 刘嵩 郑涛   

  1. 北京理工大学管理与经济学院,北京100081
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文受国家自然科学基金重点资助项目(70031010),985哲学社会科学创新基地建设研究论文之一,“新世纪优秀人才支持计划”资助.

YU Bo ,ZHU Dong-hua ,LIU Song ,ZHENG Tao (School of Management and Economics, Beijing Institute of Technology, Beijing 100081, China)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 针对在大规模数据集上进行聚类困难的问题,分析了抽样技术的优点,研究了数据挖掘领域中的随机抽样的特点,并在此基础上提出了一种基于密度的偏差抽样方法。利用密度偏差抽样所获得的样本数据集能够较准确地反映总体数据集的特征,并且能够灵活地控制对数据集不同区域的抽样率。实验证明,在大规模数据集上进行聚类时,密度偏差抽样在时间复杂度上要优于随机抽样。

关键词: 数据挖掘 聚类 偏差抽样 随机抽样

Abstract: The advantages of sampling technology were analyzed against the difficulties of clustering on large-scale data set, and study the traits of random sampling in data mining were studied then a biased sampling method based on density was presented. The sampl

Key words: Data mining, Clustering, Biased sampling, Random sampling

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!