摘要: 本文对目前比较优秀的各种分类方法进行了介绍、分析和比较。在此基础上,借鉴决策树方法的快速分类特性,提出了一种基于数据库抽样的海量数据分类算法,给出了算法的设计思想和实现原理,并对多处理环境下的优化进行了探讨。实验研究表明,该算法可以明显提高海量数据库的分类效率。
李雪婵. 基于数据库抽样的海量数据分类算法研究[J]. 计算机科学, 2008, 35(6): 299-300. https://doi.org/
LI Xue-chan (Guangdong Radio & TV University,Guangzhou 510091,China). [J]. Computer Science, 2008, 35(6): 299-300. https://doi.org/