计算机科学 ›› 2012, Vol. 39 ›› Issue (2): 195-197.
• 数据库与数据挖掘 • 上一篇 下一篇
李文忠,左万利,赫枫龄
出版日期:
发布日期:
Online:
Published:
摘要: 流数据噪声检测是一个比较困难的领域。由于流数据的一些特殊性,使得以前的一些处理静态数据的算法 对于流数据的处理而言都不理想。在局部离群点(LOF)思想的基础上,引入信息嫡来计算数据各维属性的信息增益, 并根据各维属性的增益来计算数据的局部离群度,提出一种多维流数据数据噪声点检测算法EDLOF。实验结果表 明,该算法对于多维流数据有较好的适应性,而且具有一定的泛化能力。
关键词: 噪声检测,流数据,数据挖掘,信息嫡
Abstract: 流数据噪声检测是一个比较困难的领域。由于流数据的一些特殊性,使得以前的一些处理静态数据的算法 对于流数据的处理而言都不理想。在局部离群点(LOF)思想的基础上,引入信息嫡来计算数据各维属性的信息增益, 并根据各维属性的增益来计算数据的局部离群度,提出一种多维流数据数据噪声点检测算法EDLOF。实验结果表 明,该算法对于多维流数据有较好的适应性,而且具有一定的泛化能力。
Key words: Noise detection, Stream data, Data mining, Information entropy
李文忠,左万利,赫枫龄. 一种基于信息嫡的多维流数据噪声检测算法[J]. 计算机科学, 2012, 39(2): 195-197. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2012/V39/I2/195
Cited