计算机科学 ›› 2012, Vol. 39 ›› Issue (2): 195-197.

• 数据库与数据挖掘 • 上一篇    下一篇

一种基于信息嫡的多维流数据噪声检测算法

李文忠,左万利,赫枫龄   

  1. (吉林大学计算机科学与技术学院 长春 130012); (吉林大学符号计算与知识工程教育部重点实验室 长春 130012)
  • 出版日期:2018-11-16 发布日期:2018-11-16

Entropy-based Algorithmin for Noise Detection in Multi-dimensional Stream Data

  • Online:2018-11-16 Published:2018-11-16

摘要: 流数据噪声检测是一个比较困难的领域。由于流数据的一些特殊性,使得以前的一些处理静态数据的算法 对于流数据的处理而言都不理想。在局部离群点(LOF)思想的基础上,引入信息嫡来计算数据各维属性的信息增益, 并根据各维属性的增益来计算数据的局部离群度,提出一种多维流数据数据噪声点检测算法EDLOF。实验结果表 明,该算法对于多维流数据有较好的适应性,而且具有一定的泛化能力。

关键词: 噪声检测,流数据,数据挖掘,信息嫡

Abstract: 流数据噪声检测是一个比较困难的领域。由于流数据的一些特殊性,使得以前的一些处理静态数据的算法 对于流数据的处理而言都不理想。在局部离群点(LOF)思想的基础上,引入信息嫡来计算数据各维属性的信息增益, 并根据各维属性的增益来计算数据的局部离群度,提出一种多维流数据数据噪声点检测算法EDLOF。实验结果表 明,该算法对于多维流数据有较好的适应性,而且具有一定的泛化能力。

Key words: Noise detection, Stream data, Data mining, Information entropy

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!