计算机科学 ›› 2008, Vol. 35 ›› Issue (2): 87-89.

• • 上一篇    下一篇

基于信息熵和决策分类技术的邮件识别研究

李洋 赵骅   

  1. 重庆大学经济与工商管理学院,重庆400030
  • 出版日期:2018-11-16 发布日期:2018-11-16

LI Yang ZHAO Hua (College of Economics and Business Administration, Chongqing University, Chongqing 400030)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 本文通过对电子邮件头信息和正文内容进行离散和特征化处理,将一封电子邮件用向量组的方式加以表达;进而使用基于信息熵的决策树分类技术构建一种垃圾邮件分类识别模型;最后通过实验对该模型做了相关的检验和测试。实验证明,该模型经过一定数量的垃圾邮件和正常邮件的对比学习后,能够进行垃圾邮件的识别,具有较好的效果。

关键词: 决策树 信息增益 数据挖掘 垃圾邮件

Abstract: By disperseing and charactering an email, this paper uses a group of vectors to express an email. And bring forward a determination tree classifying model base on information entropy. And then followed with some experiments and tests. The results proved t

Key words: Data mining, Information entropy, Determination tree, Spam

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!