计算机科学 ›› 2008, Vol. 35 ›› Issue (10): 197-199.
• • 上一篇 下一篇
出版日期:
发布日期:
基金资助:
Online:
Published:
摘要: 研究如何实现Logistic回归模型在中文垃圾邮件过滤中的应用,给出了关键技术,并将其应用于SEWM20071)垃圾邮件语料库上,取得了较优的过滤效果。还分析了影响正常邮件误判率、垃圾邮件误判率和精确率等因子。对比实验结果表明,应用于中文垃圾邮件过滤的Logistic回归模型与SVM相比具有更优的ROC指标和更快的运行效率。
关键词: 垃圾邮件过滤 Logistic回归 ham% spam% ROC
Abstract: We applied the logistic regression model to filter Chinese spam email, described the key approaches of our spare filter,and conduct experiments on SEWM2007 spam corpus. Additionally, we analyzed factors influencing the ham misclassification rate (ham%), t
Key words: Spam filtering,Logistic regression, Ham% ,Spam% ,ROC
. 基于Logistic回归的中文垃圾邮件过滤方法[J]. 计算机科学, 2008, 35(10): 197-199. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2008/V35/I10/197
Cited