计算机科学 ›› 2008, Vol. 35 ›› Issue (4): 160-161.
• • 上一篇 下一篇
出版日期:
发布日期:
基金资助:
Online:
Published:
摘要: 本文提出了一种基于朴素贝叶斯和遗传算法的两类文本分类方法,该方法将朴素贝叶斯分类器变换为在二维空间中的一条分割线,在分割线临近的文本分类不可靠区间内,利用遗传算法搜索最优文本分割线,从而使分类器达到最佳性能。在由12600篇文本构成的中文语料数据集上的实验表明,该方法具有较高的分类性能和效率,查准率、查全率和F1值分别达到97.98%,91.05%和94.39%。
关键词: 文本分类 遗传算法 最优分割线 文本二维空间 朴素贝叶斯分类器
Abstract: A two-class text categorization method based on Naive Bayes and GA is proposed. It transforms a Naive Bayesian classifier into a problem of search for a division line that fits the text data set distribution in a constructed twodimensional space. A geneti
Key words: Text classification, Genetic algorithm, Optimal dividing line, Text two-dimensional space, Naive Bayesian classifier.
. 基于朴素贝叶斯和遗传算法的两类文本分类方法[J]. 计算机科学, 2008, 35(4): 160-161. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2008/V35/I4/160
Cited