计算机科学 ›› 2008, Vol. 35 ›› Issue (4): 160-161.

• • 上一篇    下一篇

基于朴素贝叶斯和遗传算法的两类文本分类方法

  

  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文受重庆市自然科学基金(2005BA2003,2006BB2374)项目资助.

  • Online:2018-11-16 Published:2018-11-16

摘要: 本文提出了一种基于朴素贝叶斯和遗传算法的两类文本分类方法,该方法将朴素贝叶斯分类器变换为在二维空间中的一条分割线,在分割线临近的文本分类不可靠区间内,利用遗传算法搜索最优文本分割线,从而使分类器达到最佳性能。在由12600篇文本构成的中文语料数据集上的实验表明,该方法具有较高的分类性能和效率,查准率、查全率和F1值分别达到97.98%,91.05%和94.39%。

关键词: 文本分类 遗传算法 最优分割线 文本二维空间 朴素贝叶斯分类器

Abstract: A two-class text categorization method based on Naive Bayes and GA is proposed. It transforms a Naive Bayesian classifier into a problem of search for a division line that fits the text data set distribution in a constructed twodimensional space. A geneti

Key words: Text classification, Genetic algorithm, Optimal dividing line, Text two-dimensional space, Naive Bayesian classifier.

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!