计算机科学 ›› 2011, Vol. 38 ›› Issue (11): 239-240.

• 人工智能 • 上一篇    下一篇

基于粗糙集理论的文本分类算法研究

林珣,李志蜀,周勇   

  1. (西南财经大学经济信息工程学院 成都610071)(四川大学计算机学院 成都610064)(华兴职业技术学院 成都610071)
  • 出版日期:2018-12-01 发布日期:2018-12-01

Text Classification Algorithm Study Based on Rough Set Theory

  • Online:2018-12-01 Published:2018-12-01

摘要: 文本分类是中文信息处理的重要研究领域。给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率。粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类。实验表明,该方法的查准率和查全率都有所提高。

关键词: 文本分类,粗糙集,约简

Abstract: Text dataset is transformed to information system without attribute of decision making and the core content of attribute reduction has been applied to text classification. Experiment shows that the precision rate and recall rate are enhanced in this method; furthermore, it does not require any a priori information.

Key words: Text classification, Rough set, Reduction

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!