计算机科学 ›› 2008, Vol. 35 ›› Issue (2): 147-149.

• • 上一篇    下一篇

一种基于隐含子类信息的粗糙集中文文本分类方法

金凯民 苗夺谦 段其国   

  1. 同济大学计算机科学与技术系,上海200092
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文得到2006年博士学科点专项科研基金(20060247039)和国家自然科学基金(60475019)的资助.

JIN Kai-Min, MIAO Duo-Qian ,DUAN Qi-Guo (Dept, of Computer Science and Technology, Tongji University, Shanghai 200092)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 中文文本分类是中文信息检索和Web挖掘等领域的研究热点。现有的一些分类方法在特征选择阶段存在不足,忽略了隐合的子类信息。本文提出了一种提升隐合子类的关键词权值的方法,从而可以发现有价值的子类信息,进而使用粗糙集构建分类器。实验结果表明这种方法在不增加待约简词汇数量的情况下有效地提高了文本分类的查全率。

关键词: 中文信息处理 粗糙集 文本分类 向量空间模型

Abstract: Chinese Text Classification is a hot area of Information Retrieval and Web Mining. Existing methods have some defect in the phase of Feature Selection. They ignore the hidden sub-class information. This paper suggests a method to enhance the weight of key

Key words: Chinese information processing, Rough set, Text classification, VSM

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!