计算机科学 ›› 2006, Vol. 33 ›› Issue (1): 236-239.

• • 上一篇    下一篇

基于句子级的最大频繁序列的文本分类

邹晶 冯剑琳 李曲 王元珍   

  1. 华中科技大学计算机学院,武汉430074
  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    Supported by the Natural Science Foundation of Chongqing Province of Chinaunder Grant No.8721(重庆市自然科学基金)and Chinese Doctor Stieresearch grant No.20030487032(中国博士点基金).

ZOU Jing, FENG Jian ,Lin LI, Qu WANG ,Yuan Zhen (Department of Computer Science, Huazhong University of Science and Technology, Wuhan 430074)   

  • Online:2018-11-17 Published:2018-11-17

摘要: 本文提出了一种新的文本分类方法。这种方法将一篇文本的一个句子看作一个事务,一个段落看作是一个序列,则一篇文本表示成一个序列的集合。我们从每篇训练文本中挖出最大频繁序列用以表示这篇文本,这种表示方法可大大提高训练及分类速度,同时也可以几乎不损失分类精度。在数据集Reuters-21578上的大量实验证明这种方法要远远好于其他的文本级的基于关联的分类方法。

关键词: 文本分类 句子级 最大序列 频繁序列 句子 分类方法 文本表示 分类精度 实验证明 类速度

Abstract: In this paper, we present a novel text classification method . It views a sentence as an association transaction, and a paragraph as a sequence, then a document becomes a set of sequneces. We find maximal frequent sequences from each training document to

Key words: Text classification, Sentence-level, Maximal sequence, Frequent sequence

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!