基于最大关联规则的文本分类

计算机科学 ›› 2006, Vol. 33 ›› Issue (11): 143-145.

• 计算机网络与信息安全 • 上一篇下一篇

基于最大关联规则的文本分类

何玉冯剑琳王元珍

华中科技大学计算机学院,武汉430074

出版日期:2018-11-17 发布日期:2018-11-17
基金资助:
国家自然科学基金（编号：60373000）.

HE Yu, FENG Jian-Lin, WANG Yuan-Zhen （Department of Computer Science and Teehnology,Huazhong University of Science and Technology, Wuhan 430074）

Online:2018-11-17 Published:2018-11-17

摘要/Abstract

摘要： 我们提出了一种新颖的、基于最大关联的文本分类方法—SAT-MOD＋。在文本分类中，以往的方法在挖掘频繁项集和关联规则的时候，往往是将整个文本看作一个事务来处理的，然而文本的基本的语义单元实际上是句子。那些同时出现在一个句子里的一组单词比仅仅是同时出现在同一篇文档中的一组单词有更强的语义上的联系。基于以上的考虑，SAT-MOD＋把一篇文档里的某些句子作为一个单独的事务。通过在标准的文本集上的大量实验，证明了SAT-MOD＋的有效性。

关键词: 文本分类关联规则最大频繁项目集

Abstract: We propose a novel association based method called SAT-MOD＋ for text classification. While previous methods mainly mined frequentlyco-occurring words （frequent itemsets） at the document-level, the basic semantic unit in a document is a sentence. Words wit

Key words: Text classification, Association rules, Maximal frequent itemsets

何玉冯剑琳王元珍. 基于最大关联规则的文本分类[J]. 计算机科学, 2006, 33(11): 143-145. https://doi.org/

HE Yu, FENG Jian-Lin, WANG Yuan-Zhen （Department of Computer Science and Teehnology,Huazhong University of Science and Technology, Wuhan 430074）. [J]. Computer Science, 2006, 33(11): 143-145. https://doi.org/

参考文献

Metrics

Viewed

Full text

Abstract

Cited

Shared

Discussed

基于最大关联规则的文本分类

PDF (PC)

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

Metrics

本文评价

推荐阅读 0