计算机科学 ›› 2004, Vol. 31 ›› Issue (7): 175-177.

• 计算机网络与信息安全 • 上一篇    下一篇

一种基于关联规则的中文概念集生成算法

赵心 蔡智 洪流 蔡庆生   

  1. 中国科学技术大学计算机科学技术系,合肥230027
  • 出版日期:2018-11-17 发布日期:2018-11-17

  • Online:2018-11-17 Published:2018-11-17

摘要: 本文提出了一种基于关联规则的中文概念集生成算法。该算法首先产生文档的中文关键词集,采用向量空间模型VSM(vector space model)表示文档;然后以中文关键词为事务项,以中文文档为事务,采用成熟的关联规则算法发现中文关键词频繁集;再生成原始概念集并对原始概念集进行聚类,最终实现了中文概念集的自生成,同时该算法能引入增量更新的特性,对概念集进行增量更新。通过实验,表明该算法能有效地生成中文概念集,可以用之于对表示中文文档的高维特征向量的语义降维,具有一定的使用价值。

关键词: 关联规则 中文概念集 文本聚类 增量更新 向量空间模型 VSM 关键词

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!