计算机科学 ›› 2005, Vol. 32 ›› Issue (9): 156-159.

• 计算机网络与信息安全 • 上一篇    下一篇

R-means:以关联规则为簇中心的文本聚类

龙昊 冯剑琳 李曲   

  1. 华中科技大学计算机科学与技术系,武汉430074
  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    本文受国家自然科学基金(编号60303030)和重庆自然科学基金(编号8721)支持.

LONG Hao,FENG Jian-Lin,LI Qu (Department of Computer Science, Huazhong University of Science and Technology, Wuhan 430074)   

  • Online:2018-11-17 Published:2018-11-17

摘要: 本文将k-means与关联规则(或频繁项目集)相结合,提出了一种新的文本聚类算法R-means.R-means算法以关联规则作为簇中心,通过类似于k-meams的迭代优化得到最终的簇.因此R-means不仅继承了k-means的简单性,而且用关联规则产生的簇描述易于为人们所理解.在几个实际数据集上的实验表明该算法可以得到高精度和高性能.

关键词: 关联规则 频繁项目集 簇中心 关联文本聚类 R-means算法 信息检索

Abstract: This paper proposes a new text clustering algorithm called R-means which integrates k-means with association rule (or frequent itemset). R-means exploits association rules as means of clusters and refines clusters by an iterative procedure which is simila

Key words: Association rules, Frequent itemset, Means of clusters, Associative text clustering

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!