计算机科学 ›› 2007, Vol. 34 ›› Issue (9): 125-127.

• 软件工程与数据库技术 • 上一篇    下一篇

一种新的演化文本流聚类算法

邓维维 彭宏   

  1. 华南理工大学计算机学院,广州510641
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    国家自然科学基金(60574078);广东省自然科学基金(31454).

DENG Wei-Wei, PENG Hong (Computer Science Department, South China University of China, Guangzhou 510641)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 数据流的聚类作为聚类的一个分支,已经成为了数据挖掘的研究热点。虽然已经有不少数据流算法出现,但是大部分都是针对低维的数值型数据,很少有高维文本流的研究。本文在传统的数据流聚类框架基础上,提出了一种新的文本微聚类结构体,它更适合文本聚类,同时还将在线微聚类分为潜在微聚类和异常微聚类,提高了对孤立点的适应能力。实验表明该算法相对于其他文本流聚类算法更有效。

关键词: 聚类 数据流 文本流

Abstract: As a branch of clustering, data stream clustering has become a hot spot in data mining. Although there are many stream clustering algorithms, they are only suitable for low dimensional numeric data type, and few of them are designed for high dimensional t

Key words: Clustering, Data stream, Text stream

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!