计算机科学 ›› 2009, Vol. 36 ›› Issue (5): 244-246.

• • 上一篇    下一篇

一种应用于中文文本聚类的适应值函数

朱征宇 李力沛 罗颖 周智 朱庆生   

  1. 重庆大学计算机学院,重庆400044
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本课题得到国家科技支撑计划课题:重庆“便民E站”服务平台(编号2007BAH08804)的资助.

ZHU Zheng-yu LI Li-pei LUO Ying ZHOU Zhi ZHU Qing-sheng (Department of Computer Science, Chongqing University, Chongqing 400044, China)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 文本聚类中的文本对象一般都是高维的,类的大小、密度各不相同,给聚类带来了很大难度。目前国内针对这些问题而提出的应用于遗传算法的适应值函数却很少,国外的通用目标函数比较复杂,而且在文本聚类上的效果一般。针对文本对象的特征提出了一种应用于遗传算法的适应值函数,它具有结构简单、易于计算、适用于高维对象的特点,并且能够帮助遗传算法更好避免陷入局部最优,达到比较准确地描述聚类结果的目的。通过实验与csMeas—tire相比,聚类结果更优。

关键词: 适应值函数 遗传算法 文本聚类 数据挖掘

Abstract: Generally, the object of document clustering is high dimension, and the sizes and/or densities of clusters are different. These bring much difficulties to the document clustering. But there are few proposed fitness functions aiming to these problems at ho

Key words: Fitness function, Genetic algorithm,Text clustering, Data mining

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!