计算机科学 ›› 2006, Vol. 33 ›› Issue (9): 155-156.

• 计算机网络与信息安全 • 上一篇    下一篇

基于遗传算法及聚类的基因表达数据特征选择

任江涛 黄焕宇 孙婧昊 印鉴   

  1. 中山大学计算机科学系,广州510275
  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    本文研究得到国家自然科学基金资助(60573097)、广东省自然科学基金资助(05200302、04300462).

REN Jiang, Tao HUANG, Huan-Yu ,SUN Jing-Hao ,YIN Jian (Department of Computer Science, Zhongshan University, Guangzhou 510275)   

  • Online:2018-11-17 Published:2018-11-17

摘要: 特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象(如基因表达数据)的特征选择,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,如发现与疾病密切相关的重要基因。针对此问题,本文提出了一种新的面向基因表达数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用聚类算法及聚类错误率作为学习算法及评价指标。实验结果表明,该算法可有效地找出具有较好可分离性的特征子集,从而实现降维并提高聚类及分类精度。

关键词: 特征选择 遗传算法 聚类 基因表达数据

Abstract: Feature selection is one of the important problems in the pattern recognition and data mining areas. For highdimensional data such as gene expression data, feature selection not only can improve the accuracy and efficiency of classification and clustering

Key words: Feature selection, GA, Clustering, Gene expression data

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!