CuMen：基于最大频繁序列模式的聚类算法及其在基因拼接中的应用

计算机科学 ›› 2005, Vol. 32 ›› Issue (10): 149-153.

• 计算机网络与信息安全 • 上一篇下一篇

CuMen：基于最大频繁序列模式的聚类算法及其在基因拼接中的应用

黄东唐俊汪卫施伯乐

复旦大学计算机与信息技术系,上海200433

出版日期:2018-11-17 发布日期:2018-11-17
基金资助:
本课题得到教委高校网格项目200309和上海科委重大项目03dz15027资助.

HUANG Dong, TANG Jun, WANG Wei, SHI Bai-Le（Department of Compater Science and Engineering, Fudan University, Shanghai 200433）

Online:2018-11-17 Published:2018-11-17

摘要/Abstract

摘要： 基因组序列拼接的主流方法是将整条序列随机打断成小片段,然后根据片段间重叠关系连接成长序列.由于较多噪音存在,算法复杂度高,加之生物数据的海量增长,序列拼接处理导致巨大的时空开销而无法完成.本文提出一种基于最大频繁序列模式的聚类算法,将整个数据集分成若干个子集,分别高效地处理,实现了一个基因拼接网格系统、透明动态的资源管理,大大扩展了基因拼接计算能力.基于最大频繁序列模式聚类算法及挖掘算法,针对生物数据的特性做出了优化.

关键词: 最大频繁序列模式序列聚类序列拼接网格基因组序列序列模式拼接处理聚类算法应用生物数据算法复杂度网格系统资源管理

Abstract: Sequencing genomes is a fundamental aspect of biological research. A variety of assembly programs have been previously proposed and implemented. Because of great computational complexity and increasingly large size, they incur great time and space overhea

Key words: Maximal frequent sequential pattern, Sequence clustering, Sequence assembly, Grid

黄东唐俊汪卫施伯乐. CuMen：基于最大频繁序列模式的聚类算法及其在基因拼接中的应用[J]. 计算机科学, 2005, 32(10): 149-153. https://doi.org/

HUANG Dong, TANG Jun, WANG Wei, SHI Bai-Le（Department of Compater Science and Engineering, Fudan University, Shanghai 200433）. [J]. Computer Science, 2005, 32(10): 149-153. https://doi.org/

参考文献

Metrics

Viewed

Full text

Abstract

Cited

Shared

Discussed

CuMen：基于最大频繁序列模式的聚类算法及其在基因拼接中的应用

PDF (PC)

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

Metrics

本文评价

推荐阅读 0