%A 董改芳,付学良,李宏慧 %T 多序列星比对算法的改进及其在Spark中的并行化研究 %0 Journal Article %D 2017 %J 计算机科学 %R 10.11896/j.issn.1002-137X.2017.10.010 %P 55-58 %V 44 %N 10 %U {https://www.jsjkx.com/CN/abstract/article_16705.shtml} %8 2018-12-01 %X 多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度 耗费了大量时间,因此提出了通过综合计算每个序列产生的k-mers及各个k-mer在各序列中出现的次数来确定k-mers的拼接选择,由k-mers进行拼接从而 得到中心序列。进而,在双序列比对过程中采用搜索两个序列最大相似子串的思想,改进的星比对算法的精度在一定程度上得到了明显提升。接着, 将改进的星比对算法在Spark中进行并行化设计与实现。采用Spark的Yarn-Client运行模式,对正常人线粒体的多组数据进行实验,分析了算法性能上的不足及改进方向。