计算机科学 ›› 2015, Vol. 42 ›› Issue (1): 90-91.doi: 10.11896/j.issn.1002-137X.2015.01.021
• 2013年全国理论计算机科学学术年会 • 上一篇 下一篇
詹科,张云泉,王婷,郑晶晶,张鹏
ZHAN Ke, ZHANG Yun-quan, WANG Ting, ZHENG Jing-jing and ZHANG Peng
摘要: 高通量测序仪产生大量的DNA数据,FASTQ是被广泛使用的 存储DNA数据的数据格式。对FASTQ格式的数据进行压缩处理,能有效地节省存储空间。DSRC算法具有压缩比高的优点,因此对DSRC算法进行并行能提高压缩FASTQ格式的DNA数据的效率。基于Pthreads,实现了并行DSRC算法。测试结果表明,当使用4线程时加速比达到3.5。
[1] Tembe W,et al.G-SQZ:compact encoding of genomic sequence and quality data[J].Bioinformatics,2010,26(17):2192-2194 [2] Jones D C,et al.Compression of next-generation sequencingreads aided by highly efficient de novo assembly[J].Nucleic Acids Res.,2012,40(22),e171 [3] Deorowicz S,et al.Compression of DNA sequence reads inFASTQ format[J].Bioinformatics,2011,27(6):860-862 [4] https://computing.llnl.gov/tutorials/pthreads/#Abstract [5] http://www.1000genomes.org/ |
No related articles found! |
|