摘要: MRRR(Multiplc Rclativcly Robust Rcprcscntations)算法是求解对称三对角矩阵本征值问题高效、精确的算 法之一。在分析MRRR算法及CUDA(Compute Unified Device Architecture)并行体系结构的基础上,针对算法的可 并行性,采用单指令多线程并行方式实现了基于CUD八的MRRR算法并行,并从存储结构方面优化算法。实验结果 显示,与LAPACK库中串行MRRR实现相比,并行方法在保证精度的基础上获得了20倍的加速比,进而从计算精度 和计算时间上说明MRRR算法适合在GPU上并行。
No related articles found! |
|