计算机科学 ›› 2015, Vol. 42 ›› Issue (11): 63-64.doi: 10.11896/j.issn.1002-137X.2015.11.012

• 2014年全国高性能计算机学术年会 • 上一篇    下一篇

面向定制结构的稀疏矩阵分块方法

邬贵明,王 淼,谢向辉,窦 勇,郭 松   

  1. 国防科学技术大学计算机学院 长沙410073;数学工程与先进计算国家重点实验室 无锡214125,数学工程与先进计算国家重点实验室 无锡214125,数学工程与先进计算国家重点实验室 无锡214125,国防科学技术大学计算机学院 长沙410073,国防科学技术大学计算机学院 长沙410073
  • 出版日期:2018-11-14 发布日期:2018-11-14
  • 基金资助:
    本文受国家自然科学基金项目(91430214),湖南省科研资助

Sparse Matrix Blocking Method for Custom Architecture

WU Gui-ming, WANG Miao, XIE Xiang-hui, DOU Yong and GUO Song   

  • Online:2018-11-14 Published:2018-11-14

摘要: 稀疏矩阵向量乘是科学计算的核心问题,采用定制结构来加速稀疏矩阵向量乘的执行对提升科学计算性能具有重要意义。针对目前面向定制结构的稀疏矩阵分块方法和表示方法的缺点,提出了稀疏矩阵二维均匀分块方法和相应的表示方法嵌套分块CSR。实验结果表明,提出的稀疏矩阵分块方法和表示方法能够有效减少填零个数。

关键词: 稀疏矩阵向量乘,定制结构,稀疏矩阵,数据分块

Abstract: Sparse matrix vector multiplication is one of the most important applications in scientific computing.Using custom architectures to implement sparse matrix vector multiplication is introduced to improve the performance of scientific computing.To address the problem in existing sparse matrix blocking method and representation,a two-dimension uniform blocking method and its according representation were proposed in this paper.The experimental results show that the proposed sparse matrix blocking method and representation can reduce the padding zero significantly.

Key words: Sparse matrix vector multiplication,Custom architecture,Sparse matrix,Data blocking

[1] Dorrance R,Ren F,Markovi′ D.A Scalable Sparse Matrix-Vector Multiplication Kernel for Energy-Efficient Sparse-BLAS on FPGAs[C]∥Proceedings of the 2014 ACM/SIGDA International Symposium on Field-Programmable Gate Arrays (FPGA).ACM,2014:161-170
[2] Fowers J,Ovtcharov K,Strauss K,et al.A High Memory Bandwidth FPGA Accelerator for Sparse Matrix-Vector Multiplication[C]∥Proceedings of the 2014 IEEE 22nd Annual International Symposium on Field-Programmable Custom Computing Machines (FCCM).IEEE,2014:36-43
[3] Zhuo L,Prasanna V K.Sparse Matrix-Vector Multiplication on FPGAs[C]∥Proceedings of the 13th ACM/SIGDA International Symposium on Field Programmable Gate Arrays (FPGA).ACM,2005:63-74
[4] Sun J,Peterson G D,Storaasli O O.Sparse Matrix-Vector Multiplication Design on FPGAs[C]∥ Proceedings of the 15th AnnualIEEE Symposium Field-Programmable Custom Computing Machines (FCCM).IEEE,2007:349-352
[5] Stathis P T.Sparse Matrix Vector Processing Formats[D].Delft,Netherlands:Delft University of Technology,2004
[6] Williams S,Vuduc R,Oliker L,et al.Optimizing Sparse Matrix-Vector Multiply on Emerging Multicore Platforms[J].Journal of Parallel Computing,2009,35(3):178-194
[7] The University of Florida Sparse Matrix Collection.http://www.cise.ufl.edu/research/sparse/matrices

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 雷丽晖,王静. 可能性测度下的LTL模型检测并行化研究[J]. 计算机科学, 2018, 45(4): 71 -75 .
[2] 孙启,金燕,何琨,徐凌轩. 用于求解混合车辆路径问题的混合进化算法[J]. 计算机科学, 2018, 45(4): 76 -82 .
[3] 张佳男,肖鸣宇. 带权混合支配问题的近似算法研究[J]. 计算机科学, 2018, 45(4): 83 -88 .
[4] 伍建辉,黄中祥,李武,吴健辉,彭鑫,张生. 城市道路建设时序决策的鲁棒优化[J]. 计算机科学, 2018, 45(4): 89 -93 .
[5] 史雯隽,武继刚,罗裕春. 针对移动云计算任务迁移的快速高效调度算法[J]. 计算机科学, 2018, 45(4): 94 -99 .
[6] 周燕萍,业巧林. 基于L1-范数距离的最小二乘对支持向量机[J]. 计算机科学, 2018, 45(4): 100 -105 .
[7] 刘博艺,唐湘滟,程杰仁. 基于多生长时期模板匹配的玉米螟识别方法[J]. 计算机科学, 2018, 45(4): 106 -111 .
[8] 耿海军,施新刚,王之梁,尹霞,尹少平. 基于有向无环图的互联网域内节能路由算法[J]. 计算机科学, 2018, 45(4): 112 -116 .
[9] 崔琼,李建华,王宏,南明莉. 基于节点修复的网络化指挥信息系统弹性分析模型[J]. 计算机科学, 2018, 45(4): 117 -121 .
[10] 王振朝,侯欢欢,连蕊. 抑制CMT中乱序程度的路径优化方案[J]. 计算机科学, 2018, 45(4): 122 -125 .