1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2015全国高性能计算学术年会 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 路网中高吞吐量移动对象实时查询算法
    薛忠斌,白利光,何宁,周烜,周歆,王珊
    计算机科学    2017, 44 (3): 16-19.   DOI: 10.11896/j.issn.1002-137X.2017.03.004
    摘要300)      PDF(pc) (1059KB)(532)    收藏
    随着无线通信技术、空间定位技术和移动计算技术的快速发展,基于位置的查询成为数据库领域的一个重要研究问题。研究了路网中移动对象的KNN查询,一系列的算法被提出用于解决移动对象的KNN查询问题。然而,这些算法关注于查询的快速响应问题或者专注于解决移动对象的快速更新问题。随着移动对象数量的不断增加,当查询和更新大量涌入时,吞吐量成为一个更重要的问题。针对移动对象的更新数据流和查询数据流,提出了一种基于内存的高吞吐量移动对象KNN查询算法——DSRNKNN算法,用于处理路网中移动对象的KNN查询。DSRNKNN算法采用了基于快照的模式。在每个快照中,DSRNKNN算法通过重新构建索引的方式避免了复杂的索引维护操作,充分发挥了硬件的性能;通过每次执行一组查询的方式,充分利用查询内和查询间的并行,增加了数据的局部性,提高了算法的效率。在基于实际路网生成的数据集上对算法进行了测试,实验验证了DSRNKNN算法具有很好的性能表现。
    参考文献 | 相关文章 | 多维度评价
    2. 异构集群上的宏基因组聚类优化
    韦建文,许志耿,王丙强,Simon SEE,林新华
    计算机科学    2017, 44 (3): 20-22.   DOI: 10.11896/j.issn.1002-137X.2017.03.005
    摘要265)      PDF(pc) (338KB)(631)    收藏
    宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现。相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大。以某基因库为例,包含1300个样本、每样本百万基因的数据,单线程运行需要27年。充分发挥多核CPU的潜力,利用GPU加速卡强大的计算能力,将程序扩展到多节点集群上运行,是重要而迫切的工作。在仔细分析算法的基础上,首先针对单CPU节点和单GPU卡做了高效实现,获得了接近理想的加速比;然后利用缓存优化进一步提升性能;最后使用负载均衡方法在MPI线程间分发计算任务,实现了良好的扩展。相比未优化的单线程程序,16节点CPU获得了238.8倍的加速,6 块GPU卡获得了263.8倍的加速。
    参考文献 | 相关文章 | 多维度评价
    3. 一种MapReduce架构下基于遗传算法的K-Medoids聚类
    赖向阳,宫秀军,韩来明
    计算机科学    2017, 44 (3): 23-26.   DOI: 10.11896/j.issn.1002-137X.2017.03.006
    摘要341)      PDF(pc) (397KB)(724)    收藏
    由互联网时代快速发展而产生的海量数据给传统聚类方法带来了巨大挑战,如何改进聚类算法从而获取有效信息成为当前的研究热点。K-Medoids是一种常见的基于划分的聚类算法,其优点是可以有效处理孤立、噪声点,但面临着初始中心敏感、容易陷入局部最优值、处理大数据时的CPU和内存瓶颈等问题。为解决上述问题,提出了一种MapReduce架构下基于遗传算法的K-Medoids聚类。利用遗传算法的种群进化特点改进K-Medoids算法的初始中心敏感的问题,在此基础上,利用MapReduce并行遗传K-Medoids算法提高算法效率。通过带标签的数据集进行实验的结果表明,运行在Hadoop集群上的基于MapReduce和遗传算法的K-Medoids算法能有效提高聚类的质量和效率。
    参考文献 | 相关文章 | 多维度评价
    4. 基于压缩域的脑成像大数据体可视化方法
    时学凯,王文珂,黄辉,李思昆,傅艺绮
    计算机科学    2017, 44 (3): 27-31.   DOI: 10.11896/j.issn.1002-137X.2017.03.007
    摘要422)      PDF(pc) (1089KB)(548)    收藏
    脑科学是当今国际科技研究的前沿邻域,而对高精度脑成像数据进行可视化是脑神经科学在结构成像方面的基础性需求。针对高精度脑成像数据可视化过程中存在的数据量大以及绘制效率低的问题,提出了基于分类分层矢量量化和完美空间哈希相结合的压缩域可视化方法。首先对体数据进行分块,记录每块的平均值并依据块内体数据的平均梯度值是否为0进行分类;其次运用分层矢量量化对平均梯度值不为0的块进行压缩;然后用分块完美空间哈希技术存储压缩得到两个索引值;最后对上面的压缩体数据进行解码得到恢复体数据,采用分块完美空间哈希对原始体数据与恢复体数据作差得到的残差数据进行压缩。绘制时,只需将压缩得到的数据作为纹理加载到GPU内,即可在GPU内完成实时解压缩绘制。实验结果表明,在保证较好图像重构质量的前提下,该算法减少了数据的存储空间,提高了体可视化的绘制效率,从而可以在单机上处理较大的数据。
    参考文献 | 相关文章 | 多维度评价
    5. Calculix三级并行优化及其在天河二号超级计算机中的应用
    姜文超,林穗,王多强,李东明,金海
    计算机科学    2017, 44 (3): 32-35.   DOI: 10.11896/j.issn.1002-137X.2017.03.008
    摘要556)      PDF(pc) (816KB)(1226)    收藏
    针对开源有限元软件Calculix传统计算模式在大规模数值计算中的低效问题,提出了Calculix三级并行优化策略,即预处理并行优化、节点间并行调度以及节点内多核多线程并行改造。预处理并行优化在方程组分解过程中与分解过程后,分别对其参数矩阵进行有条件的动态舍弃,据此构造了部分列选主元多行双门槛不完全LU分解预处理算法,并对算法的可行性、有效性以及收敛性给出了证明。为充分发挥TH-2超级计算机强大的资源优势,相继给出了基于QoS的节点间任务动态调度算法,以及节点内多核多线程并行任务调度算法,进一步实现计算任务与资源之间的优化匹配和QoS需求。在实验环节中搭建了针对天河二号(TH-2)超级计算环境的有限元并行计算与分析平台,并完成了针对船舶疲劳强度分析问题的实际工程应用测试。理论分析与工程算例测试结果充分证明:Calculix三级并行优化方案能够有效提高Calculix求解线性方程组的速度,在可获取足够计算资源的前提下, 与传统计算模式相比 ,实际工程算例的计算速度平均提高了2~4倍。
    参考文献 | 相关文章 | 多维度评价
    6. 基于Pthreads的车辆图像兴趣区域提取并行算法研究
    周艺华,王文东,陈宏彩,王婷,张常有
    计算机科学    2017, 44 (3): 36-37.   DOI: 10.11896/j.issn.1002-137X.2017.03.009
    摘要389)      PDF(pc) (259KB)(517)    收藏
    为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域(Region Of Interest,ROI)约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,在基本并行算法的基础上,精心设计预处理过程的分解方案,设置多队列缓冲区,减少共用缓冲区的线程数量和每个缓冲区互斥锁锁定的次数。实验证明,所提算法在双CPU 12核(支持超线程到24线程)的服务器上运行,相对于串行算法,实现了13.1x的加速比。
    参考文献 | 相关文章 | 多维度评价
    7. 一个面向任务图并行程序的错误检查工具
    刘艳娜,陈莉,唐生林
    计算机科学    2017, 44 (3): 38-41.   DOI: 10.11896/j.issn.1002-137X.2017.03.010
    摘要256)      PDF(pc) (1637KB)(570)    收藏
    AceMesh是一种基于数据流描述的任务并行编程语言,它允许程序员从串行程序出发,追加并行区域、并行循环的制导以及任务区的数据访问信息,AceMesh编译系统则自动把该程序转化为异步任务图并行的程序。分析了AceMesh程序改写中常见的并行化错误,介绍了其错误检查工具AceMeshCheck的结构,描述了访存轨迹的高效收集、存储方法以及逻辑形状推导的三维压缩算法。实验表明,AceMeshCheck不仅能分析出制导程序中的典型错误,而且开销较小。
    参考文献 | 相关文章 | 多维度评价
    8. 气象数据检索区域查询优化及并行算法设计
    许婧,任开军,李小勇
    计算机科学    2017, 44 (3): 42-47.   DOI: 10.11896/j.issn.1002-137X.2017.03.011
    摘要229)      PDF(pc) (1107KB)(602)    收藏
    随着数值天气预报水平和分辨率的不断提高,气象科学数据呈海量增长趋势,导致气象资料归档与检索系统(MARS)处理大数据服务请求的效率较低。针对此情况,开展了基于MARS检索区域查询方式的优化研究,结合数学补集思想与多路数组聚集计算原理,提出了一种高效的补集转换区域查询方法(CTRQ),从而实现大范围区域查询下的“大数据”计算转换为“小数据”计算。其基本思路是通过超立方体聚集维尺寸与区域查询服务请求的属性值集合大小比较,执行“过半求补”的索引计算操作,利用二次求补实现气象场数据物理存储信息的检索。实验表明,相比原始的索引计算方法,该方法能够有效降低数据检索时元数据索引计算的系统开销。在此基础上,结合并行处理方法,设计并实现了CTRQ并行算法,相比其改进后的串行算法最大获得1.9倍加速比,进一步提高了MARS的检索效率。
    参考文献 | 相关文章 | 多维度评价
    9. 并行计算水下大尺度弹性壳体的低频声散射
    张建民,安俊英,慈国庆,王宁
    计算机科学    2017, 44 (3): 48-50.   DOI: 10.11896/j.issn.1002-137X.2017.03.012
    摘要292)      PDF(pc) (944KB)(688)    收藏
    有限元与边界元耦合模型是研究水下弹性壳体目标低频声散射常用的数值方法。应用该模型计算大尺度弹性目标的声散射时需要大量的计算时间与存储空间,采用并行数值的方式可以解决这一问题。首先并行计算生成有限元矩阵和边界元矩阵,然后应用并行化的广义极小残差(GMRES)迭代算法求解大型非对称线性方程组。详细叙述了并行GMRES(m)迭代算法的执行过程,并以球壳的声散射计算为例分析了迭代步数对算法收敛情况的影响。最后计算了Benchmark目标模型的低频散射声场,分析了其收发分置散射目标强度以及表面声场的分布。
    参考文献 | 相关文章 | 多维度评价
    10. 基于MPI和OpenMP混合编程的非负矩阵分解并行算法
    唐兵,Laurent BOBELIN,贺海武
    计算机科学    2017, 44 (3): 51-54.   DOI: 10.11896/j.issn.1002-137X.2017.03.013
    摘要450)      PDF(pc) (1747KB)(1264)    收藏
    非负矩阵分解(NMF)作为一种数据降维和特征提取的有效工具,已经在文本聚类、推荐系统等多个领域得到应用,但是其计算过程比较复杂。对此,提出一种基于MPI+OpenMP的混合层次化并行NMF方法,其充分利用基于MPI的消息传递模型和基于OpenMP的共享存储模型各自的优势,并基于多核节点集群进行测试。实验结果表明,所设计的并行NMF算法达到了较高的加速比,能有效处理高阶矩阵的非负分解,极大地提高了计算的效率。
    参考文献 | 相关文章 | 多维度评价
    11. 一种层次式远程数据持有检测方法
    马海峰,杨家海,姚念民,关明山
    计算机科学    2017, 44 (3): 55-58.   DOI: 10.11896/j.issn.1002-137X.2017.03.014
    摘要229)      PDF(pc) (336KB)(460)    收藏
    在云存储环境下,云服务器并不完全可信。用户如何以较低开销验证云上数据的完整性成为用户日益关心的问题。目前已提出多种保护方法,这些方法在认证多个文件时需要对文件逐一进行认证,因此当文件数很大时其计算和通信开销仍较大。针对此问题,提出一种层次式远程数据持有检测方法。该方法与远程数据持有检测方法相结合,能提供高效且安全的远程数据完整性保护,并支持动态数据操作。对提出的方法进行了安全性分析和实验评估,结果表明,提出的方法安全可靠,在较低的漏检率下,相比远程数据持有检测方法有45%~80%的性能提升。
    参考文献 | 相关文章 | 多维度评价
    12. 基于B样条的Level-Set GPU演化算法
    袁斌
    计算机科学    2017, 44 (3): 59-62.   DOI: 10.11896/j.issn.1002-137X.2017.03.015
    摘要215)      PDF(pc) (1081KB)(590)    收藏
    大部分Level-Set演化模型基于平均曲率或梯度,这对去除3D数据的噪声时保持线状特征是不利的;在解Level-Set演化方程时一般采用迎风格式,精度较低。设计了基于曲率差的高阶演化方程以及基于B样条和中心差分的混合GPU解法器。实验结果表明,基于曲率差的演化方程能够在光顺数据时保持线状特征。
    参考文献 | 相关文章 | 多维度评价
    13. 基于人口统计学的改进聚类模型协同过滤算法
    王媛媛,李翔
    计算机科学    2017, 44 (3): 63-69.   DOI: 10.11896/j.issn.1002-137X.2017.03.016
    摘要426)      PDF(pc) (3864KB)(801)    收藏
    针对传统基于用户的协同过滤推荐算法在大数据环境下存在评分高维稀疏性、推荐精度低的问题,提出一种基于人口统计学数据与改进聚类模型相结合的协同过滤推荐算法,以提高推荐系统精度和泛化能力。该方法首先通过用户人口统计学数据属性,结合用户-项目评分矩阵计算各个用户间的相似度;然后对用户、项目进行分层近邻传播聚类,根据用户对项目的评分数据计算用户或项目之间的相似性,产生目标用户或项目的兴趣近邻;最后根据兴趣最近邻进行推荐。对Epinions,MovieLents等数据集进行仿真实验,仿真的结果表明, 与传统的协同过滤算法相比, 提出的算法提高了推荐精度,为传统的协同过滤推荐算法提供了参考。
    参考文献 | 相关文章 | 多维度评价
    14. 一种异构片上网络路由算法的研究
    方娟,刘士建,刘思彤
    计算机科学    2017, 44 (3): 70-72.   DOI: 10.11896/j.issn.1002-137X.2017.03.017
    摘要299)      PDF(pc) (261KB)(565)    收藏
    随着集成电路工艺的迅速发展,传统的片上网络由于缓存引起芯片面积开销和能耗增加,从而使得无缓存路由技术得到了广泛关注。通过消除缓存, 整体的流水线进程大大得到简化,性能得到提高。但当网络负载量较大时,数据包被多次偏转或误传,导致网络的延迟增加,系统健壮性较差。针对片上网络运行应用的多样性,异构网络作为一种相对灵活的网络结构,能有效地降低网络的传输时延,提高系统性能。文中设计了无缓存NoC和带缓存NoC两种路由方式相结合的异构片上网络,并匹配静态路由算法和动态的自适应路由算法(AFC)进行数据包的传输。同时,还提出了一种针对AFC的优化算法(AFC-LP),其通过对无缓存路由计算的二次仲裁,进一步降低了通信的平均时延,提高了网络性能。实验表明,AFC-LP算法相比于传统带缓存的维序X-Y路由算法,片上网络的平均延迟降低了28.4%,CPU每一时钟周期内所执行的指令数IPC(Instruction Per Cycle)提升了10.4%。
    参考文献 | 相关文章 | 多维度评价
    15. 一种面向云多层应用的费用高效的资源管理方法
    杨劲,庞建民,齐宁,刘睿
    计算机科学    2017, 44 (3): 73-78.   DOI: 10.11896/j.issn.1002-137X.2017.03.018
    摘要214)      PDF(pc) (619KB)(484)    收藏
    由于部署方便、维护简单并且不需要搭建自己的私有机房,云数据中心正成为大多数互联网公司 尤其是初创公司和中小规模公司 部署应用程序的首选。在以基础设施为服务的云环境里,互联网公司可以根据应用程序的需要动态租赁云基础设施,从而节省预算开支,并保证应用性能。然而,在现有的业界实践中,云服务提供商提供的负载均衡和资源伸缩服务只能监控虚拟机的使用状态,并不能监控应用程序的运行状态,因此无法准确根据应用程序的服务需求自适应变换资源规模。同时,现有的文献和实践中,也很少有 研究从云基础设施使用者的角度出发,为使用者节省基础设施租赁费用或高效使用已租赁基础设施。据此提出了一种面向基础设施云环境下多层应用的费用高效的资源管理方法,其在降低用户费用的同时,还能充分利用所花费用提高应用程序性能。通过仿真对所提方法业界实际使用的方法 进行比较,结果表明所提方法不仅能够提高应用程序的服务质量和服务性能,也能较大地降低公司在基础设施租赁方面的费用。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共15条记录