1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2014年全国高性能计算机学术年会 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 内存列存储数据库中优化的混合自适应索引
    薛忠斌,周烜,张延松,周新,王珊
    计算机科学    2015, 42 (11): 28-31.   DOI: 10.11896/j.issn.1002-137X.2015.11.004
    摘要238)      PDF(pc) (432KB)(655)    收藏
    分析型数据库在现代企业中得到广泛应用,在使用过程中对查询处理速度的要求逐渐提高。大数据环境下,分析型数据库面临一系列新的挑战:首先,数据复杂性与日俱增,使得数据库系统的初始配置任务更加繁重,例如索引创建等;其次,在分析过程中,由于查询负载模式无法预知,需要对某些属性反复构建索引,以满足查询的时间要求。显然,传统的索引构建维护技术不能完全满足新的应用环境。数据库分裂技术提出了一种不同的策略去解决这些问题。使用数据库分裂技术,DBA不需要对数据库进行细粒度的系统配置。在查询执行过程中,数据库能自动调整以适应查询负载;随着查询负载的变化,系统自动调整索引。近年来,一系列数据库分裂算法被提出,但已有的算法都各有优缺点。因此给出了一个cache conscious的数据库分裂代价模型,并基于该模型构建了一个新的自适应索引,其可以综合不同数据库分裂算法的优势。通过大量实验验证了这种新自适应索引技术的有效性。
    参考文献 | 相关文章 | 多维度评价
    2. 基于OpenCL的直方图生成算法优化方法研究
    安小景,张云泉,贾海鹏
    计算机科学    2015, 42 (11): 32-36.   DOI: 10.11896/j.issn.1002-137X.2015.11.005
    摘要212)      PDF(pc) (688KB)(636)    收藏
    随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式。直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用。随着图像处理规模的扩大和实时性要求的提高,通过GPU提升直方图生成算法性能的需求也越来越强。在GPU计算平台关键优化方法和技术的基础上,完成了直方图生成算法在GPU计算平台上的实现及优化。实验结果表明,通过使用直方图备份、访存优化、数据本地化及规约优化等优化方法,直方图生成算法在AMD HD7850 GPU计算平台上的性能相对于优化前的版本达到了1.8~13.3倍的提升;相对于CPU版本,在不同数据规模下也达到了7.2~210.8倍的性能提升。
    参考文献 | 相关文章 | 多维度评价
    3. Intel Knights Corner的结点级内存访问优化
    林新华,李 硕,赵嘉明,松岗聪
    计算机科学    2015, 42 (11): 37-42.   DOI: 10.11896/j.issn.1002-137X.2015.11.006
    摘要193)      PDF(pc) (472KB)(584)    收藏
    传统编程优化(Traditional Programming Optimization,TPO)在Intel Knights Corner(KNC)上收效甚微,因此提出内存访问优化(Memory Access Optimization,MAO)。将MAO应用到已经过TPO的程序Diffusion 3D上,发现其性能仍然提高了39.1%。主要有2个贡献:1)提出MAO,认为TPO+MAO有助于在KNC上获取最优化性能;2)发现对于stencil代码,基于intrinsic的MAO比基于编译器的MAO更高效。这些发现对于在KNC上优化大规模应用有启发意义。
    参考文献 | 相关文章 | 多维度评价
    4. 基于异构多核平台的同步数据流图帕累托优化与调度
    顾玉磊,朱雪阳,晏荣杰,张广泉
    计算机科学    2015, 42 (11): 43-47.   DOI: 10.11896/j.issn.1002-137X.2015.11.007
    摘要192)      PDF(pc) (661KB)(552)    收藏
    同步数据流图被广泛用于多媒体和数字信号处理程序等流应用程序的建模。流应用程序须达到一定吞吐量才能流畅运行,利用异构多核处理器来进一步提高流应用程序的吞吐量已经成为当今嵌入式系统的发展趋势,但是提高吞吐量往往伴随着能耗的增加。为了解决这个问题,基于异构多核平台的同步数据流图系统模型,给出了求解所有能耗和吞吐量的帕累托优化点及其相应静态调度的方法。首先将系统模型转换为时间自动机网络,并将分析目标转换为时序逻辑公式;再使用实时模型检测工具UPPAAL寻找解决方案;最后对UPPAAL返回的结果进行分析,找出满足要求的调度。由于模型检测方法可对问题空间进行穷尽搜索,该方法得到的 结果 是精确的。该方法可帮助设计者在系统开发早期了解系统能耗和吞吐量的量化关系,有利于缩短系统的开发周期,降低开发成本。
    参考文献 | 相关文章 | 多维度评价
    5. 大数据负载的体系结构特征分析
    罗建平,谢梦瑶,王华锋
    计算机科学    2015, 42 (11): 48-52.   DOI: 10.11896/j.issn.1002-137X.2015.11.008
    摘要204)      PDF(pc) (447KB)(668)    收藏
    针对大数据离线分析类和交互式查询类负载,首先对这些负载的一些共性进行分析,提取出公共操作集,并对它们进行分组整理;然后在大数据平台上测试这些负载运行过程中的微体系结构特征,采用PCA和SimpleKMeans算法对这些体系结构特征参数进行降维和聚类处理。实验分析结果表明负载之间有公共的操作集,如Join和Cross Production;有些负载有相似的属性,如Difference和Projection共享相同的微体系结构特征。实验结果对于 处理器等硬件平台的设计以及应用程序的优化具有指导性的意义,并且为大数据基准测试平台的设计提供了参考。
    参考文献 | 相关文章 | 多维度评价
    6. 互相关运算在银河飞腾DSP上的实现及优化
    杨琳,吴家铸,扈啸,田希
    计算机科学    2015, 42 (11): 53-55.   DOI: 10.11896/j.issn.1002-137X.2015.11.009
    摘要228)      PDF(pc) (246KB)(722)    收藏
    在信号处理领域中,互相关运算对于寻找未知信号中的特性具有重要的作用。互相关常被用于图像匹配、粒子图像测速等领域。针对互相关运算计算量大而实时系统中要求较快运算速度的问题,利用银河飞腾多核DSP(YHFT-QDSP)的FFT加速器完成二维FFT运算,在YHFT-QDSP上实现了互相关运算,从而提高了互相关运算在实时系统中的性能,并在此基础上针对输入数据大小的不同提出了若干优化的方法,进一步提高了互相关运算的性能。
    参考文献 | 相关文章 | 多维度评价
    7. 有限元网格积分算法在MIC众核平台上的并行实现
    寇大治,孔大力
    计算机科学    2015, 42 (11): 56-58.   DOI: 10.11896/j.issn.1002-137X.2015.11.010
    摘要168)      PDF(pc) (340KB)(518)    收藏
    基于英特尔集成众核(Many Integrated Core,MIC)架构,将有限元网格积分算法在至强融核(Xeon Phi)协处理器做了移植和性能分析。该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(offload)[1]下利用OpenMP在MIC上的线程并行化。计算性能测试结果显示集成众核平台可以有效地加速有限元网格积分算法:1)一块被充分利用的MIC设备卡(3115A)的计算能力超过两路16核Intel XeonTM E5-2670 CPU;2)MIC并发的物理线程可能由于公共缓存访问存在竞争而降低程序的扩展性。测试结果还显示了在多CPU多MIC平台上进一步移植完整的MPI并行有限元模拟软件的可行性。这项工作有助于推动与有限元网格相关的科学和工程高性能计算的研究。
    参考文献 | 相关文章 | 多维度评价
    8. OpenFlow网络数据流路径建立开销的量化分析
    吴洁,付斌章,陈明宇,张立新
    计算机科学    2015, 42 (11): 59-62.   DOI: 10.11896/j.issn.1002-137X.2015.11.011
    摘要188)      PDF(pc) (351KB)(569)    收藏
    OpenFlow采用数据平面与控制平面分离的架构,以软件实现的OpenFlow控制器作为控制平面对网络进行集中控制。在这种分离架构中,由于交换机需要与控制器进行交互,因此必然会产生一定的时间开销。经实验,数据流建立过程中的信息交互导致数据包传输时延至少增长2倍,严重降低了网络性能。因此,量化分析OpenFlow网络中流建立开销具有重要意义。分析流建立开销产生的原因,对导致数据包传输时延增长的影响因素进行量化分析。 评估流建立开销对网络性能的影响是量化分析数据流路径建立开销的重点。
    参考文献 | 相关文章 | 多维度评价
    9. 面向定制结构的稀疏矩阵分块方法
    邬贵明,王 淼,谢向辉,窦 勇,郭 松
    计算机科学    2015, 42 (11): 63-64.   DOI: 10.11896/j.issn.1002-137X.2015.11.012
    摘要452)      PDF(pc) (494KB)(552)    收藏
    稀疏矩阵向量乘是科学计算的核心问题,采用定制结构来加速稀疏矩阵向量乘的执行对提升科学计算性能具有重要意义。针对目前面向定制结构的稀疏矩阵分块方法和表示方法的缺点,提出了稀疏矩阵二维均匀分块方法和相应的表示方法嵌套分块CSR。实验结果表明,提出的稀疏矩阵分块方法和表示方法能够有效减少填零个数。
    参考文献 | 相关文章 | 多维度评价
    10. 基于树型结构的MapReduce并行模型
    唐兵,贺海武
    计算机科学    2015, 42 (11): 65-67.   DOI: 10.11896/j.issn.1002-137X.2015.11.013
    摘要257)      PDF(pc) (602KB)(555)    收藏
    MapReduce是Google提出的一种分布式计算模型,已在海量数据处理领域得到了广泛的应用。提出一种基于树型结构的新型MapReduce并行模型。该模型适合于利用Internet或Intranet环境下不可靠的桌面PC资源进行海量科学数据分析。该模型以P2P的形式将计算节点进行组织,模型的底层采用了P2P-MPI框架,采用基于消息传递的模式来实现MapReduce应用层。在MapReduce应用层的实现中,在Map阶段采用广播的形式来分发数据块,在Reduce阶段建立反向二叉树来实现有效的结果合并和化简。将提出的MapReduce模型与现有主流MapReduce模型进行了比较,结果表明,基于树型结构的MapReduce并行模型在容错性能方面具有较优的性能,且系统简单,易于应用开发。
    参考文献 | 相关文章 | 多维度评价
    11. 一种基于主动认知决策的高效能模型
    杨劲,庞建民,王俊超,于锦涛,刘 睿
    计算机科学    2015, 42 (11): 68-72.   DOI: 10.11896/j.issn.1002-137X.2015.11.014
    摘要240)      PDF(pc) (423KB)(545)    收藏
    随着高性能计算机的发展,如何降低功耗、提高计算机的效能,越来越受到人们的关注。针对高性能计算机的效能问题,采用可重构思想,提出一种基于主动认知决策的高效能模型。该模型不断感知应用任务的实时状态,并对应用状态和当前应用结构做出评估决策,通过主动重构应用结构来达到降低系统能耗和提高效能的目的。为了验证模型的有效性,搭建了原型实验系统,实现了视频拷贝检测和口令恢复两个应用,并采用真实的互联网流量统计曲线模拟负荷。结果表明,基于该模型构建的应用能够提高系统的效能,在上述环境下,与传统方法相比,效能提高了58%。
    参考文献 | 相关文章 | 多维度评价
    12. 一种基于云端信息保护的汉字计算模型
    栗青生,张 莉,刘 泉,熊 晶,杨新新
    计算机科学    2015, 42 (11): 73-79.   DOI: 10.11896/j.issn.1002-137X.2015.11.015
    摘要195)      PDF(pc) (1106KB)(1263)    收藏
    提出了一种基于信息内容保护的信息安全模型。该模型利用将汉字笔画抽象为有向图的方法,设计了汉字笔画图抽象的具体方案,实现了对汉字字形结构的动态描述;建立了动态汉字字形描述库,设计了汉字字形的生成算法,实现了汉字字形的Web存储和特征字形的客户端输出。所提模型为汉字信息的云端存储和云端数据安全性保护提供了一种解决方案,不仅有助于汉字信息的安全保护,而且有助于汉字认知计算、语义计算等深度汉字信息计算。
    参考文献 | 相关文章 | 多维度评价
    13. 基于MapReduce的MIC算法并行化
    吕瑞,蔡国永,裴广战
    计算机科学    2015, 42 (11): 80-83.   DOI: 10.11896/j.issn.1002-137X.2015.11.016
    摘要215)      PDF(pc) (953KB)(566)    收藏
    MIC是一种分析变量之间可能存在的关系的方法。该方法不仅能够有效识别出变量间各种复杂类型的关系,还能够准确描述噪音数据对存在关系的影响,对探索大数据集中变量之间的关系具有重要意义。针对该方法在处理包含大量变量的数据集时性能方面的不足,首次对它进行了基于MapReduce模型的并行化。提出的并行化方法首先对原算法进行更细颗粒度的划分,然后采用一种基于Map-Reduce-Map任务链的并行模型,该模型不仅有效地增加了并行的计算单元,还大大地降低了不必要的系统开销。最后,通过理论分析和实验验证得出,改进后的算法与原算法相比,在准确率方面具有等效性,运行速度大幅度提升且具有良好的可扩展性;实验同时指出了算法性能的提升与系统资源的关系。
    参考文献 | 相关文章 | 多维度评价
    14. 面向Java锁机制的字节码自动重构框架
    张杨,张冬雯,仇晶
    计算机科学    2015, 42 (11): 84-89.   DOI: 10.11896/j.issn.1002-137X.2015.11.017
    摘要237)      PDF(pc) (807KB)(570)    收藏
    Java语言提供了同步锁、可重入锁和读写锁等几种锁机制,在并行程序设计中不同的数据结构使用这几种锁机制时获得的性能通常是不同的。为了在不同的锁机制之间进行自动转换,进而帮助程序员了解程序的性能,提出了一种面向Java锁机制的字节码自动重构框架,并基于该框架实现了字节码重构工具Lock2Lock。Lock2Lock在Quad中间表示的基础上对字节码进行静态分析,并对分析的结果进行一致性验证,通过Javassist完成字节码的重构。使用红黑树、消费者生产者程序以及SPECjbb2005 3个测试程序对Lock2Lock重构工具进行了测试,结果表明,Lock2Lock可以成功地实现从同步锁到可重入锁或读写锁的重构。
    参考文献 | 相关文章 | 多维度评价
    15. 基于GPU并行加速的多特征融合的超图降维方法
    洪朝群,陈旭辉,王晓栋,李士锦,吴克寿
    计算机科学    2015, 42 (11): 90-93.   DOI: 10.11896/j.issn.1002-137X.2015.11.018
    摘要193)      PDF(pc) (399KB)(534)    收藏
    基于图的学习方法目前广泛用于降低特征维度。然而,对于多特征数据而言,不同特征之间的不同关联性很难结合到单个图中。针对多特征数据提出了新的半监督降维方法。首先,以超图中的超边作为片,使超图应用到片对齐框架中。然后,通过统计片中相邻的特征对的距离计算超边的权重,使得不同特征下的片得到结合。其次,由于欧氏距离和矩阵乘法的计算在拉普拉斯矩阵的构造过程中占用了大部分的时间,因此使用GPU对其进行加速。实验结果表明了所提方法在分类性能和学习速度上的提升效果。
    参考文献 | 相关文章 | 多维度评价
    16. 基于MIC的GFSR(521,2)并行化设计与实现
    顾小璐,周津羽,华 诚,刘 逍,周晓辉
    计算机科学    2015, 42 (11): 94-95.   DOI: 10.11896/j.issn.1002-137X.2015.11.019
    摘要463)      PDF(pc) (246KB)(445)    收藏
    GFSR是一种反馈移位随机数发生器。在研究GFSR(521,2)串行算法的基础上,利用Strided skip ahead方法对其进行并行化。实验结果显示,GFSR(521,2)并行化后TestU01的测试结果与串行的相同。相对于CPU单线程,MIC平台下的最优加速比为7.58。
    参考文献 | 相关文章 | 多维度评价
    17. 基于神经网络的用户视频评分自动获取方法
    纪淑娟,王 理,梁永全,赵建立
    计算机科学    2015, 42 (11): 96-100.   DOI: 10.11896/j.issn.1002-137X.2015.11.020
    摘要178)      PDF(pc) (517KB)(437)    收藏
    在未来的智能电视系统中,真正的智能视频推荐应该是不需要用户评分动作就能自动、准确地获得用户兴趣、爱好并做出推荐的系统。研究无评分动作约束下的用户评分(揭示了他们的兴趣和爱好)自动获取技术是真正的智能推荐必须解决的一个关键问题。给出了一种基于神经网络的用户视频隐性评分自动获取方法。基于用户视频观看行为与评分样本的实验结果表明,该方法可以有效地获取用户的隐性评分信息。
    参考文献 | 相关文章 | 多维度评价
    18. 归约算法统一描述
    熊玉庆
    计算机科学    2015, 42 (11): 101-103.   DOI: 10.11896/j.issn.1002-137X.2015.11.021
    摘要169)      PDF(pc) (232KB)(1517)    收藏
    归约算法在并行计算中应用广泛,目前有很多归约算法应用于不同的情形。这些归约算法各不相同, 逻辑拓扑是 造成区别的关键 。为了统一描述归约算法,揭示它们的共性,给出了一个逻辑拓扑的定义及其性质。在此基础上,给出了归约算法的统一描述,以利于对归约算法的理解,从而设计适应不同应用和环境的归约算法。该描述也可视为可集成不同语义的归约算法框架,从而有助于设计具有新语义的归约算法。本质上,该统一描述是一个归约算法形式定义,有助于验证归约算法的正确性。
    参考文献 | 相关文章 | 多维度评价
    19. 一种基于Sigmoid函数的抑制Halo效应的有效算法
    陈丽,郭玉坤,李金屏
    计算机科学    2015, 42 (11): 112-117.   DOI: 10.11896/j.issn.1002-137X.2015.11.024
    摘要425)      PDF(pc) (1027KB)(1072)    收藏
    人们通常利用暗通道先验理论进行图像去雾,其副作用之一就是光晕现象,即Halo效应。在深入分析光晕效应特点的基础上,提出了一种基于Sigmoid函数的抑制Halo效应的有效算法。首先对带有光晕的图像进行大量观察,总结了光晕产生的位置规律及结构特性,构造了一个具有方向性的Sigmoid模板;然后对由暗通道先验理论得到的粗略透射率图进行边缘检测,获得景深突变处像素点的坐标和方向角;其次,再利用已构造的模板判断该处出现光晕的准确位置,并将非光晕区域的像素值赋给光晕区域,得到优化后的透射率图;最后引入一种容差机制还原出清晰无光晕的图像。本算法的特色在于所构造的模板仅仅处理出现光晕的区域,而不是处理整个图像区域,因此避免了传统方法中非光晕区域的颜色失真问题。实验结果表明,本算法简单易行,运行速度快,复原效果好。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共19条记录