1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2014年全国高性能计算机学术年会 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 内存列存储数据库中优化的混合自适应索引
    薛忠斌,周烜,张延松,周新,王珊
    计算机科学    2015, 42 (11): 28-31.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.004
    摘要 (76)   PDF (432KB) (217)  
    分析型数据库在现代企业中得到广泛应用,在使用过程中对查询处理速度的要求逐渐提高。大数据环境下,分析型数据库面临一系列新的挑战:首先,数据复杂性与日俱增,使得数据库系统的初始配置任务更加繁重,例如索引创建等;其次,在分析过程中,由于查询负载模式无法预知,需要对某些属性反复构建索引,以满足查询的时间要求。显然,传统的索引构建维护技术不能完全满足新的应用环境。数据库分裂技术提出了一种不同的策略去解决这些问题。使用数据库分裂技术,DBA不需要对数据库进行细粒度的系统配置。在查询执行过程中,数据库能自动调整以适应查询负载;随着查询负载的变化,系统自动调整索引。近年来,一系列数据库分裂算法被提出,但已有的算法都各有优缺点。因此给出了一个cache conscious的数据库分裂代价模型,并基于该模型构建了一个新的自适应索引,其可以综合不同数据库分裂算法的优势。通过大量实验验证了这种新自适应索引技术的有效性。
    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(7)
    2. 基于OpenCL的直方图生成算法优化方法研究
    安小景,张云泉,贾海鹏
    计算机科学    2015, 42 (11): 32-36.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.005
    摘要 (71)   PDF (688KB) (197)  
    随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式。直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用。随着图像处理规模的扩大和实时性要求的提高,通过GPU提升直方图生成算法性能的需求也越来越强。在GPU计算平台关键优化方法和技术的基础上,完成了直方图生成算法在GPU计算平台上的实现及优化。实验结果表明,通过使用直方图备份、访存优化、数据本地化及规约优化等优化方法,直方图生成算法在AMD HD7850 GPU计算平台上的性能相对于优化前的版本达到了1.8~13.3倍的提升;相对于CPU版本,在不同数据规模下也达到了7.2~210.8倍的性能提升。
    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(3)
    3. Intel Knights Corner的结点级内存访问优化
    林新华,李 硕,赵嘉明,松岗聪
    计算机科学    2015, 42 (11): 37-42.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.006
    摘要 (74)   PDF (472KB) (239)  
    传统编程优化(Traditional Programming Optimization,TPO)在Intel Knights Corner(KNC)上收效甚微,因此提出内存访问优化(Memory Access Optimization,MAO)。将MAO应用到已经过TPO的程序Diffusion 3D上,发现其性能仍然提高了39.1%。主要有2个贡献:1)提出MAO,认为TPO+MAO有助于在KNC上获取最优化性能;2)发现对于stencil代码,基于intrinsic的MAO比基于编译器的MAO更高效。这些发现对于在KNC上优化大规模应用有启发意义。
    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(2)
    4. 基于异构多核平台的同步数据流图帕累托优化与调度
    顾玉磊,朱雪阳,晏荣杰,张广泉
    计算机科学    2015, 42 (11): 43-47.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.007
    摘要 (63)   PDF (661KB) (162)  
    同步数据流图被广泛用于多媒体和数字信号处理程序等流应用程序的建模。流应用程序须达到一定吞吐量才能流畅运行,利用异构多核处理器来进一步提高流应用程序的吞吐量已经成为当今嵌入式系统的发展趋势,但是提高吞吐量往往伴随着能耗的增加。为了解决这个问题,基于异构多核平台的同步数据流图系统模型,给出了求解所有能耗和吞吐量的帕累托优化点及其相应静态调度的方法。首先将系统模型转换为时间自动机网络,并将分析目标转换为时序逻辑公式;再使用实时模型检测工具UPPAAL寻找解决方案;最后对UPPAAL返回的结果进行分析,找出满足要求的调度。由于模型检测方法可对问题空间进行穷尽搜索,该方法得到的 结果 是精确的。该方法可帮助设计者在系统开发早期了解系统能耗和吞吐量的量化关系,有利于缩短系统的开发周期,降低开发成本。
    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(2)
    5. 大数据负载的体系结构特征分析
    罗建平,谢梦瑶,王华锋
    计算机科学    2015, 42 (11): 48-52.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.008
    摘要 (62)   PDF (447KB) (188)  
    针对大数据离线分析类和交互式查询类负载,首先对这些负载的一些共性进行分析,提取出公共操作集,并对它们进行分组整理;然后在大数据平台上测试这些负载运行过程中的微体系结构特征,采用PCA和SimpleKMeans算法对这些体系结构特征参数进行降维和聚类处理。实验分析结果表明负载之间有公共的操作集,如Join和Cross Production;有些负载有相似的属性,如Difference和Projection共享相同的微体系结构特征。实验结果对于 处理器等硬件平台的设计以及应用程序的优化具有指导性的意义,并且为大数据基准测试平台的设计提供了参考。
    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(1)
    6. 互相关运算在银河飞腾DSP上的实现及优化
    杨琳,吴家铸,扈啸,田希
    计算机科学    2015, 42 (11): 53-55.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.009
    摘要 (81)   PDF (246KB) (221)  
    在信号处理领域中,互相关运算对于寻找未知信号中的特性具有重要的作用。互相关常被用于图像匹配、粒子图像测速等领域。针对互相关运算计算量大而实时系统中要求较快运算速度的问题,利用银河飞腾多核DSP(YHFT-QDSP)的FFT加速器完成二维FFT运算,在YHFT-QDSP上实现了互相关运算,从而提高了互相关运算在实时系统中的性能,并在此基础上针对输入数据大小的不同提出了若干优化的方法,进一步提高了互相关运算的性能。
    参考文献 | 相关文章 | 多维度评价
    7. 有限元网格积分算法在MIC众核平台上的并行实现
    寇大治,孔大力
    计算机科学    2015, 42 (11): 56-58.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.010
    摘要 (57)   PDF (340KB) (132)  
    基于英特尔集成众核(Many Integrated Core,MIC)架构,将有限元网格积分算法在至强融核(Xeon Phi)协处理器做了移植和性能分析。该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(offload)[1]下利用OpenMP在MIC上的线程并行化。计算性能测试结果显示集成众核平台可以有效地加速有限元网格积分算法:1)一块被充分利用的MIC设备卡(3115A)的计算能力超过两路16核Intel XeonTM E5-2670 CPU;2)MIC并发的物理线程可能由于公共缓存访问存在竞争而降低程序的扩展性。测试结果还显示了在多CPU多MIC平台上进一步移植完整的MPI并行有限元模拟软件的可行性。这项工作有助于推动与有限元网格相关的科学和工程高性能计算的研究。
    参考文献 | 相关文章 | 多维度评价
    8. OpenFlow网络数据流路径建立开销的量化分析
    吴洁,付斌章,陈明宇,张立新
    计算机科学    2015, 42 (11): 59-62.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.011
    摘要 (60)   PDF (351KB) (179)  
    OpenFlow采用数据平面与控制平面分离的架构,以软件实现的OpenFlow控制器作为控制平面对网络进行集中控制。在这种分离架构中,由于交换机需要与控制器进行交互,因此必然会产生一定的时间开销。经实验,数据流建立过程中的信息交互导致数据包传输时延至少增长2倍,严重降低了网络性能。因此,量化分析OpenFlow网络中流建立开销具有重要意义。分析流建立开销产生的原因,对导致数据包传输时延增长的影响因素进行量化分析。 评估流建立开销对网络性能的影响是量化分析数据流路径建立开销的重点。
    参考文献 | 相关文章 | 多维度评价
    9. 面向定制结构的稀疏矩阵分块方法
    邬贵明,王 淼,谢向辉,窦 勇,郭 松
    计算机科学    2015, 42 (11): 63-64.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.012
    摘要 (91)   PDF (494KB) (164)  
    稀疏矩阵向量乘是科学计算的核心问题,采用定制结构来加速稀疏矩阵向量乘的执行对提升科学计算性能具有重要意义。针对目前面向定制结构的稀疏矩阵分块方法和表示方法的缺点,提出了稀疏矩阵二维均匀分块方法和相应的表示方法嵌套分块CSR。实验结果表明,提出的稀疏矩阵分块方法和表示方法能够有效减少填零个数。
    参考文献 | 相关文章 | 多维度评价
    10. 基于树型结构的MapReduce并行模型
    唐兵,贺海武
    计算机科学    2015, 42 (11): 65-67.   https://doi.org/10.11896/j.issn.1002-137X.2015.11.013
    摘要 (98)   PDF (602KB) (179)  
    MapReduce是Google提出的一种分布式计算模型,已在海量数据处理领域得到了广泛的应用。提出一种基于树型结构的新型MapReduce并行模型。该模型适合于利用Internet或Intranet环境下不可靠的桌面PC资源进行海量科学数据分析。该模型以P2P的形式将计算节点进行组织,模型的底层采用了P2P-MPI框架,采用基于消息传递的模式来实现MapReduce应用层。在MapReduce应用层的实现中,在Map阶段采用广播的形式来分发数据块,在Reduce阶段建立反向二叉树来实现有效的结果合并和化简。将提出的MapReduce模型与现有主流MapReduce模型进行了比较,结果表明,基于树型结构的MapReduce并行模型在容错性能方面具有较优的性能,且系统简单,易于应用开发。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共19条记录