1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2012多值逻辑专栏 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 前导1预测算法的设计与实现
    李星,胡春媚,李勇,李振涛
    计算机科学    2013, 40 (4): 31-34.  
    摘要227)      PDF(pc) (389KB)(810)    收藏
    前导1预测(Leading One Prediction,LOP)算法常被用在浮点数的加减运算中,它能与尾数加法器并行工作,从而加快了尾数加法器计算结果的规格化过程,同时,这种方法会带来最多1位的误差。根据对误差的处理方式不同,将预测算法分成了3类,并详细介绍了其中的串行纠错前导1预测算法的具体结构,对其关键的组成部分在算法上进行了选择和优化。它与并行纠错LOP以及传统前导1检测(Leading One Detector,LOD)的逻辑综合的实验结果表明,该算法取得了面积、功耗和延时之间的较好均衡。在实际的应用中,该算法成功地运用在了工作频率为1GHz的三站式双通路(Two-Path)浮点加法器中。
    参考文献 | 相关文章 | 多维度评价
    2. 基于CORDIC算法的高精度浮点对称矩阵特征值分解的FPGA实现
    陈刚,陈旭,徐元,边昳,鲁华祥
    计算机科学    2013, 40 (5): 35-37.  
    摘要87)      PDF(pc) (211KB)(400)    收藏
    为了提高实对称矩阵特征值分解算法的速度,在FPGA上设计并实现了符合IEEE-754标准的单精度浮点(32-bit)CORDIC算法,以在保证运算精度的前提下,最大限度地优化资源和速度。整个设计是在Xilinx公司的Spartan-3xc3sd1800a-5FPGA上实现的。测试结果显示:1)对于3*3的实对称矩阵(每个矩阵元素是32-bit浮点数),精度达到2-20;2)设计实现的结构占用2467个 slices,占芯片总资源的14%,最高运行时钟频率达到154MHz。
    参考文献 | 相关文章 | 多维度评价
    3. 软件流水循环缓冲的设计与实现
    陈纪孝,李勇
    计算机科学    2013, 40 (4): 35-37.  
    摘要114)      PDF(pc) (275KB)(259)    收藏
    设计了一种软件流水循环缓冲,用于存储和派发循环体指令,减少执行循环程序时的访存次数,从而减少访存延迟对性能的影响。在详细研究软件流水和循环展开的基础上,完成了软件流水循环缓冲的设计。所设计的循环缓冲可以存储112条32位指令,用循环专用指令来控制循环程序的执行。对设计进行了模拟验证,并用Design Complier对设计进行了综合。
    参考文献 | 相关文章 | 多维度评价
    4. 基于MPI和CUDA的蛋白质定量软件的设计和分析
    詹 科,王 靖,袁 良,张云泉
    计算机科学    2013, 40 (3): 36-37.  
    摘要76)      PDF(pc) (224KB)(266)    收藏
    介绍了蛋白质定量软件的设计及测试结果,分析结果表明:P-QuantWiz软件在曙光600。的Intel集群部分,测试规模达到2048核,在256核加速比仍在增加。相对P-QuantWiz软件在单CPU运行的结果,PG-QuantWiz软件在单CPU运行的加速比为8.1,在16个GPU上运行的加速比为14.18,并行效率为89%。
    相关文章 | 多维度评价
    5. 一种周期性MapReduce作业的负载均衡策略
    傅 杰,都志辉
    计算机科学    2013, 40 (3): 38-40.  
    摘要77)      PDF(pc) (500KB)(270)    收藏
    MapReduce任务负载均衡主要是通过分区函数来实现的,Hadoop默认的分区函数并不能很好地保证reducer的负载均衡。针对周期性的业务处理提出了一种基于权重计算的负载均衡策略,周期性任务的数据分布与历史数据相比具有相似性。本策略根据历史数据运行的信息运算出数据权重信息(文中用权重表示每条记录的处理复杂 度),再通过Map阶段抽样分析当前这批数据的分布特征来预测待处理数据带权重的整体近似分布情况,从而指导Reduce分区,以保证其负载均衡。通过简单的例子仿真了整个策略的运作过程,并且对比了与TeraSor、思路的不同点。最后通过分析用户访问视频的日志证明了文中提到的策略比默认的策略性能提高了接近1倍。
    相关文章 | 多维度评价
    6. 自适应存储相关性预测器
    班冬松,颜世云,李礼,杨剑新,路冬冬
    计算机科学    2013, 40 (4): 38-40.  
    摘要85)      PDF(pc) (329KB)(346)    收藏
    访存指令的乱序执行会导致存储相关性冲突。存储相关性预测技术能够减少相关性冲突,提升处理器性能。已有学术研究工作普遍存在硬件开销大、实现复杂度高的不足;商业处理器中的存储相关性预测技术虽然实现简单,但又存在不具有自适应性或不利于利用指令并行性等问题。设计了一种简单、高效的存储相关性预测器SMDP,它具有自适应、易实现、充分利用指令并行性等优点。实验表明,SMDP能有效提高处理器性能,在与实际处理器接近的较小指令窗口配置下,与盲预测机制相比,平均性能提高0.7991%,最高可达4.9225%。
    参考文献 | 相关文章 | 多维度评价
    7. 基于MILS CORBA的多级安全分区通信机制
    崔西宁,王聪琳,裴庆祺,李亚晖,沈玉龙
    计算机科学    2013, 40 (5): 38-41.  
    摘要86)      PDF(pc) (357KB)(376)    收藏
    随着航空电子系统的飞速发展,机载操作系统对保证不同安全关键级别的软件互不影响越来越严格,面对这种情况,多重独立安全级别(MILS)嵌入式操作系统应运而生。MILS架构的中间件层采用实时CORBA技术。同时MILS CORBA架构采用分区通信机制进行通信。为了满足分区通信的安全性和MILS架构对分区密级的严格控制,设计了基于实时CORBA技术的MILS架构的多级安全分区通信机制。提出了将MILS IOP作为实时CORBA的一部分来实现MILS CORBA架构的多级安全分区通信的机制。整个机制保证了不同密级的数据安全独立的传输,同时也了保证系统的整体安全性。
    参考文献 | 相关文章 | 多维度评价
    8. 典型编译器自动向量化效果评估与分析
    李春江,黄娟娟,徐颖,杜云飞,陈娟
    计算机科学    2013, 40 (4): 41-46.  
    摘要97)      PDF(pc) (467KB)(620)    收藏
    SIMD(Single-Instruction-Multiple-Data)体系结构在现代处理器体系结构中扮演重要的角色。多种国产高性能通用处理器也大都实现了SIMD结构。SIMD体系结构提供了短向量数据并行处理能力,编译器自动向量化是应用程序获得性能提升的主要手段之一。使用成熟的支持SIMD的商用处理器平台评估典型编译器自动向量化的效果,对于处理器体系结构的设计以及编译器的分析和设计非常有益。采用SPECCPU2006和SPECOMPM2001基准测试程序,评估了典型编译器(包括Intel编译器、PGI编译器和GCC编译器)的自动向量化的效果。并且以产品级的开源编译器GCC为目标,用手工编写的程序片段(主要是多种类型的循环结构)评估了当前GCC编译器自动向量化的效果,并深入分析了GCC编译器中现有的自动向量化的能力和局限。此项工作为进一步研发高效的编译器自动向量化提供了有价值的参考。
    参考文献 | 相关文章 | 多维度评价
    9. 一个针对并行模拟引擎的性能评测实例
    吴志敏,吕慧伟,陈明宇
    计算机科学    2013, 40 (3): 41-45.  
    摘要76)      PDF(pc) (405KB)(260)    收藏
    SimK是由中科院计算所体系结构国家重点实验室开发的一个并行离散时间模拟引擎。基于已经发布的SimKl.0版本,对任务划分及同步推进阻塞控制进行了功能扩展,开发了SimK的1.1版本。同时由于缺乏一个专门对SimK模拟性能评测的Benchmark以及全面的评测结果,首先讨论了并行模拟引擎Benchmark的设计准则,之后介 绍了开发的Benchmark-PassBa11,并且使用它对SimK的强弱扩展性、组件负载不均衡情况下的强扩展性进行了评测,同时对比了组件负载不均衡和均衡情况下的加速比,探讨了模拟计算量的变化对模拟加速比的影响,并讨论了Benchmark的适用性。通过实验讨论得出:a) PassBa11可以作为并行模拟引擎SimK性能评测Benchmark,亦可用于其他并行模拟引擎性能的评测;b) SimK具有良好的强弱扩展性;c)负载平衡和模拟计算量都会对并行模拟加速比产生影响。
    相关文章 | 多维度评价
    10. 基于模糊逻辑的几类Kripke结构之间的关系
    潘海玉,张敏,陈仪香
    计算机科学    2013, 40 (5): 42-44.  
    摘要111)      PDF(pc) (208KB)(465)    收藏
    根据初始状态、状态之间的转换关系和命题赋值函数是否为分明的,模糊Kripke结构可分为8类。提出将模糊计算树逻辑作为判断模糊Kripke结构之间是否是等价的依据;详细讨论了8种模糊Kripke结构之间的关系。这些结论为设计应用中模型的合理选取提供了理论依据,也为解决模糊计算树逻辑的模型检测问题提供了一种新的方法。
    参考文献 | 相关文章 | 多维度评价
    11. 模糊规则组的谐调度
    冯定芸,于福生,王晓
    计算机科学    2013, 40 (5): 45-47.  
    摘要77)      PDF(pc) (225KB)(257)    收藏
    模糊规则库谐调性是规则库研究中的重要内容。在决定一组新来的模糊规则可否加入到已有规则库时,需要知道它对已有规则库的谐调程度。利用模糊关系方程理论和贴近度定义了模糊规则组之间的谐调度。实验表明此定义能很好地容纳相容规则并排除矛盾规则,这对于知识库的建立和维护是至关重要的。
    参考文献 | 相关文章 | 多维度评价
    12. 基于GPU的高性能稀疏矩阵向量乘及CG求解器优化
    王迎瑞,任江勇,田 荣
    计算机科学    2013, 40 (3): 46-49.  
    摘要126)      PDF(pc) (326KB)(947)    收藏
    以有限元/有限差分等为代表的一类数值方法,其总体矩阵常常具有“带状”、稀疏的特点。针对“带状”稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法“bDIA"。基于nVidia的GTX280系列GPU对其进行了测试,结果显示:与CUSP支持的5种常见稀疏矩阵存储格式和算法相比较,所提出的bDIA格式以及相应的spMV算法的单双精度浮点效率均可以提高1倍以上,并突破了该系列GPU在spMV计算时4%的单精度浮点效率上限和22.2%的双精度浮点效率上限;应用于共扼梯度(CG)与稳定双共扼梯度(BiCGStab)求解器,相对于DIA格式均有1.5倍左右的加速。
    相关文章 | 多维度评价
    13. 基于ibdump的InfiniBand网络拥塞控制观测方法研究
    曹光权,张子文,孙志刚,陈洪义,胥庆杰
    计算机科学    2013, 40 (4): 47-50.  
    摘要219)      PDF(pc) (359KB)(1319)    收藏
    在InfiniBand(IB)体系网络中,拥塞控制(Congestion Control,CC)能够确保高性能和资源利用率,避免拥塞传播对于无辜流的性能损害。首先分析IB网络采用的ECN(Explicit Congestion Notification)拥塞控制机制,然后提出一种集中控制的多点流量发生器CTBG(Central Traffic Behavior Generator),它提供了对流量的统计能力。为了进一步剖析IB网络拥塞控制的细粒度行为,提出了基于ibdump和wireshark的观测方法。实验表明,提出的测量机制能够细粒度、低开销地观测IB网络的拥塞控制行为,其对拥塞控制机制的研究具有重要的指导意义。
    参考文献 | 相关文章 | 多维度评价
    14. 命题逻辑公式中的冗余子句及冗余文字
    翟翠红,秦克云
    计算机科学    2013, 40 (5): 48-50.  
    摘要90)      PDF(pc) (196KB)(364)    收藏
    主要研究命题逻辑公式中的冗余子句和冗余文字。针对子句集中必需的、有用的、无用的子句,分别给出了一些等价描述方法,进而讨论子句集的无冗余等价子集。另外,得到了子句集中冗余文字的判别方法,借助可满足性给出了冗余子句的一种等价条件。上述结果为命题逻辑公式的化简奠定了一些理论基础。
    参考文献 | 相关文章 | 多维度评价
    15. 一种基于MapReduce的防火墙策略冲突并行化检测及消解模型
    肖 淇,秦云川,阳王东,李肯立
    计算机科学    2013, 40 (3): 50-54.  
    摘要63)      PDF(pc) (423KB)(338)    收藏
    防火墙在网络安全中起到很重要的作用,其中防火墙策略中的规则决定了网络数据包被“允许”或被“拒绝”进出网络。对于大型网络来说,由于规则太多,管理者很难保证其中不出现冲突,因此策略中规则冲突的检测及解决成为了保证网络安全的重要方面。提出了一种基于MapReduce模型的防火墙策略冲突检测解决算法,它对由基于规则的分段技术得到的片段进行自定义的排序,之后将其转化为规则的形式来代替原来的规则进行数据包的过滤。片段间两两不相交且匹配的包只执行一种动作,从而消除了冲突。
    相关文章 | 多维度评价
    16. AADL在中断控制系统建模中的应用
    任飞,谯婷婷,刘俊波,邵杨锋
    计算机科学    2013, 40 (5): 51-53.  
    摘要110)      PDF(pc) (326KB)(330)    收藏
    随着中断控制在嵌入式实时系统中的不断广泛应用,中断控制的可靠性是系统设计中面临的重要问题。虽然基于体系结构分析与设计语言(AADL)的形式化方法为这一问题的解决提供了思路,但AADL自身缺少 有效的元素和 方法来描述和建模中断。为此,提出一种结合AADL与中断控制器的中断控制系统设计方法,并运用GSPN可靠性计算模型对可靠性进行分析,从而为AADL在航电系统中的应用提供了思路。
    参考文献 | 相关文章 | 多维度评价
    17. Matrix DSP中多线程机制的研究与设计
    邓宇,孙永节,万江华
    计算机科学    2013, 40 (4): 51-54.  
    摘要68)      PDF(pc) (336KB)(280)    收藏
    深入研究了YHFT_Matrix高性能DSP中的一种多线程机制,重点介绍了其循环指令缓冲的读写机制、单线程与多线程之间的模式切换机制。在基于65nm工艺下,经过综合,代码面积、功耗都有减少,关键路径优化0.07ns。对程序的执行评估测试的分析结果表明:多线程工作模式相比单线程工作模式,其处理器性能IPC(Instructions Per Cycle)平均提高了9.64%。
    参考文献 | 相关文章 | 多维度评价
    18. 基于相似关系的社会集合论
    李金屏,黄艺美
    计算机科学    2013, 40 (5): 54-57.  
    摘要73)      PDF(pc) (290KB)(254)    收藏
    在利用经典相容关系研究人际关系的基础上,引入了人际关系中的模糊属性。利用截集的概念,研究了满足模糊相容关系即相似关系下的人际关系中社会交际圈的划分、成员活跃度和成员完成各项任务的代价等,并给出了相关算法和讨论。计算结果表明,该模型能够有效描述满足相似关系的社会关系网络。
    参考文献 | 相关文章 | 多维度评价
    19. Matrix编译器If转换算法的实现
    刘飞,陈跃跃,孙海燕,阳柳
    计算机科学    2013, 40 (4): 55-58.  
    摘要98)      PDF(pc) (419KB)(299)    收藏
    指令级并行在提高处理器运行速度方面显得越来越重要,if转换技术是一种在处理器支持条件执行的前提下,有助于提高指令级并行度的编译优化技术。在详细分析GCC(GNU Compiler Collection)内部if转换技术的实现机制和算法的基础上,针对matrix体系结构特点,对GCC中现有if转换算法进行了移植与改进,实现了matrix编译器的if转换算法。实验证明,改进后的if转换算法能够更有效地移除分支,减少基本块的数量,扩大单个基本块的范围,有助于编译器生成更加优化的代码。
    参考文献 | 相关文章 | 多维度评价
    20. 基于超算平台的公共Wi-Fi无线网络无痕信息获取与舆情分析系统研究
    杨 明,舒明雷,顾卫东,郭 强,周书旺
    计算机科学    2013, 40 (3): 55-58.  
    摘要73)      PDF(pc) (367KB)(265)    收藏
    提出一种利用国家超级计算济南中心的千万亿次计算平台对整个城市范围内的公共Wi-Fi无线网络进行信息获取和奥情分析的系统,它基于非介入式的无线数据包捕获技术、Web页面还原与容错修复技术、多种文本挖掘技术和海量数据处理技术,可对公共W i-Fi无线网络中的各种非法行为进行取证,对网络奥情进行准确分析和预测,可为相关部门的网络典论导向工作提供全面准确的参考。
    相关文章 | 多维度评价
    21. 大尺度图像编辑的泊松方程并行多重网格求解算法
    杜振龙,李晓丽,郭延文,杨小健,沈钢纲
    计算机科学    2013, 40 (3): 59-61.  
    摘要54)      PDF(pc) (304KB)(340)    收藏
    随着获取设备的发展,大尺度、高分辫率数字图像已逐步进入人们的生活,大尺度图像的梯度域编辑显得更为重要,求解大规模未知数的泊松方程是大尺度图像梯度域编辑的关键。传统多重网格算法的迭代、约束和插值操作单独进行,内存和外存间通讯量大,算法效率低,为此提出了一种面向大尺度图像梯度域编辑的并行多重网格求解泊松方程的算法。该算法利用多重网格的迭代、约束和插值过程的内存数据访问局部性和更新相关性,构造滑动工作窗口,使迭代、约束和插值操作并行运行,提高了多重网格算法求解泊松方程的计算效率。全景图拼接实验表明,所提算法的运行效率高于超松弛迭代、高斯塞德尔迭代和传统多重网格算法。
    相关文章 | 多维度评价
    22. 机群系统中空闲结点的功耗管理
    刘勇鹏,卢凯,迟万庆
    计算机科学    2013, 40 (4): 59-63.  
    摘要87)      PDF(pc) (529KB)(267)    收藏
    针对机群系统中存在的大量空闲活跃结点所造成的严重能耗浪费,提出空闲结点的cache 式动态功耗管理模型,即利用结点多级休眠机制,将空闲结点划分为不同休眠等级的结点集合,每级休眠状态对应一级结点储备cache,力求获得近似活跃状态的系统响应速率,以及近似最深休眠状态的能耗节省。基于cache式功耗管理模型,综合能耗与响应速率两个因素,设计了空闲结点在不同休眠状态之间的动态升降级算法、基于储备池的资源结点分配与回收算法以及储备额阈值自适应算法,以在保证系统响应速率的同时降低系统能耗。实验表明,提出的空闲结点cache式功耗管理技术在作业相对延迟仅增加0.99%的代价下,系统空闲结点功耗降低69.51%,优化效果显著。
    参考文献 | 相关文章 | 多维度评价
    23. 基于Fermi架构的Join算法
    李观钊,陈思桐,甄 真,陈 虎
    计算机科学    2013, 40 (3): 62-67.  
    摘要91)      PDF(pc) (554KB)(283)    收藏
    在列数据库中,连接操作依然是最核心和最耗时的操作,GPU强大的计算能力可为此提供新的优化手段。基于Fermi架构,提出了新的Hash Join算法和Sort merge Join算法,其基本思想是充分利用该架构新增的缓存结构来减少连接操作的cache缺失率。与CUDA stream技术相结合,新算法在输出结果较多时可以有效地隐藏主存与显存间数据传输带来的延迟,进一步提升其执行效率。实验结果证实了基于Fcrmi架构的Hash Join算法处理偏抖数据的高效性及Sort merge Join算法的稳定性,并且通过比较表明,这两种算法的性能全面优于基于多核CPU充分优化的Join算法,最大加速2.4倍,在外键分布高偏抖时新的Hash Join算法的执行速度甚至达到每秒217M元组。
    相关文章 | 多维度评价
    24. 一种基于内容的数据分发网络及算法
    朱昭萌,张功萱,张永平,郭箭,张巍
    计算机科学    2013, 40 (4): 64-68.  
    摘要66)      PDF(pc) (527KB)(270)    收藏
    物联网中通常需要对海量传感数据进行有目的的聚合和分发。设计中通常使用集中式的大规模存储系统管理海量物联数据,合适的数据分发机制对这样的存储系统必不可少。提出一种基于内容的数据分发网络设计。该设计可以和大规模存储中节点网络相结合,在保证存储过程不受影响的前提下收集空闲计算资源,高效完成基于内容的数据分发工作。受虚拟化思想的启发,设计引入“工作者”和“功能块”角色,通过动态调节每个节点上“工作者”的数量实现网络中节点的负载自动调节,同时通过动态装载或切换“功能块”实现不同任务之间计算资源的动态调配。还具体给出了一种基于布隆过滤器的分布式基于内容的数据分发算法。该算法分布于上述数据分发网络,同时通过使用布隆过滤器表示对象及其属性所满足的约束集合,消除了大量冗余计算,可以并行、高效地完成数据分发工作。
    参考文献 | 相关文章 | 多维度评价
    25. 面向骨干网NIDS的细粒度并行多模式匹配方法
    邵宗有,刘兴奎,刘新春,孙凝晖
    计算机科学    2013, 40 (3): 68-73.  
    摘要65)      PDF(pc) (614KB)(266)    收藏
    随着网络带宽的快速增长,互联网正面临着日益严重的安全威胁。网络入侵检测系统(KIDS)利用模式匹配等技术对网络报文进行分析和检测,是防范网络威胁、保护网络安全的一种有效手段。但模式匹配消耗巨大的计算量,现有的技术难以满足10Gbps以上骨干网络KIDS的需求。提出了基于B1oom filter的细粒度并行模式匹配技术PBPM(Parallel-B1oom-filter-based multi-Pattern Matching) , PBPM利用多个相同的B1oom filter分别从输入文本的不同位置处并行匹配,每个周期可完成多个字符的匹配,显著提高了匹配速率。详细讨论了在FPGA上的实现方式,在Snort 2.9规则集上的测试结果表明,PBPM能够提供超过20Gbps的模式匹配需求。
    相关文章 | 多维度评价
    26. 基于CUDA的SVM算法并行化研究
    张巍,张功萱,王永利,张永平,朱昭萌
    计算机科学    2013, 40 (4): 69-72.  
    摘要136)      PDF(pc) (653KB)(453)    收藏
    SVM算法在统计分类以及回归分析中得到了广泛的应用。而随着物联网的迅速发展,SVM算法在各种应用中往往需要解决大量数据的快速处理问题。在SVM算法并行化研究中,首先对SVM算法进行分析研究,提出了基于CUDA的SVM算法并行化方案;其次,进一步研究海量数据的处理,提出海量数据处理的并行化方案;最后,通过实验分析对比了并行化算法的性能。
    参考文献 | 相关文章 | 多维度评价
    27. 基于分布式存储的正则表达式匹配算法设计与实现
    李 璋,杜慧敏,张丽果
    计算机科学    2013, 40 (3): 74-76.  
    摘要104)      PDF(pc) (281KB)(373)    收藏
    深度包检测(Deep Packet Inspection, DPI)是一种先进的包过滤技术,广泛应用于防火墙中。基于正则表达式的模式匹配算法已成为实现DPI的重要方法之一,传统的正则表达式匹配算法的时间复杂度较高,不能实时进行网络安全的防护。为了提高正则表达式匹配算法的实时性,提出一种基于分布式存储的正则表达式匹配并行算法,该算法通过对数据进行步长计数,采用分布式存储,实现了并行处理。实验分析表明,与传统的串行算法相比,该算法匹配速度至少提高5倍,能够有效降低算法时间复杂度,提高匹配效率。
    相关文章 | 多维度评价
    28. 支持多集群数据并行的On-demand文件传输算法
    魏晓辉,周芹芹,李洪亮
    计算机科学    2013, 40 (3): 77-78.  
    摘要68)      PDF(pc) (258KB)(270)    收藏
    数据密集型应用通常需要在广域网分布式共享计算环境中高效地传输海量数据。并行处理中,大量的数据需要在生成集群、存储集群、处理集群间进行传输。针对该传输问题提出了一个支持多集群数据并行传输的按需文件传输算法(On-demand File Transfer),该算法以批量传输请求的整体完成时间最小为目的,根据集群内部快速传输的特点,实现目的端并行,分散单个节点的传输负载;在传输路径上,采用多重路径和多跳路径分割方法实现并行传输。对于批量传输请求,依据每个请求的传输负载,全局按需分配带宽,以解决传输路径的带宽冲突,从而充分利用当前网络带宽,快速传输批量传输请求。
    相关文章 | 多维度评价
    29. 基于OpenCL的均值平移算法在多个众核平台的性能优化研究
    庞 旭,张云泉,龙国平,贾海鹏,颜深根
    计算机科学    2013, 40 (3): 79-85.  
    摘要84)      PDF(pc) (931KB)(487)    收藏
    OpenCL作为一种面向多种平台、通用目的的编程标准,已经对许多应用程序进行了加速。由于平台硬件和软件环境的差异,通用的优化方法不一定在所有平台都有很好的加速。通过对均值平移算法在GPU和APU平台的优化,探讨了不同平台各种优化方法的贡献力,一方面研究各个平台的计算特性,另一方面体会不同优化方法的优劣,在优劣的相互转化中寻求最优的解决方案。实验表明,算法并行优化前、后在AVIV 5850,Tesla 02050和APU A6365。上分别达到了9.68, 5.74和1.27倍加速,并行相比串行程序达到79.73,93.88和2.22倍加速,前两个平台OpcnCL版本相比,CUVA版本的OpenCV程序达到1.27和1.24倍加速。
    相关文章 | 多维度评价
    30. DRR:一种多维案例检索优化算法研究
    汪璟玢,胡 烜
    计算机科学    2013, 40 (3): 86-88.  
    摘要80)      PDF(pc) (318KB)(263)    收藏
    基于本体的案例检索系统中,由于数据库中的案例数量随着时间的推移而成倍增加,案例检索的效率不断降低。提出了一种多维案例检索算法—DRR,该算法通过将多维空间案例点降维成二维空间点,利用一个二维空间点来代表类案例点组成的集合,并对此二维空间点建立R树空间索引,通过两级检索的方法,加速了检索效率和准确率。实验证明,该方法不仅提高了案例检索的准确率,还极大地提高了案例检索的效率。
    相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共43条记录