1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    计算机软件&体系架构 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 面向边缘计算的轻量级网络硬件加速设计
    余运俊, 张鹏飞, 龚汉城, 陈敏
    计算机科学    2023, 50 (11A): 220800045-7.   DOI: 10.11896/jsjkx.220800045
    摘要212)      PDF(pc) (2885KB)(159)    收藏
    随着边缘设备数据的增多和神经网络的不断落地应用,边缘计算为以云计算为核心的大数据技术分担了压力。现场可编程门阵列(FPGA)因灵活的体系结构和低功耗,在边缘计算以及构建神经网络加速器中显示出优异的特性。但是,传统的基于传统卷积算法的 FPGA 解决方案往往受到片上计算单元数量的限制。使用 Zynq 作为硬件加速平台,对参数进行定点量化,利用数组分区提高流水线运行速度。采用 Winograd 快速卷积算法对传统的卷积进行改进,将卷积运算中的乘法运算转换为加法运算,降低了模型的计算复杂度,极大提高了所设计的加速器的计算性能。实验表明,XC7Z035工作在150MHz时钟下获得了 43.5GOP/s 的性能,能效是 Xeon(R) Silver 4214R 的 129倍,是双核 ARM 的 159 倍。所提方案在资源和功耗受限的情况下可以提供较高的性能,适用于网络边缘端对轻量级神经网络的落地应用。
    参考文献 | 相关文章 | 多维度评价
    2. 基于智能体的舰船任务可靠度仿真系统设计
    文昊林, 狄鹏, 陈童
    计算机科学    2023, 50 (11A): 220800272-7.   DOI: 10.11896/jsjkx.220800272
    摘要217)      PDF(pc) (5228KB)(180)    收藏
    针对舰船任务期间保障资源配置对任务可靠度的复杂作用,利用智能体技术的自治性、反应性、社会性等优势解决任务可靠度建模中诸多复杂影响关系的建模和计算问题。通过模拟舰船任务流程、装备可靠性结构、故障及维修保障资源等要素的关联关系,实现了多要素、模块化、可灵活配置、易于使用的舰船任务可靠度仿真系统,能计算出多样化任务条件下的任务可靠度、保障资源配置数量等指标,可为舰船使用阶段的随舰保障资源优化配置以及研制阶段的舰船装备保障性设计等工作提供技术支撑。
    参考文献 | 相关文章 | 多维度评价
    3. 基于FT-M7002的复数域行向量矩阵乘法移植与优化
    莫尚丰, 周振芬, 胡勇华, 徐敏敏, 毛春献, 袁钰迪
    计算机科学    2023, 50 (11A): 220900277-6.   DOI: 10.11896/jsjkx.220900277
    摘要179)      PDF(pc) (3016KB)(140)    收藏
    FT-M7002是我国自主研发的高性能DSP,具有强大的向量处理能力。为有效地发挥它的性能优势,亟待优化移植面向FT-M7002的高效VSIP函数库。复数域行向量矩阵乘法是VSIP库中频繁使用的算法,在数字通信、图像处理等应用领域中大量使用。文中在FT-M7002 DSP上研究优化复数域行向量矩阵乘法算法,通过改变计算矩阵列向量为计算矩阵行向量、向量化、循环展开和软件流水等手段提升算法性能。测试结果表明:优化后的向量C算法相比VSIP库函数获得了6.2~20.6的加速比,汇编优化算法相比向量C算法获得了3.4~14.3的加速比,加速效果明显。
    参考文献 | 相关文章 | 多维度评价
    4. 异地高速互联环境下的海气耦合模式应用
    韩琦琦, 刘鑫
    计算机科学    2023, 50 (11A): 221000136-5.   DOI: 10.11896/jsjkx.221000136
    摘要226)      PDF(pc) (3023KB)(155)    收藏
    随着超级计算机的发展,大规模数值计算、大数据分析对算力基础设施的能力和数量的要求日益增长,受成本与功耗等因素的制约,单个超算中心不能无限制扩大规模,异地超算互联互通为解决这个问题提供了一种新的思路。文中基于济南至青岛10 Gbps DWDM光纤网络,搭建了济青跨地域500 km高速互联的计算集群,实现了两地计算资源的统一调度,利用海气耦合模式COAWST中的海洋分量模式ROMS和大气分量模式WRF进行了多组同地和异地不同资源规模和配置的对比实验。实验结果表明,耦合模式在异地高速互联环境下协同计算是可行的,WRF模式和ROMS模式在济南同地和济青异地运行同一算例的模拟结果相同,WRF模式在济南集群运行、ROMS模式在青岛集群运行时,运行时间比二者都在济南集群运行时增加5%,单分量模式拆分在济南集群和青岛集群协同计算时通信耗时较长,异地高速互联环境更适合有分量模块的耦合模式。
    参考文献 | 相关文章 | 多维度评价
    5. 基于SA-UCB算法的Android应用程序自动化测试方法
    王嬉, 赵春蕾, 步志亮, 杨艺
    计算机科学    2023, 50 (11A): 221200145-7.   DOI: 10.11896/jsjkx.221200145
    摘要146)      PDF(pc) (2557KB)(126)    收藏
    针对传统强化学习算法需要行为准则学习导致测试效率偏低这一问题,提出一种基于模型的Android应用程序自动化测试方法——SA-UCB。使用Sarsa算法对测试过程进行指导,采取Q表作为动作策略的选取参照。并针对经典Sarsa算法使用的ε-greedy策略随机性过强的问题,引入上界置信算法(the Upper Confidence Bound Algorithm,UCB算法)来平衡测试过程中的“探索-利用窘境”,从而对Sarsa算法进行改进,使动作决策更加分散化,并将其应用于Android自动化测试过程,提高了测试效率。将SA-UCB方法与其他5种测试方法从测试覆盖率、测试效率、故障检测3个方面进行了测试性能的对比实验,结果表明,在相同的实验条件下,SA-UCB策略在测试覆盖率和测试效率方面具有一定优势。
    参考文献 | 相关文章 | 多维度评价
    6. 一种基于流场物理信息的CFD网格密度优化方法
    刘江, 曾志勇
    计算机科学    2023, 50 (11A): 230200019-8.   DOI: 10.11896/jsjkx.230200019
    摘要157)      PDF(pc) (2964KB)(152)    收藏
    CFD计算网格的生成及优化技术是计算流体力学数值计算的关键技术之一,很大程度上决定了数值计算的最终精度及计算效率。CFD模拟实际工程问题所采用的网格规模可达千万级别,在给定的计算时间内获得更高的数值计算精度,是当前CFD急需发展的关键技术。已有研究表明,不同类型的流场误差产生的主要区域与其特征物理量的梯度正相关。有鉴于此,提出了一种基于流场物理信息的网格密度优化方法,使用该方法以及OpenFOAM与cfMesh工具对不可压缩流体案例、燃烧流案例和多相流案例分别进行数值计算。实验结果表明,对于具有不同特征的案例,基于所提方法优化的网格均能够在计算时长差别不大的情况下,比较明显地提升计算精度。
    参考文献 | 相关文章 | 多维度评价
    7. 一种基于变量隐藏抽象的IC3硬件验证算法
    杨柳, 范洪宇, 李东方, 贺飞
    计算机科学    2023, 50 (11A): 230200112-6.   DOI: 10.11896/jsjkx.230200112
    摘要203)      PDF(pc) (1769KB)(176)    收藏
    随着硬件设计复杂性和规模的大幅度提升,硬件验证工作更加具有挑战性。模型检验技术作为一种自动化验证技术,可以自动构建反例路径,也因此成为硬件验证领域内最重要的研究方向之一。IC3算法是近些年来最成功的比特级别的硬件验证算法。为了提高验证的规模和效率,硬件验证算法设计逐渐从底层的比特级向更高的抽象级别转变。研究目标是设计一个新型有效的字级IC3算法。针对研究目标,提出了一种将变量隐藏抽象和隐式抽象结合的字级IC3算法IC3VA。该方法尝试将变量隐藏抽象和IC3算法相结合,并设计了对应的泛化和精化方案。在开源社区和硬件验证大赛收集的测试集上和基于谓词抽象的方法进行对比,实验结果显示了基于变量隐藏抽象的IC3算法的有效性。
    参考文献 | 相关文章 | 多维度评价
    8. DSMC/PIC耦合模拟的大规模高效混合并行计算研究
    汪青松, 邱昊中, 林拥真, 杨富翔, 李洁, 王正华, 徐传福
    计算机科学    2023, 50 (11A): 230300146-9.   DOI: 10.11896/jsjkx.230300146
    摘要151)      PDF(pc) (4209KB)(159)    收藏
    DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负载均衡研究。首先设计了基于嵌套双重非结构网格的MPI并行算法,实现了集中式和分布式两种并行通信策略,支持粒子在任意并行进程间的动态迁移。然后提出了加权负载性能模型,设计了动态负载均衡算法及高效网格重映射机制,大幅提升了耦合模拟并行效率,进一步设计了MPI+OpenMP混合并行算法,有效降低了纯MPI并行计算中动态负载均衡的网格重剖分和通信开销。在北京北龙超级云HPC系统上,针对10亿粒子规模脉冲真空弧等离子体羽流开展了数千处理器核心DSMC/PIC耦合并行模拟,验证了并行算法和动态负载均衡的效果。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共8条记录