计算机科学

第49卷第10期目录

计算机科学. 2022, 49 (10): 0-0.

摘要 ( 364 )

PDF(4823KB) ( 677 )

相关文章 | 多维度评价

面向Lustre集群存储的错误日志分析及系统优化

程稳, 李焱, 曾令仿, 王芳, 唐士程, 杨力平, 冯丹, 曾文君

计算机科学. 2022, 49 (10): 1-9. doi:10.11896/jsjkx.220100134

摘要 ( 570 )

PDF(2684KB) ( 3251 )

参考文献 | 相关文章 | 多维度评价

集群存储系统的错误日志信息有助于优化存储系统的可用性和稳定性。现有存储系统错误探究主要针对单机存储系统或集群存储系统的部分功能进行分析评估,缺乏在实际应用场景下,同一生产环境中,长时间、多视角的探究工作。新型功能模块的不断融入,使得集群存储系统日益庞杂,集群存储系统自身引发的错误层出不穷,给各类研发人员带来了困扰与挑战。针对以上问题,提出了面向Lustre集群存储的错误日志分析及系统优化策略,通过收集连续1 673天的错误日志,研究了近2.26 GB的Lustre错误日志,分析了多个版本Lustre错误的特点与问题,揭示了集群存储系统各方面的不足与错误,研究了不同Lustre版本错误的影响因素,总结了Lustre集群在实际生产环境中的常见错误,并给出了相应的解决方案。对Lustre系统研发有了许多新的见解,并总结了14个发现,最后通过采集333天的新增错误记录对14个发现进行了相关验证,给出了一些系统错误优化实例。相关测试表明,优化实例可以显著减少错误数量,提高系统的可用性和稳定性,研究结果和建议对集群存储系统本身的发展以及集群存储系统的运行和维护都有一定的参考价值。

基于ARM的图像几何变换算法库实现和优化技术研究

王麓涵, 贾海鹏, 张云泉, 张广婷

计算机科学. 2022, 49 (10): 10-17. doi:10.11896/jsjkx.220100128

摘要 ( 564 )

PDF(4816KB) ( 3291 )

参考文献 | 相关文章 | 多维度评价

高性能原语基础算法库(Intel Integrated Performance Primitives,Intel IPP)是面向信号、图像处理领域的高性能多媒体加速库。然而,截至目前,暂时没有基于ARM架构的高性能IPP库。文中针对镜像变换、重映射、仿射、透视变换等基础图像几何变换算法,实现了一个基于ARM计算平台的高性能算法库PerfIPP,并通过SIMD汇编优化、内存对齐、数据预计算、高性能矩阵转置等优化技术,显著提升了上述算法的性能。同时,通过对比不同指令组合、不同指令排列、不同取数存储方式等所带来的性能差异,总结图像几何变换算法在ARM计算平台上实现与优化的关键技术。实验结果表明,在华为鲲鹏920平台上,相比开源计算机视觉库OpenCV,PerfIPP在满足精度要求的同时,在上述基础图像几何变换上获得了108.08%~435.5%的性能提升,并达到了在英特尔至强E5-2640处理器上Intel IPP库平均性能的83.79%。

基于神经网络模型的stencil循环最优分块大小预测

包怡坤, 张鹏, 徐小文, 莫则尧

计算机科学. 2022, 49 (10): 18-26. doi:10.11896/jsjkx.220100147

摘要 ( 582 )

PDF(3004KB) ( 3199 )

参考文献 | 相关文章 | 多维度评价

stencil循环是科学与工程计算应用中最主要的计算核心之一。循环分块技术可有效改善stencil循环的数据局部性,提高计算并行度。分块的大小选择对stencil循环的性能影响很大,传统的分块大小选择方法通常在时间开销、人工成本、分块选择精度等方面存在短板,实用性较差。文中提出了一种基于人工神经网络的分块大小选择方法,用于预测三维Jacobi型stencil循环程序的最优分块。对来源于实际数值模拟软件中的11个stencil循环进行最优分块预测,实验结果显示,在单核串行和多核并行两种场景下,程序使用模型预测分块相比不分块的性能提升分别为2%和35%,与网格搜索方法的分块性能相当,但在线预测时间开销仅约为后者的1/30 000。此外,相比基于静态分析的Turbo-tiling方法,预测最优分块的实测性能平均提升了约9%。

面向飞腾处理器的多线程可复现DGEMV设计与实现

陈磊, 唐滔, 漆海俊, 姜浩, 何康

计算机科学. 2022, 49 (10): 27-35. doi:10.11896/jsjkx.220100125

摘要 ( 610 )

PDF(2069KB) ( 3119 )

参考文献 | 相关文章 | 多维度评价

在高性能计算中,求解大规模、大尺度、长时程和病态问题过程中舍入误差的累计都可能会使算法的最终数值结果失真。在不同的计算软硬件资源下,每次运行的结果可能不一致,而这些结果是开发者调试程序和正确性检查的重要依据,会对科研工作的顺利进行造成干扰,因此算法数值结果的可复现性变得至关重要。文中面向飞腾处理器,基于OpenBLAS 软件框架,结合美国伯克利国家实验室的Demmel教授团队开发的ReproBLAS软件中提出的可复现的方法与Castado提出的多层分块技术,使用舍入误差分析和无误差变换等技术,设计出了多线程可复现DGEMV的算法。数值实验显示,所提算法实现了数值计算的可复现性,且输出结果与ReproBLAS相同,验证了所提算法的可靠性。同时,所提算法在相同的测试环境下运行速度至少是ReproBLAS实现算法运行速度的2倍。此外,还将所提算法与日本理化研究所Mukunoki提出的OzBLAS中的可复现DGEMV函数进行对比,同为单线程时该算法的运行速度至少是OzBLAS算法的20倍,在相同多线程数量情况下,该算法的运行速度至少是OzBLAS算法的9倍。理论分析和数值实验均表明,该改进算法比国际上现有的可复现数值算法性能更优。

基于“AI+HPC”的第一原理计算时间预测及其在社区平台中的应用

李治莹, 马硕, 周超, 马英晋, 刘倩, 金钟

计算机科学. 2022, 49 (10): 36-43. doi:10.11896/jsjkx.220100129

摘要 ( 781 )

PDF(3636KB) ( 2929 )

参考文献 | 相关文章 | 多维度评价

密度泛函方法在常用的第一原理计算方法中有着计算标度低、计算精度高的特点,因此其在化学、生物、医药等领域得到了越来越广泛的应用。然而,在实际应用中,其较为高昂的计算代价对用户计算参数的决策以及计算中心的作业分配都提出了新的挑战。近期开发的基于机器学习的密度泛函计算时间预测系统,能够在算前预测实际的计算开销,预测结果的平均相对误差一般小于0.15,符合实际计算场景下的预测精度要求。文中进一步推进和完善了该预测系统,提供了多GPU并行计算功能、机器学习模型的模块化增补;将其与生物医药社区相结合,实现了对平台计算任务的实时机时显示,方便用户统筹;并基于此开发了智能负载均衡模块,可以提高超大分子及团簇体系的第一性原理并行计算效率。通过多个方面的推进,改善了预测系统的实用性,并在社区平台和并行计算方面得到了初步应用。

基于多面体模型的矩阵乘法向量代码生成

王博漾, 庞建民, 徐金龙, 赵捷, 陶小涵, 朱雨

计算机科学. 2022, 49 (10): 44-51. doi:10.11896/jsjkx.210800247

摘要 ( 559 )

PDF(3412KB) ( 3107 )

参考文献 | 相关文章 | 多维度评价

矩阵乘法是众多科学计算的核心,而向量化编程是提升其性能的主要手段之一。针对现有的向量化优化往往存在需要手工进行调优以及与硬件结构映射的问题,基于多面体编译器PPCG,在多面体模型中引入向量代码生成框架,提出了基于多面体模型的矩阵乘法向量代码生成框架。通过对矩阵乘法的向量化方案进行收益分析来确定向量化方案,指导应用框架的代码生成,基于该代码生成框架,有利于矩阵乘法的向量化快速优化。选取13个规模在64×64×64到1 024×1 024×1 024之间的矩阵乘法用例进行实验,结果表明,该框架能够正确生成向量化代码,与基础编译器ICC的自动向量化功能相比,应用该框架生成的向量化代码最高获得了5.09倍的加速和3.39倍的平均加速。

一种面向申威26010处理器的分布式传递锁机制

李明亮, 庞建民, 岳峰

计算机科学. 2022, 49 (10): 52-58. doi:10.11896/jsjkx.210800091

摘要 ( 322 )

PDF(2412KB) ( 3063 )

参考文献 | 相关文章 | 多维度评价

在并行程序中,互斥锁通常被用来避免访问共享资源时发生冲突。申威26010处理器是“神威·太湖之光”超级计算机采用的异构众核处理器,众核之间并无硬件互斥锁机制。其开发人员基于原子操作实现了一种软件互斥锁,但是该软件锁在激烈锁竞争情况下会产生大量的锁操作开销,影响了并行程序的性能。针对这一问题,提出了一种分布式传递锁机制HDT-LOCK。首先,提出并实现了基于众核上便签存储器和主存的混合分布锁来避免访存拥塞;其次,设计了基于寄存器通信和单指令多数据指令(Single-instruction Multiple-data Instruction)的锁传递机制,以进一步提高HDT-LOCK机制的吞吐量。实验结果表明,与原锁机制相比,所提HDT-LOCK机制避免了访存拥塞,并且可扩展性更佳。此外,锁传递机制使HDT-LOCK的吞吐量提升最高可达5.6倍。

ARM架构云服务器的CPU功耗模型研究

金育妍, 余天豪, 王松波, 林伟伟, 潘宇聪

计算机科学. 2022, 49 (10): 59-65. doi:10.11896/jsjkx.210800103

摘要 ( 577 )

PDF(2200KB) ( 3008 )

参考文献 | 相关文章 | 多维度评价

云服务器的功耗模型是云数据中心能耗优化研究的重要内容之一。CPU功耗模型是云服务器功耗模型的重要组成部分,然而现有CPU功耗模型没有考虑CPU的异构性,如缺乏对ARM架构服务器CPU功耗模型的研究。在调研分析现有的ARM架构CPU功耗模型的基础上,提出了一种面向ARM架构的新CPU功耗模型——基于混合建模的CPU功耗模型(Hybrid Based Model,HBM)。该功耗模型综合考虑了CPU利用率和CPU性能事件等建模特征,相比现有的测算精度很高的基于性能计数器的CPU功耗模型,HBM的测算精度与其相近且模型训练成本更低,更适合ARM服务器的CPU功耗建模。文中使用Sysbench负载工具对所提HBM进行实验验证,实验结果表明,HBM的平均相对误差(MRE)在1%以内,具有良好的测算精度。此外,还针对x86和ARM架构服务器进行了交叉实验,实验结果表明不同架构服务器的CPU功耗行为相异,应当使用不同的CPU功耗建模方法。

基于新一代神威超算的计算流体力学Palabos软件的并行优化

柳安军, 殷洪辉, 王利, 刘智翔, 孔博, 郭猛, 陈成敏, 杨美红

计算机科学. 2022, 49 (10): 66-73. doi:10.11896/jsjkx.220100089

摘要 ( 1159 )

PDF(2735KB) ( 3235 )

参考文献 | 相关文章 | 多维度评价

Palabos软件是一款基于格子玻尔兹曼算法(Lattice Boltzmann Method,LBM)的计算流体力学软件,因其优异的计算能力被广泛用于多孔介质、自由界面、颗粒运动、血液流动等计算流体力学领域。Palabos软件广泛的用户需求使其迫切需要在神威超算上进行移植优化和并行加速,服务于能源、化工行业。文中在新一代神威超算(SW26010pro)上对Palabos软件进行异构并行设计,针对Palabos的数据结构和模块化编程不利于神威众核编程的问题,通过直接取址,设置字段标记处理多态导致的分支、数据切片处理等优化思路;并结合新一代神威超算的特性,使用共享内存和寄存器通信的优化技术,实现众核加速2~6倍。同时实现Palabos软件在新一代神威超算上的复杂化工过程多尺度计算方向上两相流算法的百万核心规模的并行计算,以6.4万核心的并行计算规模为基准,百万核心的并行效率大于40%。

基于FPGA的高性能可扩展SM4-GCM算法实现

翟嘉琪, 李斌, 周清雷, 陈晓杰

计算机科学. 2022, 49 (10): 74-82. doi:10.11896/jsjkx.210900137

摘要 ( 576 )

PDF(3407KB) ( 3345 )

参考文献 | 相关文章 | 多维度评价

在大数据和5G技术蓬勃发展的背景下,高速通信系统中的信息加密成为了新的研究热点,如何在保证数据高安全性的同时,提高数据吞吐率,降低加密算法适配不同应用场景的难度成为了重要的研究课题。针对传统软件实现的SM4-GCM算法吞吐率小、难以在多变的5G及大数据场景下应用的问题,文中基于FPGA可重构的特点,深入剖析SM4-GCM算法的特征,利用Mastrovito算法、Karatsuba算法、快速求余算法,设计了两种高性能、数控分离、可扩展的电路结构,分别采用全流水线技术和四度并行技术对SM4-GCM算法进行加速优化,在保证高安全性的同时,达到了较高吞吐率,并且可灵活移植于各种应用场景。实验结果表明,所提出的两种方案中的单个SM4-GCM模块的吞吐率分别达到了28.16 Gbps和28.8 Gbps,在性能、可扩展性等方面均优于同类已发表的设计。

知识追踪研究进展

陈之彧, 单志龙

计算机科学. 2022, 49 (10): 83-95. doi:10.11896/jsjkx.211000119

摘要 ( 392 )

PDF(2019KB) ( 1228 )

参考文献 | 相关文章 | 多维度评价

教育数据挖掘是计算机科学、统计学与教育学的交叉学科,主要通过计算机科学与统计学的理论和技术处理教育研究与教学实践的问题,比如在获得最大学习增益的情况下尽可能降低学生的学习成本和教师的教育成本。迅速发展的计算机辅助教育环境和在线教育平台产生了丰富的数据,当然也带来了挑战,无法针对性地为学生提供特定需求的资源。知识追踪是智能辅导教育领域对学生进行教学资源推荐和学习路径诊断的个性化方法,随着时间的推移,对学生的知识状态进行建模,从而根据学生的历史响应序列,预测学生未来的表现。重点从具有可解释性的训练过程、具备高精度的预测结果两方面对知识追踪进行相关文献的分析,并且介绍了该领域常见的数据集、评价指标和应用。最后,对知识追踪领域的挑战进行了展望。

基于同源控制点的边缘绑定方法

刘梦欣, 张凡, 李天瑞

计算机科学. 2022, 49 (10): 96-102. doi:10.11896/jsjkx.220300066

摘要 ( 289 )

PDF(2156KB) ( 734 )

参考文献 | 相关文章 | 多维度评价

对含有大量复杂连接关系的节点连接图进行可视化会造成视觉上的严重混乱,边缘绑定是一种有效降低视觉混乱的方法。以往基于空间邻近性进行边缘绑定的方法会导致独立边缘产生模糊性歧义,给予用户错误的认知,而只专注于图的拓扑结构无法有效解决密集连接造成的视觉干扰问题。基于边缘路径的方法能够较好地利用图中原始节点信息对边缘进行控制绑定,从而避免独立边缘产生模糊性歧义,同时展现数据的高级模式。因此,在边缘路径方法的基础上进行了改进,提出了一种基于同源控制点的边缘绑定方法。该方法结合图的拓扑结构信息计算同源控制点,并以此为基础利用最短路径算法选取边缘控制点,然后结合分级思想对边缘聚合程度进行优化,最后通过Bézier曲线对边缘进行平滑处理。将基于同源控制点的边缘绑定方法用于美国迁移数据集和中国铁路线路数据集中,实验结果表明,该方法在改善过度绑定的问题上起到了较好的效果,相比原方法,此方法保留了更多局部数据细节,平衡了整体与局部边缘的绑定程度,可以有效地用于复杂连接图的可视化。

一种基于局部随机游走的标签传播算法

刘扬, 郑文萍, 张川, 王文剑

计算机科学. 2022, 49 (10): 103-110. doi:10.11896/jsjkx.220400145

摘要 ( 468 )

PDF(4471KB) ( 829 )

参考文献 | 相关文章 | 多维度评价

社区结构是复杂网络的重要特征之一,识别网络中不同功能的社区对理解复杂网络特性具有重要作用。基于标签传播的社区发现算法通常以节点的直接邻居作为邻域更新标签,可能无法准确发现社区结构或导致得到的社区划分结果不稳定。针对此问题,提出了一种基于局部随机游走的标签传播算法(Local Random Walk Based Label Propagation Algorithm,LRW-LPA),利用节点的k步邻域内局部重要性指标选择重要性最低的节点作为起始节点,进行带重启的局部随机游走以确定起始节点的局部邻域;选择此局部邻域范围内出现次数最多且影响值最大的标签来更新起始节点标签。LRW-LPA采用带重启的局部随机游走过程能更准确地确定节点的合适邻域范围,提高了算法的稳定性。与LPA,BGLL,Infomap,Leiden,Walktrap等经典社区发现算法在12个真实网络和12个人工构造网络上的比较实验表明,LRW-LPA算法在标准互信息(NMI)、调整兰德系数(ARI)和模块度(Q)等方面表现良好。

基于全局属性注意力神经过程模型的数据补全研究

程恺, 刘满, 王之腾, 毛绍臣, 申秋慧, 张宏军

计算机科学. 2022, 49 (10): 111-117. doi:10.11896/jsjkx.210800038

摘要 ( 342 )

PDF(3887KB) ( 674 )

参考文献 | 相关文章 | 多维度评价

注意力神经过程(Attentive Neural Process,ANP)模型采用生成模型的方法,以样本的任意局部上下文点为输入,输出整个样本的分布函数,从而模仿高斯过程回归完成数据补全任务。样本的属性信息可以为样本的生成提供重要信息,然而ANP模型忽略了对属性信息的使用。受条件变分自动编码机(CVAE)模型以标签为条件控制样本生成的启发,文中提出了全局属性注意力神经过程(Global-attribute Attentive Neural Process,GANP),将样本属性嵌入到编码器网络,从而使浅层变量隐含样本属性信息。同时,在解码器网络中加入样本属性作为特征,使模型的生成样本更为准确,特别是当输入上下文点数量稀少时,属性信息能够帮助模型生成更清晰、准确的样本。最后,从定性和定量两个方面证明了GANP性能的优越性,可以看出该模型扩展了NP家族模型的应用范围,从而更灵活、快速、准确地解决只有部分上下文信息时整个样本的数据补全问题。

自适应分组融合改进算数优化算法及应用

刘成汉, 何庆

计算机科学. 2022, 49 (10): 118-125. doi:10.11896/jsjkx.210800008

摘要 ( 378 )

PDF(2549KB) ( 765 )

参考文献 | 相关文章 | 多维度评价

针对算数优化算法(Arithmetic Optimization Algorithm,AOA)寻优速度慢、精度低和易受局部极值点影响的问题,提出了一种自适应分组融合改进算数优化算法(Adaptive Grouping Fusion Improved Arithmetic Optimization Algorithm,AG-AOA)。首先,采用Halton序列初始化个体位置,提高迭代初期算法的多样性;然后,引入自适应分组策略对种群进行分组操作,根据适应度值大小把个体自适应分为优势组、均势组和劣势组;最后,对各组个体分别采用教与学优化策略、精英反向学习策略和振荡扰动算子进行位置更新,以提高AOA的搜索能力,减小局部极值点对算法的影响。通过包含各种复杂程度的测试函数对AG-AOA的性能进行验证,包括基准测试函数、统计显著性的Wilcoxon秩和检验以及部分CEC2014测试函数。将AG-AOA应用于两个实际工程优化问题,并将所得结果与其他元启发式算法进行了比较和分析,验证了AG-AOA的优越性。

基于注意力机制交互卷积神经网络的推荐方法

任胜兰, 郭慧娟, 黄文豪, 汤志宏, 亓慧

计算机科学. 2022, 49 (10): 126-131. doi:10.11896/jsjkx.220700064

摘要 ( 768 )

PDF(2258KB) ( 792 )

参考文献 | 相关文章 | 多维度评价

为了捕捉在线购物时用户与商品之间的动态交互关系,提高推荐系统(RS)的准确度,提出了结合用户倾向性和商品吸引力的用户评价预测方法。首先,将评论分为用户评论文本和商品评论文本,分别输入两个交互卷积神经网络(CNN),并结合注意力机制,动态捕捉文本中的语义信息和上下文信息,得到用户和商品的自适应特征;然后,利用交互注意力网络,分析商品特征和用户特征的动态交互关系,计算出用户对特定商品的倾向性和商品对特定用户的吸引力;最后,通过预测模块提供用户对商品的准确评价预测。在数据集上进行实验,结果表明,所提方法取得了最优性能,比其他方法的MAE和RMSE性能分别至少提升了15.1%和13.6%。此外,基于Top-K的统计指标进一步验证了所提方法的商品推荐精准度。

基于温度以及运行数据的电缆接头绝缘劣化状态预测

徐四勤, 黄向前, 杨昆, 张占龙, 甘鹏飞

计算机科学. 2022, 49 (10): 132-137. doi:10.11896/jsjkx.210900139

摘要 ( 388 )

PDF(3635KB) ( 716 )

参考文献 | 相关文章 | 多维度评价

电缆接头绝缘劣化会导致热损耗的增加进而引起接头表面温度上升,同时表面温度受到运行负荷、环境温度等多方面因素的影响,总体上劣化程度与温度数据表现出非线性分布的情况。为此,提出了基于改进麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA)优化的核极限学习机(Kernel Based Extreme Learning Machine,KELM)的电缆接头绝缘劣化程度预测方法。首先通过实验来验证电缆接头多物理耦合模型的计算准确性,并通过耦合计算模型来获取不同劣化程度、载荷和环境温度下的电缆接头表面温度分布,用于构建训练集、验证集和测试集。其次基于鸟群算法(Bird Swarm Algorithm,BSA)中飞行行为的思想优化麻雀搜索算法,保证了全局收敛又不失种群多样性,有效跳出局部最优。然后通过ISSA算法对KELM的惩罚系数C和核函数σ进行优化,得到绝缘劣化状态预测模型。研究结果表明,改进麻雀算法优化的核极限学习机(ISSA-KELM)的预测效果明显优于其他模型。

面向复杂场景的行人重识别综述

张敏, 余增, 韩云星, 李天瑞

计算机科学. 2022, 49 (10): 138-150. doi:10.11896/jsjkx.211200207

摘要 ( 1228 )

PDF(3098KB) ( 1962 )

参考文献 | 相关文章 | 多维度评价

行人重识别(Person Re-Identification,简称Re-ID)旨在研究多个不相交摄像头间特定行人的匹配问题。文中首次以复杂场景中需要克服的挑战为行人重识别论文的分类依据,将2010-2021年期间发表的研究成果分为7类,即姿势问题、遮挡问题、照明问题、视角问题、背景问题、分辨率问题以及开放性问题,该分类方式有利于研究人员从实际需求出发,根据要解决的问题找到相应的解决方案。首先回顾行人重识别的研究背景、意义及研究现状,总结当前主流的行人重识别框架,统计了2013年以来发表在三大计算机视觉顶级会议CVPR,ICCV以及ECCV的论文情况和国家基金项目中Re-ID的相关项目情况;其次就复杂场景中面临的七大挑战,分别从问题成因和解决方案两方面对现有文献展开分析,归纳总结出处理各类挑战的主流方法;然后给出了行人重识别研究中泛化性较高的方法,并列举了当前行人重识别研究的难点;最后讨论了行人重识别未来的发展趋势。

基于空间和多层级联合编码的图像描述算法

方仲俊, 张静, 李冬冬

计算机科学. 2022, 49 (10): 151-158. doi:10.11896/jsjkx.210900159

摘要 ( 676 )

PDF(2444KB) ( 766 )

参考文献 | 相关文章 | 多维度评价

图像描述是图像理解领域的热点研究课题之一,它是结合计算机视觉和自然语言处理的跨媒体数据分析任务,通过理解图像内容并生成语义和语法都正确的句子来描述图像。现有的图像描述方法多采用编码器-解码器模型,该类方法在提取图像中的视觉对象特征时大多忽略了视觉对象之间的相对位置关系,但它对于正确描述图像的内容是非常重要的。基于此,提出了基于Transformer的空间和多层级联合编码的图像描述方法。为了更好地利用图像中所包含的对象的位置信息,提出了视觉对象的空间编码机制,将各个视觉对象独立的空间关系转换为视觉对象间的相对空间关系,以此来帮助模型识别各个视觉对象间的相对位置关系。同时,在视觉对象的编码阶段,顶部的编码特征保留了更多的贴合图像语义信息,但丢失了图像部分视觉信息,考虑到这一点,文中提出了多层级联合编码机制,通过整合各个浅层的编码层所包含的图像特征信息来完善顶部编码层所蕴含的语义的信息,从而获取到更丰富的贴合图像的语义信息的编码特征。文中在MSCOCO数据集上使用多种评估指标(BLEU,METEOR,ROUGE-L和 CIDEr等)对提出的图像描述方法进行评估,并通过消融实验证明了提出的基于空间的编码机制以及多层级联合编码机制能够辅助产生更为准确有效的图像描述语句。对比实验结果表明,所提方法能够产生准确、有效的图像描述并优于大多数最新的算法。

一种鲁棒的双教师自监督蒸馏哈希学习方法

苗壮, 王亚鹏, 李阳, 王家宝, 张睿, 赵昕昕

计算机科学. 2022, 49 (10): 159-168. doi:10.11896/jsjkx.210800050

摘要 ( 3498 )

PDF(4472KB) ( 15712 )

参考文献 | 相关文章 | 多维度评价

为了提高无监督哈希学习的性能,实现鲁棒的哈希图像检索,提出了一种鲁棒的双教师自监督蒸馏哈希学习方法。该方法包括自监督双教师学习和鲁棒哈希学习两个阶段:第一阶段设计了一种改进的聚类算法,有效提高了硬伪标签的标注精度,而后通过微调教师网络得到了图像的初始软伪标签;第二阶段提出了一种结合混合去噪和双教师共识去噪策略的软伪标签去噪方法,有效去除了初始软伪标签中的噪声,而后利用蒸馏学习将双教师网络中的信息通过去噪软伪标签传递给学生网络,进而获得无标签图像的鲁棒哈希码。在CIFAR-10,FLICKR25K和EuroSAT上进行了实验,实验结果表明,与TBH方法相比,在CIFAR-10上所提方法的MAP平均提高了18.6%;与DistillHash方法相比,在FLICKR25K上所提方法的MAP平均提高了2.4%;与ETE-GAN方法相比,在EuroSAT上所提方法的MAP平均提高了18.5%。

基于多阶段多生成对抗网络的互学习知识蒸馏方法

黄仲浩, 杨兴耀, 于炯, 郭亮, 李想

计算机科学. 2022, 49 (10): 169-175. doi:10.11896/jsjkx.210800250

摘要 ( 718 )

PDF(2029KB) ( 1188 )

参考文献 | 相关文章 | 多维度评价

针对传统的知识蒸馏方法在图像分类任务中对知识蒸馏的效率不高、阶段训练方式单一、训练过程复杂且难收敛的问题,设计了一种基于多阶段多生成对抗网络(MS-MGANs)的互学习知识蒸馏方法。首先,将整个训练过程划分为多个阶段,得到不同阶段的老师模型,用于逐步指导学生模型,获得更好的精度效果;其次,引入逐层贪婪策略取代传统的端到端训练模式,通过基于卷积块的逐层训练来减少每阶段迭代过程中需优化的参数量,进一步提高模型蒸馏效率;最后,在知识蒸馏框架中引入生成对抗结构,使用老师模型作为特征辨别器,使用学生模型作为特征生成器,促使学生模型在不断模仿老师模型的过程中更好地接近甚至超越老师模型的性能。在多个公开的图像分类数据集上对所提方法和其他流行的知识蒸馏方法进行对比实验,实验结果表明所提知识蒸馏方法具有更好的图像分类性能。

基于人眼双目视觉的3D深度运动感知特性研究

路平, 张地, 肖俊峰, 毕科

计算机科学. 2022, 49 (10): 176-182. doi:10.11896/jsjkx.220500265

摘要 ( 573 )

PDF(2493KB) ( 1077 )

参考文献 | 相关文章 | 多维度评价

获取立体视觉信息是人们感知世界的基本能力之一,其中运动立体视觉信息的获取不仅是生物视觉系统在动态世界中生存的关键能力,也是人工视觉系统高效处理立体视频的重要手段。为了设计出贴合人眼视觉特性的3D深度运动感知模型,需要明确挖掘人类对立体运动感知的显著特征后再设计主观实验。文中根据单目和双目线索设计了立体运动视觉刺激视频,并采用控制变量的方法,分别探究了目标球体运动速度、参考球体旋转半径及被试正确感知的相互关系,并分析了目标运动方向与被试感知方向之间的关系。首先对实验条件进行探究,结果发现目标与参考的相对距离越小拦截成功率越高,该结果表明目标同参考之间的相对位置关系会影响被试的感知正确性。其次,采用了拦截成功百分比和感知偏差两个行为测量标准对被试感知能力进行分析,结果发现相比横向运动,深度运动正确感知的成功率超出约42.67%~47.01%。这表明不同运动方位的感知不对称,且深度运动带来的视觉刺激更明显。该研究探索了人类对运动感知的显著特征,并为后续设计3D运动感知模型提供了一种新的判断模型感知效果的主观对比标准,使原有立体感知能力的指标更加细化。

面向轻量化医学图像分割网络的神经结构搜索

张福昌, 仲国强, 毛玉旭

计算机科学. 2022, 49 (10): 183-190. doi:10.11896/jsjkx.210800052

摘要 ( 354 )

PDF(2977KB) ( 963 )

参考文献 | 相关文章 | 多维度评价

现有的性能优异的医学图像分割模型大都由领域专家手动设计,设计过程往往需要大量专业知识和反复实验。此外,过度复杂的分割模型不仅对硬件资源有较高要求,且分割效率较低。为此,提出了用于自动构建轻量化医学图像分割网络的神经结构搜索方法Auto-LW-MISN(Automatically Light-Weight Medical Image Segmentation Network)。通过构建轻量级搜索空间、设计适用于医学图像分割的搜索超网络、设计添加复杂性约束的可微分搜索策略,建立用于自动搜索轻量化医学图像分割网络的神经结构搜索框架。在显微镜细胞图像、肝脏CT图像和前列腺MR图像等数据集上进行实验,结果表明,Auto-LW-MISN能够针对不同模态的医学图像自动构建轻量化的分割模型,其分割精度相比U-net,Attention U-net,Unet++和NAS-Unet等方法均有提高。

基于跨尺度特征融合自注意力的图像描述方法

王鸣展, 冀俊忠, 贾奥哲, 张晓丹

计算机科学. 2022, 49 (10): 191-197. doi:10.11896/jsjkx.220600009

摘要 ( 477 )

PDF(3284KB) ( 749 )

参考文献 | 相关文章 | 多维度评价

近年来,基于自注意力机制的编码器-解码器框架已经成为主流的图像描述模型。然而,编码器中的自注意力只建模低尺度特征的视觉关系,忽略了高尺度视觉特征中的一些有效信息,从而影响了生成描述的质量。针对该问题,文中提出了一种基于跨尺度特征融合自注意力的图像描述方法。该方法在进行自注意力运算时,将低尺度和高尺度的视觉特征进行跨尺度融合,从视觉角度上提高自注意力关注的范围,增加有效视觉信息,减少噪声,从而学习到更准确的视觉语义关系。在MS COCO数据集上的实验结果表明,所提方法能够更精确地捕获跨尺度视觉特征间的关系,生成更准确的描述。特别地,该方法是一种通用的方法,通过与其他基于自注意力的图像描述方法相结合,能进一步提高模型性能。

基于改进拆分注意力网络的目标检测算法

潘毅, 王丽萍

计算机科学. 2022, 49 (10): 198-206. doi:10.11896/jsjkx.210800214

摘要 ( 420 )

PDF(3750KB) ( 756 )

参考文献 | 相关文章 | 多维度评价

当前,以卷积神经网络为基础的目标检测算法大多存在缺少对有价值的上下文信息的合理利用以及易对困难目标漏检等问题。针对这些问题,提出了一种基于改进拆分注意力网络的目标检测算法。首先,引入拆分注意力机制,将多通道结构与注意力机制相结合,提升其特征表示。然后,在网络的卷积层中使用多尺度卷积取代传统的卷积操作,增强了神经网络对尺度变化的敏感性。最后,将改进的网络应用于Faster R-CNN中,并在Pascal VOC数据集和MS COCO数据集上进行实验。所提算法在不增加超参数量及计算复杂度的情况下,其mAP相较于原始算法分别提升了1.6%和2.4%,且对比其他算法也有所优势,验证了所提算法的良好性能。

基于环境信息挖掘的体素形变网络

刘娜丽, 田彦, 宋亚东, 江腾飞, 王勋, 杨柏林

计算机科学. 2022, 49 (10): 207-213. doi:10.11896/jsjkx.210900066

摘要 ( 604 )

PDF(3690KB) ( 688 )

参考文献 | 相关文章 | 多维度评价

3D形变技术是计算机图形学领域的研究热点之一。当前的3D形变方法主要通过聚合局部相邻的体素特征来学习物体形变前后的变化,未充分挖掘非局部体素特征之间的相互关系,这种环境信息的缺失导致模型无法捕获更具辨识性的特征。针对上述问题,设计了一种基于环境信息挖掘的体素形变网络,该网络能够同时对局部和环境信息进行提取,从不同的空间域中挖掘环境信息以提升网络的表征性能,进而建模物体形变前后的变化关系。引入自注意力机制,通过学习特征空间中不同体素的非局部依赖性,以提升体素特征的辨别力;引入一种多尺度分析方法,使用不同扩张率的空洞卷积分别提取不同感知域中的环境信息,为模型提供了更丰富的上下文特征。此外,文中分析了特征融合对模型的影响,并设计了一种基于编码器-解码器特征融合方法,自适应地对编码器和解码器提取的特征进行融合,提高了模型的非线性映射能力。在自建的齿科数据集上进行了充分的对比实验,结果表明,与现有方法相比,所提方法在形变预测任务的准确率上有一定的提升。

几何特征和属性标签驱动的人脸图像合成

代福芸, 迟静, 任明国, 张琪东

计算机科学. 2022, 49 (10): 214-223. doi:10.11896/jsjkx.210900080

摘要 ( 530 )

PDF(6412KB) ( 805 )

参考文献 | 相关文章 | 多维度评价

针对当前人脸图像合成中存在的模样和表情合成的多样性不足、表情的真实感不高、合成效率低的问题,提出了一种引入面部几何特征和属性标签约束的新型人脸合成网络模型。该模型在给定一张源人脸图片、一张目标人脸图片和属性(如发色、性别、年龄等)标签的情况下,能够生成一张具有源人脸表情、目标人脸身份特征以及指定属性的高真实感的人脸图像。模型包括两部分:人脸特征点生成器(Facial Landmark Generator,FLMG)和几何-属性感知生成器(Geometry and Attribute Aware Generator,GAAG)。FLMG利用人脸几何特征点编码表情信息,并将源人脸的表情信息迁移到目标人脸的特征点上;GAAG结合FLMG中生成的特征点、给定的属性标签和目标人脸图片,生成一张具有指定模样和表情的人脸图片。文中还引入了一个新的软截断三元感知损失函数用于约束GAAG,该函数可使生成的人脸更好地保持目标人脸的身份特征且更加真实自然,同时可使GAAG模型以更快的速度收敛。实验结果表明,所提方法可合成模样和表情多样化的人脸图像,且人脸的外貌真实、表情自然。另外,所提网络模型只需训练一次即可实现任意不同表情之间的迁移,效率较高。

文档级实体关系抽取方法研究综述

冯钧, 魏大保, 苏栋, 杭婷婷, 陆佳民

计算机科学. 2022, 49 (10): 224-242. doi:10.11896/jsjkx.211000057

摘要 ( 666 )

PDF(6110KB) ( 3072 )

参考文献 | 相关文章 | 多维度评价

实体关系抽取作为文本挖掘和信息抽取的核心任务,意图从自然语言文本中识别并判定实体对之间存在的特定关系,为智能检索、语义分析等提供了基础支持,有助于提高搜索效率,是自然语言处理领域中的研究热点。相比从单句中进行抽取,文档中包含了更加丰富的实体关系语义,因此近年来很多新的抽取方法纷纷将研究重点从句子层次转移到文档层次,并取得了丰富的研究成果。文中系统地总结了近年来文档级实体关系抽取的主流方法和研究进展。首先概述了文档级关系抽取问题及面临的挑战,然后从基于序列、基于图和基于预训练语言模型3个方面介绍多种文档级关系抽取方法,最后对各种方法使用的数据集及实验进行对比分析,并对未来可能的研究方向进行了探讨和展望。

联合知识图谱和预训练模型的中文关键词抽取方法

姚奕, 杨帆

计算机科学. 2022, 49 (10): 243-251. doi:10.11896/jsjkx.210800176

摘要 ( 677 )

PDF(2534KB) ( 1007 )

参考文献 | 相关文章 | 多维度评价

关键词表征了文本的主题,是文本概念和主题的凝练。通过关键词,读者可以快速了解文档表达的主旨和思想,从而提升信息检索效率;此外,关键词抽取也可以为自动摘要、文本分类提供支撑。近年来,自动抽取关键词的研究引起了广泛关注,但如何精准地抽取文档的关键词仍是一个挑战。一方面,关键词是人们主观的认识,判断一个词是否是关键词本身具有主观性;另一方面,中文词汇往往具有丰富的语义信息,单纯依赖传统统计特征和主题特征难以准确提炼文本所表达的主旨思想。针对中文关键词抽取中存在的准确率低、信息冗余和信息缺失等问题,提出了一种联合知识图谱和预训练模型的无监督关键词抽取方法。该方法首先利用预训练模型进行主题聚类,并通过一种以句子为单位的聚类方法保证最终选取的关键词对全文内容的覆盖度;同时,通过知识图谱进行实体链接,以此实现精准分词及歧义消除;然后,根据主题信息构建语义词图,并以此为基础计算词语间的语义权重;最后,通过加权的PageRank算法进行关键词排序。在DUC 2001和CSL两个公开数据集和一个单独标注的CLTS数据集上,以预测结果的准确率、召回率及F1值为指标进行对比实验。实验结果表明,该模型相比多种基线方法,准确率均有所提升,在CLTS数据集上与传统统计方法TF-IDF相比F1值提高了9.14%,与传统图方法TextRank相比F1值提高了4.82%。

一种用于RPA系统的DOM对象快速搜索与定位算法

孟媛, 秦云川, 蔡宇辉, 李肯立

计算机科学. 2022, 49 (10): 252-257. doi:10.11896/jsjkx.210900210

摘要 ( 658 )

PDF(2212KB) ( 742 )

参考文献 | 相关文章 | 多维度评价

机器人流程自动化(RPA)是以软件机器人及人工智能为基础的业务过程自动化科技,能够代替或协助人类在计算机等设备中完成重复性工作。在应用RPA软件对浏览器页面元素进行自动化操作时,在保证准确的前提下快速对目标DOM元素进行定位和搜索是完成一个完整自动化流程的关键技术难点。现有的定位方法,如Xpath和Css-Selector,面对结构复杂的网页会出现路径过长的问题,导致定位速度慢或路径定位不准等。为解决上述问题,提出一种用于RPA系统的DOM对象快速搜索与定位算法——最优XPATH路径算法。该算法分析元素的属性等信息生成最优路径,用于在自动化操作时对元素进行唯一定位。实验结果表明,使用最优路径对元素进行定位所需时间仅为使用完整XPATH路径定位耗时的23.14%,说明所提算法具有降低路径生成难度,加快元素定位速度等优点,提高了自动化效率。

基于图交互与场景感知融合的轨迹预测方法

方阳, 赵婷, 刘期烈, 贺侗, 孙开伟, 陈前斌

计算机科学. 2022, 49 (10): 258-264. doi:10.11896/jsjkx.211000172

摘要 ( 607 )

PDF(2803KB) ( 967 )

参考文献 | 相关文章 | 多维度评价

在自动驾驶中,精确的环境感知和对周围交通参与者的轨迹预测对道路安全至关重要。基于此,提出了基于鸟瞰图(Bird Eye View,BEV)的实时端到端轨迹预测框架来同时学习交互和场景信息。该框架主要由图交互网络和金字塔感知网络两个模块组成,前者通过时空图卷积网络对交通参与者之间的交互模式进行编码,后者采用时空金字塔网络对周围信息进行场景建模以获取场景特征。然后,对交互特征和场景特征进行单一尺度融合,从而进行分类和轨迹预测任务。在大规模开源数据集NuScenes上的实验和分析表明,与当前先进算法(MotionNet)相比,所提框架平均类别准确度提高了3.1%,轨迹预测平均误差在行驶速度>5m/s时降低了1.43%。此实验结果表明,所提模型具有更好的泛化性和鲁棒性,更符合实际自动驾驶环境中的轨迹预测需求。

多轮对话技术及其在电网数据查询中的应用

王凯, 李舟军, 盛文博, 陈舒玮, 王明轩, 刘剑青, 蓝海波, 张锐

计算机科学. 2022, 49 (10): 265-271. doi:10.11896/jsjkx.200600078

摘要 ( 492 )

PDF(2612KB) ( 1132 )

参考文献 | 相关文章 | 多维度评价

随着信息技术与传统行业的相互融合,使用计算机控制的机器替代人类进行一系列重复、枯燥甚至危险的工作已成为一大趋势。为利用自然语言与计算机进行有效的交互,基于多轮对话技术的人机交互与对话系统应运而生,并已成为当前人工智能与自然语言处理领域的研究热点。电网调控系统中存在大量查询操作,需要调度员手动操作数据管理系统。利用多轮对话技术实现电网数据的智能化查询,可解决现有调度系统操作流程复杂低效的问题,大大提高了调度员对紧急情况的处理速度。文中首先阐述了任务导向型多轮对话系统的基本架构,以及自然语言理解、对话管理、自然语言生成3个模块的功能与相关算法。然后,为满足电网公司对数据智能查询等特定场景的需求,设计并实现了一个多模块级联式的任务导向型多轮对话系统。该系统主要由自然语言理解模块、对话管理模块、自然语言生成模块和知识库4个核心部分组成。电网调度员可使用自然语言的形式向该系统询问其所希望获得的信息,并得到相应的回复。该过程无需键盘和鼠标的操作,大大提高了电网信息查询的快捷性与便利性。

云环境下可验证关键词密文检索研究综述

周倩, 戴华, 盛文杰, 胡正, 杨庚

计算机科学. 2022, 49 (10): 272-278. doi:10.11896/jsjkx.220500285

摘要 ( 375 )

PDF(1682KB) ( 970 )

参考文献 | 相关文章 | 多维度评价

云计算便捷高效的特点使其拥有巨大的发展潜力,越来越多的企业与个人通过使用云计算提供的各类外包服务而获得实际收益。为了保护云端外包数据的私密性和一致性,具有隐私保护能力的可验证密文检索技术正逐渐成为当前云计算领域的一个研究热点。针对关键词密文检索的一致性验证问题,阐述现有研究工作主要采用的系统模型、威胁模型和通用框架;从可验证单关键词密文检索和可验证多关键词密文检索两个角度,综述现有研究工作的技术方案,并分析这些技术方案的优缺点;最后,通过综合分析和对比现有研究工作的研究重点及其所使用的关键技术,对现有工作进行总结,并展望未来可能的研究方向和趋势。

一种基于实时代码装卸载的代码重用攻击防御方法

侯尚文, 黄建军, 梁彬, 游伟, 石文昌

计算机科学. 2022, 49 (10): 279-284. doi:10.11896/jsjkx.220500091

摘要 ( 470 )

PDF(2578KB) ( 765 )

参考文献 | 相关文章 | 多维度评价

近年来,代码重用攻击(Code Reuse Attack)已经成为针对二进制程序的一种主流攻击方式。以ROP为代表的代码重用攻击,利用内存空间中存在的指令片段,构建出能实现特定功能的指令序列,达成了恶意目标。文中根据代码重用攻击的基本原理,提出了基于实时装卸载函数代码的防御方法,通过动态装卸载的方式裁剪代码空间,从而达到缩小攻击面以防御代码重用的目的。首先,以静态分析的方式获取受保护程序依赖库的函数信息;以替换库的形式使用这些信息;其次,在Linux动态装载器中引入实时装载函数的操作及自动触发和还原的装卸载流程,为了减小频繁卸载导致的高额开销,设计了随机化批量卸载机制;最后,在真实环境中开展实验,验证了该方案防御代码重用攻击的有效性,展示了随机卸载策略的意义。

局部时间序列黑盒对抗攻击

杨文博, 原继东

计算机科学. 2022, 49 (10): 285-290. doi:10.11896/jsjkx.210900254

摘要 ( 331 )

PDF(2286KB) ( 885 )

参考文献 | 相关文章 | 多维度评价

用于时间序列分类的深度神经网络由于其自身对于对抗攻击的脆弱性,导致模型存在潜在的安全问题。现有的时间序列攻击方法均基于梯度信息进行全局扰动,生成的对抗样本易被察觉。为此,文中提出了一种不需要梯度信息的局部黑盒攻击方法。首先,对抗攻击被描述为一个约束优化问题,并假设不能获得被攻击模型的任何内部信息;然后利用遗传算法求解该问题;最后由于时间序列shapelets提供了不同类别间最具辨别力的信息,因此将其设计为局部扰动区间。实验结果表明,在有潜在安全隐患的UCR数据集上,所提方法可以有效地攻击深度神经网络并生成对抗样本。此外,所提算法相比基准算法在保持较高攻击成功率的同时显著降低了均方误差。

一种分布式的隐私保护数据搜索方案

刘明达, 拾以娟, 饶翔, 范磊

计算机科学. 2022, 49 (10): 291-296. doi:10.11896/jsjkx.210900233

摘要 ( 487 )

PDF(2589KB) ( 988 )

参考文献 | 相关文章 | 多维度评价

针对高敏数据上云后造成数据孤岛,从而导致数据无法互相搜索、互相发现,进而无法共享的问题,提出了一种分布式的隐私保护数据搜索方案,该方案实现了分布式场景下数据和搜索条件双向保密,并能够建立可信的搜索存证。首先对数据模型进行定义,明确了方案保护的目标和应用场景;其次提出了方案的设计框架和协议流程,重点对基于区块链的可信数据交互通道、可信密钥共享模块和密文搜索引擎3个部分的整体性流程进行描述;然后提出了一种基于可信执行环境的密文态下的全文搜索引擎Tantivy-SGX,重点对原理和实现方法进行详细分析;最后对整体流程和核心部分进行实现与验证。实验结果表明,该方案高效可行,能够有效增强分布式环境下的数据发现与搜索安全。

基于信誉的区块链分片共识方案

王梦楠, 黄建华, 邵兴辉, 麦勇

计算机科学. 2022, 49 (10): 297-309. doi:10.11896/jsjkx.210800227

摘要 ( 397 )

PDF(4149KB) ( 1103 )

参考文献 | 相关文章 | 多维度评价

分片是一种解决区块链扩容问题的技术,但是分片可能会导致恶意节点更容易集中在单个分片内,从而阻碍整个系统的安全运行。文中提出了一种基于信誉的区块链分片共识协议,通过建立信誉机制来衡量节点行为,促使节点遵循协议,并通过基于信誉等级的分片方法来减小各分片节点信誉等级分布的差异,防止恶意节点集中在单一分片进行作恶。提出一种验证链和记录链相结合的双链模型,该模型通过交易信息的差异化存储,在扩展区块链存储容量的同时提高了区块链的安全性。将投票份额与节点信誉相关联,同时差异化节点承诺,提出了基于信誉的快速拜占庭容错共识算法,使诚实节点更快达成共识,并减小恶意节点的影响。安全性分析表明,RCBSP能够保证分片内节点分布的合理性和共识过程的安全性,防止双花攻击、无利害关系攻击。实验结果表明,RBSCP在保证安全性的前提下,能够做到低分区时延、低共识时延和高吞吐量。

PGNFuzz:基于指针生成网络的工业控制协议模糊测试框架

王田原, 武淑红, 李兆基, 辛昊光, 李璇, 陈永乐

计算机科学. 2022, 49 (10): 310-318. doi:10.11896/jsjkx.210700248

摘要 ( 784 )

PDF(3440KB) ( 1116 )

参考文献 | 相关文章 | 多维度评价

工业安全问题一直是重要而紧迫的全球性问题,工控协议被广泛应用于工业控制系统(Industrial Control System,ICS)组件之间的通信,其安全性关系到整个系统的安全稳定运行,迫切需要保证所有工控协议的安全。网络协议模糊测试对保证ICS的安全性和可靠性起着重要的作用,传统的模糊测试方法提高了工控协议的安全性,其中许多方法具有实际应用价值。然而,传统的模糊测试方法严重依赖于工控协议的规范,使得测试过程昂贵、耗时、麻烦和枯燥,如果规范不存在,任务就很难进行。因此,文中提出了一种基于指针生成网络(Pointer-Generator Networks,PGN)的智能且自动的协议模糊测试方法,并给出了一系列的性能指标。在此基础之上,设计了一个自动化智能应用模糊测试框架PGNFuzz,可用于各种工业控制协议。采用Modbus和EtherCAT等几种典型的工控协议对该框架的有效性和效率进行测试,实验结果表明,该方法在便捷性、有效性和效率方面均优于其他通用型模糊器(General Purpose Fuzzer,GPF)和其他基于深度学习的模糊测试方法。

基于概率模型的二进制协议字段划分方法

杨资集, 潘雁, 祝跃飞, 李小伟

计算机科学. 2022, 49 (10): 319-326. doi:10.11896/jsjkx.210800268

摘要 ( 579 )

PDF(2714KB) ( 1159 )

参考文献 | 相关文章 | 多维度评价

字段划分是协议格式推断的基础,协议格式推断的后续步骤,如报文结构识别、字段语义推断和字段取值约束判定,高度依赖于字段划分质量。二进制协议缺少字符编码和定界符,字段长度取值灵活,值域变化丰富,因此字段划分难度较大。针对相关研究存在的特征构造维度单一和判决规则简单等问题,提出了一种基于概率模型的二进制协议字段划分方法。以二进制协议报文为研究对象,从报文内在结构、报文间取值变化等维度构造字段边界约束关系,然后用概率的方式将各种约束组合在一起,利用因子图模型计算各个位置成为边界的概率,从中得出最有可能的字段边界。实验结果表明,相比传统方法,所提方法在二进制协议字段边界识别中精准度更高、鲁棒性更强。

基于懒惰模式密文更新的CP-ABE属性变动方案

雷雪娇, 王银龙, 努尔买买提·黑力力

计算机科学. 2022, 49 (10): 327-334. doi:10.11896/jsjkx.211000189

摘要 ( 617 )

PDF(2227KB) ( 747 )

参考文献 | 相关文章 | 多维度评价

密文策略属性基加密(Ciphertext-Policy Attribute-Based Encryption,CP-ABE)可用于实现云计算环境下数据的安全共享。然而,在CP-ABE中用户属性的变动(属性撤销和属性添加)是一个棘手的问题。属性变动一般由代理服务器对相关密文进行二次加密和更新用户密钥来实施,而实施属性变动时,需要更新与将发生变动的属性相关的所有密文。文中提出了基于懒惰模式密文更新的用户属性变动方案,该方案通过分析用户(在属性撤销前或属性添加后)对属性变动相关密文是否具有访问能力,来判断是否需要更新密文,尽可能缩小需要更新的密文范围以及减少密文更新的次数,在保留原有CP-ABE方案安全特性的情况下,通过避免不必要的密文更新以及缩短密文长度的方式来提高方案的有效性。最后,通过小型实验验证了所提方案的正确性。

ZKFERP:计算成本恒定的通用高效范围证明方案

李一聪, 周宽久, 王梓仲, 徐琳

计算机科学. 2022, 49 (10): 335-343. doi:10.11896/jsjkx.210900044

摘要 ( 446 )

PDF(2038KB) ( 750 )

参考文献 | 相关文章 | 多维度评价

区块链去中心化的特性易导致交易层用户隐私泄露,引发信息安全问题。零知识范围证明的目的是在不透露交易数据的同时,机密验证数据属于合法正整数区间,有效解决了区块链隐私保护问题。现有的区块链范围证明方案在证明速度、验证速度及计算成本等方面仍有较大的优化空间;并且,现有方案无法处理浮点数问题,因此限制了范围证明的应用领域。基于此,提出了一种计算成本恒定且浮点数、整数通用的高效范围证明方案——ZKFERP。ZKFERP在Bulletproofs的基础上改进零知识协议,优化证明结构,并设计了一种拉格朗日内积向量生成方法,使见证生成时间恒定,最后利用浮点数范围关系式构造承诺,实现浮点数范围证明。ZKFERP仅依赖于离散对数假设,无需第三方可信。实验结果表明,ZKFERP的通信成本和时间复杂度均恒定,且与已知最先进的范围证明方案相比,ZKFERP的证明时间缩短了40.0%,验证时间缩短了29.8%。

面向数据流滑动窗口的自适应直方图发布算法

王修君, 莫磊, 郑啸, 高云全

计算机科学. 2022, 49 (10): 344-352. doi:10.11896/jsjkx.210700242

摘要 ( 546 )

PDF(2210KB) ( 719 )

参考文献 | 相关文章 | 多维度评价

差分隐私技术作为一种有效的隐私保护机制,已被广泛应用在诸多领域。目前已有的静态数据集和动态数据集上的直方图发布方法在处理数据流滑动窗口模型时,往往只能够通过对数据直方图信息添加统一噪声的形式来实现数据保护,这导致了它们在实际应用中存在数据可用性低、时间复杂度高等问题。针对这些问题,文中通过将数据流近似计数技术综合到差分隐私保护算法中,进而提出了一种面向数据流滑动窗口模型的自适应直方图发布方法APS(Adaptive Histogram Publishing Method for Sliding Window)。APS算法首先利用数据流近似计数方法来预测下一时刻滑动窗口内数据的分布信息;然后通过比较估计值与真实值之间的差异来选取合适的发布值;最后对排序后的直方图区间进行聚类处理,并优化其桶内数据的误差。理论分析显示,APS算法能够在减少隐私预算的同时,有效地提高数据的可用性和缩短运行时间。在两种不同的真实数据集上的实验结果也验证了APS算法在数据可用性和运行时间上显著优于现有的基于分组的直方图发布算法。

基于人工智能的分布式入侵检测研究

王璐, 文武松

计算机科学. 2022, 49 (10): 353-357. doi:10.11896/jsjkx.220700095

摘要 ( 570 )

PDF(1881KB) ( 853 )

参考文献 | 相关文章 | 多维度评价

为了解决目前动态加载系统存在的数据处理缺陷以及系统入侵精确度低等问题,以“人工智能技术”应用为例,设计一款功能完善、实用性强的分布式入侵检测系统。首先,在完成系统架构设计和系统数据库设计的基础上,对控制中心、分区控制中心延长网络主机进行全面分析;其次,严格按照响应库相关的响应规则,制定相应的响应对策;然后,借助通信模块判断其入侵行为是否出现异常问题;再次,利用S5720S-28P-SI-AC24口核心交换机对相关数据进行交换处理;接着,选用型号为AD2032的报警响应器对外来入侵行为进行全面监视;另外,在全面分析主体通信实现方式的基础上,利用Libpcap库函数完成对入侵检测流程的科学设计;最后,从环境与参数设置、系统测试结果与分析两个方面入手,对系统性能进行全面测试。结果表明,在人工智能技术的应用背景下,所设计的分布式入侵检测系统可以获得较高的检测精确度,达到了99%,为后期安全、稳定地使用网络提供重要的平台支持。