1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2024年第9期, 刊出日期:2024-09-15
  
封面下载
目录
第51卷第9期目录
计算机科学. 2024, 51 (9): 0-0. 
摘要 ( 152 )   PDF(301KB) ( 482 )   
相关文章 | 多维度评价
高性能计算
高性能计算检查点技术发展与应用综述
闫晓婷, 王小宁, 董盛, 赵一宁, 肖海力
计算机科学. 2024, 51 (9): 1-14.  doi:10.11896/jsjkx.231000220
摘要 ( 327 )   PDF(2099KB) ( 538 )   
参考文献 | 相关文章 | 多维度评价
随着高性能计算系统的规模不断扩大,复杂度不断提升,应用的容错能力成为E级计算面临的重要挑战之一。检查点技术是实现应用程序的容错能力的主要手段之一,通过定期保存应用的执行状态来实现故障恢复。文中针对高性能计算检查点技术的发展和应用情况展开综述。首先,整理了高性能计算领域中检查点技术的发展;其次,根据运行层次的不同,分别阐述了系统层检查点和应用层检查点的工作,包括主流的工具软件、可用的检查点技术、使用的应用场景等;然后,讨论了检查点技术在并行计算的容错与弹性、HPC的调度与迁移、FPGA的调试、深度学习中的容错与忠实重放这4个方面的应用;最后,对检查点技术在高性能计算领域的下一步研究方向进行了展望。
基于混合精度的分布式GMRES算法优化
郭帅哲, 高建花, 计卫星
计算机科学. 2024, 51 (9): 15-22.  doi:10.11896/jsjkx.231000204
摘要 ( 216 )   PDF(2392KB) ( 533 )   
参考文献 | 相关文章 | 多维度评价
广义最小残差法(Generalized Minimum Residual,GMRES)是一种求解稀疏线性系统的迭代方法,被广泛应用于科学与工程计算等领域。数据量的爆炸式增长,使得GMRES算法求解的问题规模快速膨胀。为了支持大规模问题的求解,研究人员提出了面向集群的分布式GMRES算法。然而在现有的大多数集群中,节点间的网络性能仍与节点内的GPU高速互联网络存在较大差距,限制了分布式GMRES算法的性能。针对GPU集群上的分布式GMRES算法,提出了一种基于混合精度的加速求解方法,使用低精度浮点表示,显著降低了通信过程的时间开销。此外,提出了一种数据传输的精度调控算法,动态自适应调整传输数据的精度,以保证迭代算法最佳的求解效果。实验结果表明,所提基于混合精度的优化方法可实现平均2.4倍的加速比,结合其他优化方法后可实现平均7.6倍的加速比。
基于机器学习原子势函数的原子动力学蒙特卡洛程序TensorKMC的优化
刘人僪, 陈欣, 商红慧, 张云泉
计算机科学. 2024, 51 (9): 23-30.  doi:10.11896/jsjkx.230400010
摘要 ( 201 )   PDF(3859KB) ( 488 )   
参考文献 | 相关文章 | 多维度评价
核反应堆压力容器是核电站中最重要的部件之一,在使用过程中通常会受到辐照损伤,这极大影响了其使用寿命,给核电站的安全带来隐患。原子动力学蒙特卡洛方法(AKMC)是研究材料辐照损伤的有效理论方法,可以与计算机数值模拟进行结合来研究压力容器的微结构演变。辐照损伤的材料存在缺陷,原子间相互作用建模时需要考虑非球对称相互作用,但TensorKMC在计算时并没有考虑到原子的角向作用。文中针对该问题,提出了一种包含角向相互作用、可以与TensorKMC的三重编码完美结合的指纹建模方法,并可利用多重度对角向指纹的计算过程进行化简。文中在TensorKMC程序中实现了该方法,测试结果显示角向指纹对势函数的精度有显著影响,最大角动量越高,势函数越精准,程序的模拟耗时也会显著增加。同时,也针对TensorKMC的原子势函数的激活函数开展了测试,结果表明梯度光滑的Softplus和SquarePlus相比初版TensorKMC所用的ReLU在拟合高维势能面时有明显的优势,在最大角动量较低时ReLU有性能优势,但随着最大角动量的增大,不同激活函数对总体模拟时间几乎无特别影响。因此,在实际研究中推荐使用梯度光滑的激活函数。
基于MPI+CUDA的DSMC/PIC耦合模拟异构并行及性能优化研究
林拥真, 徐传福, 邱昊中, 汪青松, 王正华, 杨富翔, 李洁
计算机科学. 2024, 51 (9): 31-39.  doi:10.11896/jsjkx.230300188
摘要 ( 226 )   PDF(2805KB) ( 458 )   
参考文献 | 相关文章 | 多维度评价
DSMC/PIC耦合模拟是一类重要的高性能计算应用,大规模DSMC/PIC耦合模拟计算量巨大,需要实现高效并行计算。由于粒子动态注入、迁移等操作,基于MPI并行的DSMC/PIC耦合模拟往往通信开销较大且难以实现负载均衡。针对自主研发的DSMC/PIC耦合模拟软件,在原有MPI并行优化版本上设计实现了高效的MPI+CUDA异构并行算法,结合GPU体系结构和DSMC/PIC计算特点,开展了GPU访存优化、GPU线程工作负载优化、CPU-GPU数据传输优化及DSMC/PIC数据冲突优化等一系列性能优化。在北京北龙超级云HPC系统的NVIDIA V100和A100 GPU上,针对数亿粒子规模的脉冲真空弧等离子体羽流应用,开展了大规模DSMC/PIC耦合异构并行模拟,相比原有纯MPI并行,GPU异构并行大幅缩短了模拟时间,两块GPU卡较192核的CPU加速比达到550%,同时具有更好的强可扩展性。
基于CRIU的高性能计算容器检查点技术研究
陈轶阳, 王小宁, 闫晓婷, 李冠龙, 赵一宁, 卢莎莎, 肖海力
计算机科学. 2024, 51 (9): 40-50.  doi:10.11896/jsjkx.231000221
摘要 ( 228 )   PDF(3965KB) ( 371 )   
参考文献 | 相关文章 | 多维度评价
容错一直是高性能计算领域的热点和难点问题。检查点是解决容错问题的一种常用技术手段,它能够将运行进程的状态转储成文件并恢复。容器具有较强的资源隔离能力,可以为检查点技术提供更理想的运行环境与载体,避免迁移后任务在节点变更的情况下由于环境与资源变化而出现异常。因此,容器和检查点相结合能够更好地支撑任务迁移的研究与实现。文中围绕基于CRIU(Checkpoint/Restore In Userspace)的Singularity容器检查点方案的设计和优化展开,根据检查点技术在高性能计算容器应用中的特点,在CRIU安全使用、迁移性能优化、保持网络状态方面给出了有效的解决方案,基于这些方案拓展了Singularity容器检查点功能,并且实现了原型工具Migrator来验证容器迁移性能。期望本工作能为后续实现高性能计算任务迁移提供有效的支撑。
基于鲲鹏处理器的LU并行分解优化算法
徐鹤, 周涛, 李鹏, 秦芳芳, 季一木
计算机科学. 2024, 51 (9): 51-58.  doi:10.11896/jsjkx.230900079
摘要 ( 184 )   PDF(2173KB) ( 410 )   
参考文献 | 相关文章 | 多维度评价
ScaLAPACK(Scalable Linear Algebra PACKage)是并行计算软件包,适用于分布式存储的 MIMD(Multiple Instruction,Multiple Data)并行计算机,被广泛应用于基于线性代数运算的并行应用程序开发。然而在进行LU分解过程中,ScaLAPACK库中的例程并不是通信最优的,没有充分利用当前的并行架构。针对上述问题,提出一种基于鲲鹏处理器的LU并行分解优化算法(Parallel LU Factorization,PLF),实现了负载均衡,适配国产鲲鹏环境。PLF对不同进程的不同分区的数据进行差异化处理,并将每个进程所拥有的部分数据分配给根进程进行计算,之后再由根进程散播回各个子进程,这有利于充分利用CPU资源,实现负载均衡。在单节点Intel 9320R处理器以及鲲鹏(Kunpeng) 920处理器环境中进行测试,其中,Intel平台下使用Intel MKL(Math Kernel Library),Kunpeng平台下使用PLF算法。对比两个平台关于不同规模的方程组求解的性能发现,Kunpeng平台的求解性能有显著优势。在NUMA数进程和单线程的情况下,优化后的计算效率在小规模平均达到4.35%,相比Intel的1.38%提升了215%;中规模平均达到4.24%,相比Intel平台的1.86%提升了118%;大规模平均达到4.24%,相比Intel的1.99%提升了113%。
基于训练集聚类选择优化的CPU功耗建模精度提升方法
李泽锴, 钟佳卿, 冯绍骏, 陈娟, 邓荣宇, 徐涛, 谭政源, 周柯杏, 朱鹏志, 马兆阳
计算机科学. 2024, 51 (9): 59-70.  doi:10.11896/jsjkx.231100015
摘要 ( 141 )   PDF(4141KB) ( 372 )   
参考文献 | 相关文章 | 多维度评价
建立高精度、低开销的CPU功耗模型对于计算机系统的功耗管理与功耗优化至关重要。一般认为训练集规模越大,CPU功耗模型精度越高。但有研究发现增大训练集规模不一定会提高功耗建模精度,有时甚至会导致精度下降,因此,如何选择功耗模型训练集以保证CPU功耗模型精度达到要求具有重要意义。文中提出一种基于聚类的训练集选择优化算法来解决上述问题,在有效保证CPU功耗建模精度的同时降低了CPU功耗建模的开销。该算法首先通过主成分分析将基于PMC的程序特征转换为p维向量特征空间,然后根据找到的最优聚类数按照程序特征对程序进行聚类,从每个聚类簇中选出代表程序;最后根据“单聚类簇内代表性最强原则”与“多聚类簇间代表程序数最少原则”形成最优训练集,模型精度相比Baseline精度有明显提高。在x86和ARM两类处理器平台上分别采用线性功耗建模和神经网络功耗建模两种方式,对算法进行了实验评估,实验结果表明所提算法的功耗建模精度有效显著提升。
填充性载荷:减少集群资源浪费与深度学习训练成本的负载
杜昱, 俞子舒, 彭晓晖, 徐志伟
计算机科学. 2024, 51 (9): 71-79.  doi:10.11896/jsjkx.231000222
摘要 ( 99 )   PDF(2385KB) ( 344 )   
参考文献 | 相关文章 | 多维度评价
近年来,大模型在生物信息学、自然语言处理和计算机视觉等多个领域取得了显著成功。然而,这些模型在训练和推理阶段需要大量的计算资源,导致计算成本高昂。同时,计算集群中存在资源利用率低、任务调度难的供需失衡问题。为了解决这一问题,提出了填充性载荷的概念,即一种在计算集群中利用空闲资源进行计算的负载。填充性载荷的计算资源随时可能被其他负载抢占,但其使用的资源优先级较低,资源成本也相对较低。为此,设计了适用于填充性载荷的分布式深度学习训练框架PaddingTorch。基于阿里巴巴PAI集群的数据,使用4块GPU模拟了任务切换最频繁的4个GPU时间段上的作业调度情况,使用PaddingTorch将蛋白质复合物预测程序作为填充性载荷进行训练。训练时长为独占资源时训练时长的2.8倍,但训练成本降低了84%,在填充性载荷填充时间段内GPU资源利用率提升了25.8%。
基于矩阵乘积态的有限纠缠量子傅里叶变换模拟
刘晓楠, 廉德萌, 杜帅岐, 刘正煜
计算机科学. 2024, 51 (9): 80-86.  doi:10.11896/jsjkx.230300215
摘要 ( 106 )   PDF(2141KB) ( 370 )   
参考文献 | 相关文章 | 多维度评价
与经典计算不同,在量子计算中量子比特可以处于叠加态,多个量子比特之间还可以形成纠缠态。表示n个量子比特组成的量子态需要存储2n个振幅,这种指数级的存储开销使得大规模的量子模拟难以进行。然而当量子态的纠缠程度有限时,使用矩阵乘积态表示量子态仅需要线性的空间复杂度,可以扩大模拟的规模。使用HIP-Clang语言,基于CPU+DCU的异构编程模型,使用矩阵乘积态表示量子态,对量子傅里叶变换进行模拟。结合矩阵乘积态的特点,对量子傅里叶变换线路进行分析,减少模拟实现时不必要的张量缩并运算与正交化构建。对模拟过程中的张量缩并进行分析,使用TTGT算法完成张量缩并运算,同时利用DCU的并行处理能力来提高效率。对模拟结果进行分析,分别通过振幅误差与半经典Draper量子加法器的结果验证了模拟的正确性。对模拟规模进行分析,当量子态的纠缠熵最大时,使用16GB的内存空间最多只能模拟24位的量子态,而当量子态内部纠缠程度较低时,可以对上百位的量子态进行量子傅里叶变换模拟。
基于领域分析的结构线性静力软件串并行一致化方法
唐德泓, 杨浩, 文龙飞, 徐正秋
计算机科学. 2024, 51 (9): 87-95.  doi:10.11896/jsjkx.231100016
摘要 ( 96 )   PDF(2880KB) ( 307 )   
参考文献 | 相关文章 | 多维度评价
并行CAE软件的计算结果串并行一致性是其计算结果可信的必要条件。然而,软件研发时常引入串并行不一致缺陷,其形式众多,现象相互耦合,散布于海量代码中,成为实现CAE软件串并行一致性的挑战。文中以结构线性静力软件的串并行一致性需求为切入点,针对现有的“专家知识法”与“缺陷定位法”应用于CAE软件串并行一致化时存在的粒度粗、准度差、成本高和缺乏系统性问题,引入领域分析方法,并与专家知识和数据流状态比对结合,提出了一种适用于结构线性静力的串并行一致化方法,实现了结构线性静力软件串并行不一致缺陷的细粒度、高准度与低成本系统性识别与修复。基于前述方法形成相关工具,并将方法与工具应用于SSTA的串并行一致化,识别并修复其中8处串并行不一致缺陷,使其通过90余真实模型的串并行一致考核,并实现串并行结果严格一致;同时,该方法与工具还将串并行不一致缺陷定位耗时由平均大于两人天降低至数人时。
Grover量子搜索算法在“嵩山”超级计算机系统中的模拟
杜帅岐, 刘晓楠, 廉德萌, 刘正煜
计算机科学. 2024, 51 (9): 96-102.  doi:10.11896/jsjkx.230600219
摘要 ( 114 )   PDF(2868KB) ( 402 )   
参考文献 | 相关文章 | 多维度评价
量子计算凭借其叠加性和纠缠性,具有强大的并行计算能力。然而,目前的量子计算机不能在保证大规模量子比特处于稳定叠加态的同时,进行干涉、纠缠等量子操作。因此,当前研究和推动量子计算的有效途径是使用经典计算机模拟量子计算。Grover量子搜索算法针对无序数据库搜索问题设计,将搜索的时间复杂度加速至开平方级,能加速机器学习中的主成分分析。因此,研究和模拟Grover算法,可以促进量子计算与机器学习结合领域的发展,为Grover量子搜索算法的应用以及量子机器学习在“嵩山”超级计算机系统中的模拟奠定基础。通过研究Grover量子搜索算法,模拟出了算法的量子线路。使用Toffoli量子门优化该量子线路,在减少了两个辅助量子比特的同时,提出了Grover算法的通用量子线路。实验基于“嵩山”超级计算机系统的CPU+DCU异构体系,使用了MPI多进程+HIP多线程的两级并行策略。通过调整辅助比特在量子线路中的位置,减少了MPI进程间的通信;使用分片的方式传输数据依赖的量子态。对比串行版本,并行化的模拟算法取得了最高560.33倍的加速,首次实现了31qubits规模的Grover量子搜索算法。
超立方体在对称PMC模型下的g-好邻条件诊断度和g-额外条件诊断度
涂远杰, 程宝雷, 王岩, 韩月娟, 樊建席
计算机科学. 2024, 51 (9): 103-111.  doi:10.11896/jsjkx.230700007
摘要 ( 113 )   PDF(1878KB) ( 323 )   
参考文献 | 相关文章 | 多维度评价
故障诊断在维持多处理器系统的可靠性中起到了至关重要的作用,而诊断度是系统诊断能力的一个重要度量参数。除经典诊断度外还有条件诊断度,如g-好邻条件诊断度、g-额外条件诊断度等。其中g-好邻条件诊断度是在每个无故障顶点至少有g个无故障邻点的条件下定义的一种条件诊断度,g-额外条件诊断度是在每个无故障分支包含超过g个顶点的条件下定义的一种条件诊断度。故障诊断需要在特定的诊断模型下进行,如PMC模型、对称PMC模型等。对称PMC模型是在PMC模型的基础上通过添加两个假设而提出的一种新的诊断模型。n维超立方体因具有多种优越性质而被研究者们广泛研究。目前有不少在PMC模型下的诊断度研究,但缺乏在对称PMC模型下的诊断度研究。文中首先证明了超立方体在对称PMC模型下的g-好邻条件诊断度的上界和下界,当n≥40≤g≤n-4时上界为2g+1(n-g-1)+2g-1,当g≥0n≥max{g+4,2g+1-2-g-g-1}时下界为(2n-2g+1+1)2g-1+(n-g)2g-1-1。还证明了超立方体在对称PMC模型下的g-额外条件诊断度的上界和下界,当n≥40≤g≤n-4时上界为2n(g+1)-5g-2C2g-2,当n≥4且$0 \leqslant g \leqslant \min \left\{n-4,\left\lfloor\frac{2}{3} n\right\rfloor\right\}$时下界为$\frac{3}{2} n(g+1)-g-\frac{5}{2} C_{g+1}^{2}-1$。最后通过模拟实验验证了相关理论结果的正确性。
基于MLIR的FP8量化模拟与推理内存优化
徐金龙, 桂中华, 李嘉楠, 李颖颖, 韩林
计算机科学. 2024, 51 (9): 112-120.  doi:10.11896/jsjkx.230900143
摘要 ( 149 )   PDF(2980KB) ( 351 )   
参考文献 | 相关文章 | 多维度评价
随着目标检测模型和语言大模型的迅速发展,网络模型正变得越来越庞大。为了更好地在端侧硬件上进行模型部署,通常采用模型量化技术对模型进行压缩。现有的模型量化策略主要基于FP16,BF16和INT8等类型实现。其中,8bit数据类型在降低推理内存占用与部署开销方面最为显著,但INT8类型依赖特定的校准算法,未能很好地处理动态范围大、离群点多的模型。FP8类型能够更好地拟合神经网络中的数据分布,同时具有多种数制,可在表达范围和表达精度上灵活调整。然而,当前MLIR系统缺乏对FP8类型量化的支持。为此,提出了一种基于MLIR系统的FP8量化模拟策略,包含FP8E4M3和FP8E5M2两种数制,通过对网络中的算子进行量化模拟,评估FP8两种数制对模型推理精度的影响。同时,针对推理引擎中存在的内存分配冗余问题,提出了一种基于定义使用链的内存复用策略,使得模型推理过程中的内存占用峰值进一步减小。实验选取了典型的Yolov5s和Resnet50模型进行测试,结果表明相较于现有的INT8量化策略,FP8量化策略能够保持更好的模型精度,同时不依赖特定校准算法,部署更为简便。在模型精度上,测试用例分别达到了55.5%和77.8%的准确度,经过内存复用优化,内存占用峰值降低了约15%~20%。
计算机图形学&多媒体
一种用于视觉跟踪的低秩上下文感知的相关滤波器
苏银强, 王宣, 王淳, 李充, 徐芳
计算机科学. 2024, 51 (9): 121-128.  doi:10.11896/jsjkx.230700045
摘要 ( 102 )   PDF(5261KB) ( 365 )   
参考文献 | 相关文章 | 多维度评价
基于DCF的目标跟踪方法在保持实时运行时,由于在精度和鲁棒性之间实现了很好的权衡而备受关注。但是,当出现遮挡、移出视野、平面外旋转等干扰时,现有跟踪器仍面临着模型漂移甚至跟踪失败的情况。为此,提出了一种基于低秩上下文感知的相关滤波器LR_CACF。具体来说,在滤波器学习阶段,直接将目标及其上下文信息集成到DCF框架中,以更好地将目标从背景中鉴别出来;同时,对跨帧视频施加低秩约束以强调时序平滑性,使得学习的滤波器处于一个低维的鉴别流行上,进一步提高了跟踪性能;然后,利用ADMM实现滤波模型的高效优化;此外,针对模型失真的问题,启动多模态检测机制来识别响应图的可靠性,当反馈不可靠时,滤波器停止训练,同时扩大搜索区域,并采用区域重叠的方法重新捕获目标。在OTB-50,OTB-100和DTB70数据集上进行了大量实验,实验结果表明,相对于基线SAMF_CA,在DP方面,LR_CACF分别获得了6.9%,4.0%和7.1%的增益,AUC分别提高了3.6%,2.7%和5.4%。基于属性分析的结果表明,LR_CACF尤其擅长处理遮挡、移出视野、平面外旋转、低分辨率和快速运动等场景。
艺术美感增强的图像任意风格迁移
李鑫, 普园媛, 赵征鹏, 李煜潘, 徐丹
计算机科学. 2024, 51 (9): 129-139.  doi:10.11896/jsjkx.230800098
摘要 ( 124 )   PDF(5487KB) ( 377 )   
参考文献 | 相关文章 | 多维度评价
目前的研究表明,通用风格迁移取得了显著成功,即能将任意视觉风格迁移到内容图像。然而,在图像任意风格迁移的评价维度中,只考虑语义结构的保留度和风格图案的多样性是不全面的,还应将艺术美感纳入考量范围。现有方法普遍存在艺术美感不自然的问题——表现为风格化图像中会出现不和谐的图案和明显的伪影,很容易与真实的艺术作品区分开来。针对该问题,提出了一种艺术美感增强的图像任意风格迁移方法。首先,设计了一个多尺度艺术美感增强模块,通过提取不同尺度的风格图像特征,改善了风格化图案不和谐的问题;同时,设计了一个美感风格注意力模块,使用通道注意力机制,根据艺术美感特征的全局美感通道分布自适应地匹配并增强相应的风格特征;最后,提出了一个协方差变换融合模块,将增强后的风格特征的二阶统计数据迁移到对应的内容特征上,在很好地保留内容结构的同时实现了美感增强的风格迁移。通过与4种最新的风格迁移方法进行定性比较,同时进行消融实验,分别验证了所提模块与所加损失函数的有效性;在5项定量指标的对比中,有4项取得最优分数。实验结果表明,所提方法可以生成艺术美感更和谐的风格迁移图像。
基于演化多目标聚类的SAR图像变化检测
周宇, 杨俊岭, 党可林
计算机科学. 2024, 51 (9): 140-146.  doi:10.11896/jsjkx.230800014
摘要 ( 134 )   PDF(3422KB) ( 393 )   
参考文献 | 相关文章 | 多维度评价
基于合成孔径雷达(SAR)图像的变化检测是遥感领域中一项具有挑战性的任务,如何在噪声鲁棒性和有效保留细节之间取得平衡是一个迫切需要解决的问题。然而,大多数SAR图像变化检测方法为了更好地抑制斑点噪声,不可避免地会在一定程度上丢失图像细节。为了解决这一问题,提出了一种基于演化多目标聚类的SAR图像变化检测多目标聚类算法,将变化检测问题转化为一个多目标优化问题。该方法同时构建了两个相互冲突的目标,即分别基于原始差异图与噪声滤波后差异图的聚类能量函数,并用基于分解的演化多目标优化算法MOEA/D对以上目标函数进行优化,实现对差异图不变区域与变化区域的聚类。利用该技术可得到一组变化检测图,用户可以根据自己的需求选择合适的结果。最后,在两个SAR图像数据集上进行了充分的实验,结果表明了该方法的有效性。
面向文本识别的小样本阴影消除方法
王笳辉, 彭光灵, 段亮, 袁国武, 岳昆
计算机科学. 2024, 51 (9): 147-154.  doi:10.11896/jsjkx.230800003
摘要 ( 127 )   PDF(3308KB) ( 363 )   
参考文献 | 相关文章 | 多维度评价
阴影消除是计算机视觉领域中面对阴影场景的重要任务,旨在检测和消除图像中的阴影区域。由于图像编辑技术受到阴影图像质量的制约,现有方法利用其他任务中的知识和阴影特性来获得更加有效的特征向量,从而实现阴影消除。在带有文本内容的阴影图像中,由于文本颜色和形状等特征不同于前景和背景,因此可能将文本错误地检测为阴影的一部分进而导致错误的阴影消除结果。针对该问题,提出了一种面向文本识别的小样本阴影消除方法。在小样本目标检测基础框架模型中,利用被错误识别为阴影的文本特征生成基类数据和新类数据,增强对该类文本的特征学习;在部分检测框合并算法中,利用文本本身长宽比多样化、变化大的特性,以多个约束为前提合并结构相关性较强的检测框,实现对目标的正确框定。建立在真实数据与合成数据上的实验结果验证了所提方法的有效性。
一种语义引导的神经网络关键数据路由路径算法
朱富坤, 滕臻, 邵文泽, 葛琦, 孙玉宝
计算机科学. 2024, 51 (9): 155-161.  doi:10.11896/jsjkx.230900109
摘要 ( 131 )   PDF(3187KB) ( 348 )   
参考文献 | 相关文章 | 多维度评价
近年来,由于人工智能在各领域的普及,研究神经网络的可解释方法及理解神经网络的运作机理已经成为一个愈发重要的话题。作为神经网络解释性方法的一个分支,网络的路径可解释性受到了越来越多的关注。文中特别探讨了关键数据路由路径(Critical Data Routing Path,CDRP)这一面向网络路径的可解释方法。首先,通过Score-CAM(Score-Class Activation Map)方法分析了CDRP在输入域上的路径可视化归因,指出CDRP方法在语义层面的潜在缺陷。然后,提出了一种语义引导的Score-CDRP方法,从方法机理上提升了CDRP与原始神经网络的语义一致性。最后,通过实验从路径热力图可视化以及相应的预测与定位精度等角度验证了Score-CDRP方法相较于CDRP的合理性、有效性和鲁棒性。
重参数化增强的双模态实时目标检测模型
李允臣, 张睿, 王家宝, 李阳, 王梓祺, 陈瑶
计算机科学. 2024, 51 (9): 162-172.  doi:10.11896/jsjkx.230700106
摘要 ( 170 )   PDF(4461KB) ( 396 )   
参考文献 | 相关文章 | 多维度评价
无人机高空航拍的目标普遍尺寸小、特征弱,而且受复杂天候条件影响大,导致基于可见光或红外单模态图像的目标检测漏检、误检率较高。对此,提出了重参数化增强的双模态实时目标检测模型DM-YOLO。首先,采用通道拼接的方法融合可见光和红外图像,以极低的成本融合双模态图像的互补信息。其次,提出更加高效的重参数化模块并基于此构建了更加强大的骨干网RepCSPDarkNet,有效增强了骨干网对双模态图像的特征提取能力。然后,提出了多层次特征融合模块,通过多感受野卷积和注意力机制融合弱小目标的多尺度特征信息,增强了弱小目标的多尺度特征表示。最后,删除了对弱小目标检测基本不起作用的特征金字塔深层检测层,在检测精度保持不变的情况下,减小了模型规模。实验结果表明,在大规模的双模态图像数据集DroneVehicle上,DM-YOLO的检测精度比基准YOLOv5s高出2.45%,且优于规模相当的YOLOv6和YOLOv7模型,有效提高了复杂光照条件下目标检测的准确性和鲁棒性,同时检测速度达到82FPS,可满足实时检测的需求。
基于YOLOv5s和双稳随机共振的夜间车辆检测算法
胡鹏飞, 王友国, 翟其清, 颜俊, 柏泉
计算机科学. 2024, 51 (9): 173-181.  doi:10.11896/jsjkx.230600056
摘要 ( 188 )   PDF(5171KB) ( 498 )   
参考文献 | 相关文章 | 多维度评价
针对夜间车辆检测过程中光照不强导致漏检误检的问题,基于YOLOv5s和双稳随机共振提出一种改进的夜间车辆检测算法。YOLOv5s从4方面进行改进:1)在Backbone和Neck中更换细小结构,提高网络对小目标的检测能力;2)加入由坐标注意力CA和能量注意力SimAM构成的双注意力机制,提高网络对目标的特征提取能力;3)采用轻量化骨干Fasternet,减少模型参数量;4)在Head中采用WIoU损失函数,加快边界框回归损失的收敛速度。利用经典的双稳随机共振对夜间车辆数据集进行低照度图像增强,分析其有效性,并将增强后的夜间车辆图像传入改进的YOLOv5s网络进行训练。实验结果表明,相较于原始YOLOv5s,融合改进的YOLOv5s和双稳随机共振的夜间车辆检测算法在执行远景小目标以及密集遮挡的夜间车辆检测任务时具有更高的准确率和更低的漏检率。
人工智能
面向关系特性建模的知识图谱表示学习研究综述
牛广林, 蔺震
计算机科学. 2024, 51 (9): 182-195.  doi:10.11896/jsjkx.240100113
摘要 ( 161 )   PDF(3454KB) ( 449 )   
参考文献 | 相关文章 | 多维度评价
知识图谱表示学习技术可以将符号化的知识图谱转换为实体和关系的数值化表示,进而有效结合各类深度学习模型以赋能知识增强的下游应用。相较于实体,关系充分体现了知识图谱中的语义信息,建模关系的各类特性对知识图谱表示学习的性能非常关键。首先,针对一对一、一对多、多对一和多对多的复杂映射特性,梳理基于关系感知映射的模型、基于特定表示空间的模型、基于张量分解的模型和基于神经网络的模型;接着,面向建模对称、反对称、逆反和组合特性的多种关系模式,总结基于改进张量分解的模型、基于改进关系感知映射的模型和基于旋转操作的模型;其次,面向建模实体间隐含的层次关系,介绍基于辅助信息的模型、基于双曲空间的模型和基于极坐标系的模型。最后,针对稀疏知识图谱和动态知识图谱等更加复杂的情况,从融合多模态信息的知识图谱表示学习、规则增强的关系模式建模和针对动态知识图谱表示学习的关系特性建模等方面,讨论该领域研究的未来发展方向。
事件抽取方法综述:深度学习与预训练对比分析
王嘉宾, 罗俊仁, 周棪忠, 王超, 张万鹏
计算机科学. 2024, 51 (9): 196-206.  doi:10.11896/jsjkx.231000123
摘要 ( 183 )   PDF(4247KB) ( 414 )   
参考文献 | 相关文章 | 多维度评价
事件抽取是伴随着信息技术的发展而诞生的。随着人们对从繁多的日常信息中抽取出有用信息的需求日益增强,事件抽取的研究发展也越发受重视。首先,介绍了事件抽取的发展历程,理清了事件抽取的发展脉络;其次,介绍了事件抽取的2种范式,并对管道型抽取和联合型抽取范式进行了对比分析;再次,围绕事件抽取的层级,分别从句子级事件抽取和篇章级事件抽取2个层面对近年来事件抽取的发展进行了梳理;然后,从传统型事件抽取方法、基于深度学习的事件抽取方法,以及基于预训练模型的事件抽取方法3个方面对事件抽取方法进行了对比分析;最后,介绍了事件抽取的典型应用场景,并根据事件抽取的发展现状,对未来事件抽取前沿发展进行了展望。
基于双编码器的多模态融合方法
黄晓飞, 郭卫斌
计算机科学. 2024, 51 (9): 207-213.  doi:10.11896/jsjkx.230700212
摘要 ( 186 )   PDF(2572KB) ( 366 )   
参考文献 | 相关文章 | 多维度评价
双编码器模型比融合编码器模型具有更快的推理速度,且能在推理过程中对图像和文本进行预计算。然而,双编码器模型中使用的浅交互模块不足以处理复杂的视觉语言理解任务。针对上述问题,提出了一种新的多模态融合方法。首先,提出一种前交互式桥塔结构(PBTS),在单模态编码器的顶层和跨模态编码器的每层之间建立连接,使得不同语义层次的视觉和文本表示之间能够进行全面、自下而上的交互,从而实现更有效的跨模态对齐和融合。同时,为了更好地学习图像和文本的深度交互,提出了一种两阶段跨模态注意力双蒸馏方法(TCMDD),使用融合编码器模型作为教师模型,在预训练阶段和调优阶段同时对单模态编码器及融合模块的跨模态注意力矩阵进行知识蒸馏。使用400万张图片进行预训练并在3个公开数据集上进行调优来验证该方法的有效性。实验结果表明,所提多模态融合方法在多个视觉语言理解任务中获得了更优的性能。
基于半监督学习的域适应实体解析算法
戴超凡, 丁华华
计算机科学. 2024, 51 (9): 214-222.  doi:10.11896/jsjkx.230800102
摘要 ( 126 )   PDF(2191KB) ( 373 )   
参考文献 | 相关文章 | 多维度评价
实体解析旨在查找两个数据实体是否引用同一实体,是许多自然语言处理任务中的一项基本任务。现有的基于深度学习的实体解析解决方案通常需要大量的标注数据,即使利用预训练的语言模型进行训练,仍然需要数千个标签才能达到令人满意的准确性。现实场景中,这些标注数据并不容易获得。针对上述问题,提出了一个基于半监督学习的域适应实体解析模型。首先,在源域上训练一个分类器,然后利用域适应减小源域和目标域的分布差异,同时用数据增强后的目标域软伪标签加入源域迭代训练,从而实现从源域到目标域的知识迁移。在13个来自相同或不同领域的数据集上对所提模型进行了对比实验和消融实验,实验结果表明,与无监督基线模型相比,所提模型在多个数据集上的F1值平均提升了2.84%,9.16%和7.1%;与有监督基线模型相比,所提模型只需要20%~40%的标签就可以达到与有监督学习相当的性能。消融实验进一步证明了所提模型的有效性,其总体上可以获得更好的实体解析结果(相关代码已开源1))。
基于PPO算法的不同驾驶风格跟车模型研究
闫鑫, 黄志球, 石帆, 徐恒
计算机科学. 2024, 51 (9): 223-232.  doi:10.11896/jsjkx.230700131
摘要 ( 154 )   PDF(2921KB) ( 341 )   
参考文献 | 相关文章 | 多维度评价
自动驾驶对于减少交通堵塞、提高驾驶舒适性具有非常重要的作用,如何提高人们对自动驾驶技术的接受程度仍具有重要的研究意义。针对不同需求的人群定制不同的驾驶风格,可以帮助驾驶人理解自动驾驶行为,提高驾驶人的乘车体验,在一定程度上消除驾驶人对使用自动驾驶系统的心理抵抗性。通过分析自动驾驶场景下的跟车行为,提出基于PPO算法的不同驾驶风格的深度强化学习模型设计方案。首先分析德国高速公路车辆行驶数据集(HDD)中大量驾驶行为轨迹,根据跟车时距(THW)、跟车距离(DHW)、行车加速度以及跟车速度特征进行归类,提取激进型的驾驶风格和稳健型的驾驶风格的特征数据,以此为基础编码能够反映驾驶人风格的奖励函数,经过迭代学习生成不同驾驶风格的深度强化学习模型,并在highway env平台上进行道路模拟。实验结果表明,基于PPO算法的不同风格驾驶模型具有完成任务目标的能力,且与传统的智能驾驶模型(IDM)相比,能够在驾驶行为中准确反映出不同的驾驶风格。
CFGT:一种基于词典的中文地址要素解析模型
黄威, 沈耀迪, 陈松龄, 傅湘玲
计算机科学. 2024, 51 (9): 233-241.  doi:10.11896/jsjkx.230900159
摘要 ( 140 )   PDF(3862KB) ( 368 )   
参考文献 | 相关文章 | 多维度评价
地址要素解析作为地理编码过程中的关键环节,直接影响到地理编码的准确性。由于中文地址表达的多样性和复杂性,两段相似的地址文本在地理表示上却可能完全不同。传统的通过词典匹配进行地址要素解析的方法无法较好地应对歧义词,从而导致识别准确率欠佳。文中提出一种基于词典的中文地址要素解析模型( Collaborative Flat-Graph Transformer,CFGT),利用自匹配词、最近上下文等词汇信息增强地址文本字符序列表示,有效遏制了地址文本表达的歧义性。具体地,模型首先构建Flat-Lattice和Flat-Shift两种协作图,为地址字符捕获自匹配词和最近上下文词汇的知识,并设计融合层实现图之间的协作;其次,通过改进的相对位置编码,进一步强化词信息对地址文本字符序列的增强效果;最后,利用Transformer和条件随机场进行地址要素解析。在Weibo和Resume等多个公开数据集及Address私有数据集上开展的实验表明,CFGT模型的性能优于已有的中文地址要素解析模型和中文命名实体识别模型。
基于文本和图像门控融合机制的多模态方面级情感分析
张添植, 周刚, 刘洪波, 刘铄, 陈静
计算机科学. 2024, 51 (9): 242-249.  doi:10.11896/jsjkx.230600117
摘要 ( 218 )   PDF(2445KB) ( 402 )   
参考文献 | 相关文章 | 多维度评价
多模态方面级情感分析是多模态情感分析领域的一项新兴任务,旨在对给定的方面实体在文本和图像中所体现的情感进行识别。尽管多模态方面级情感分析研究近年来取得了突破性的进展,但是现有的模型在多模态特征融合阶段大都仅采用简单的拼接方法,而没有考虑图像中是否存在与文本语义不相关的信息,这在一定程度上可能会为模型引入额外的噪声。为了解决上述问题,提出了一种基于文本和图像门控融合机制的多模态方面级情感分析模型(TIGFM)。该模型在文本和图像进行交互的同时引入了从数据集图像中提取的形容词-名词对(ANPs),并将其中形容词的加权作为图像辅助信息;此外,在特征融合阶段,通过构建一种动态控制图像和图像辅助信息输入的门控机制实现多模态特征融合。实验结果表明,TIGFM模型在两个基于Twitter的数据集上取得了具有竞争力的结果,进而验证了所提方法的有效性。
基于视觉语义与提示学习的多模态情感分析模型
莫书渊, 蒙祖强
计算机科学. 2024, 51 (9): 250-257.  doi:10.11896/jsjkx.230600047
摘要 ( 225 )   PDF(2712KB) ( 404 )   
参考文献 | 相关文章 | 多维度评价
随着深度学习技术的发展,多模态情感分析已成为研究热点之一。然而,大多数多模态情感分析模型或从不同模态中提取特征向量并简单地进行加权求和,导致数据无法准确地映射到统一的多模态向量空间中,或依赖图像描述模型将图像转化为文本,导致提取到过多不包含情感信息的视觉语义,造成信息冗余,最终影响模型的性能。为了解决这些问题,提出了一种基于视觉语义与提示学习的多模态情感分析模型VSPL。该模型将图像转化为精确简短、蕴含情感信息的视觉语义词汇,从而缓解信息冗余的问题;并基于提示学习的方法,将得到的视觉语义词汇与针对情感分类任务而提前设计好的提示模板组合成新文本,实现模态融合,这样做既避免了由加权求和导致的特征空间映射不准确的问题,又能借助提示学习的方法激发预训练语言模型的潜在性能。对多模态情感分析任务进行了对比实验,结果表明所提模型VSPL在3个公开数据集上的性能超越了先进的基准模型。此外,还进行了消融实验、特征可视化和样例分析,验证了VSPL的有效性。
基于多尺度跨模态特征融合的图文情感分类模型
刘倩, 白志豪, 程春玲, 归耀城
计算机科学. 2024, 51 (9): 258-264.  doi:10.11896/jsjkx.230700163
摘要 ( 147 )   PDF(2991KB) ( 417 )   
参考文献 | 相关文章 | 多维度评价
图文情感分类任务常用早期融合和Transformer模型相结合的跨模态特征融合策略进行图文特征融合,但该策略更倾向于关注模态内部的独有信息,而忽略了模态间的相互联系和共有信息,导致跨模态特征融合效果不理想。针对此问题,提出一种基于多尺度跨模态特征融合的图文情感分类方法。局部尺度方面,基于跨模态注意力机制进行局部特征融合,使模型不仅关注图像和文本的独有信息,而且可以发现图像和文本之间的联系和共有信息。全局尺度方面,基于MLM损失进行全局特征融合,使模型对图像和文本数据进行全局建模,进一步挖掘图像和文本之间的联系,从而促进图像和文本特征的深度融合。在两个公开数据集MVSA-Single和MVSA-Multiple上与10个基线模型进行对比实验,结果表明所提方法在精度、F1值和模型参数量方面均具有明显优势,验证了其有效性。
基于不确定性权重的保守Q学习离线强化学习算法
王天久, 刘全, 乌兰
计算机科学. 2024, 51 (9): 265-272.  doi:10.11896/jsjkx.230700151
摘要 ( 137 )   PDF(2886KB) ( 387 )   
参考文献 | 相关文章 | 多维度评价
离线强化学习(Offline RL)中,智能体不与环境交互而是从一个固定的数据集中获得数据进行学习,这是强化学习领域研究的一个热点。目前多数离线强化学习算法对策略训练过程进行保守正则化处理,训练策略倾向于选择存在于数据集中的动作,从而解决离线强化学习中对数据集分布外(OOD)的状态-动作价值估值错误的问题。保守Q学习算法(CQL)通过值函数正则赋予分布外状态-动作较低的价值来避免该问题。然而,由于该算法正则化过于保守,数据集内的分布内状态-动作也被赋予了较低的价值,难以达到训练策略选择数据集中动作的目的,因此很难学习到最优策略。针对该问题,提出了一种基于不确定性权重的保守Q学习算法( UWCQL)。该方法引入不确定性计算,在保守Q学习算法的基础上添加不确定性权重,对不确定性高的动作给予更高的保守权重,使得策略能更合理地选择数据集分布内的状态-动作。将UWCQL算法应用于D4RL的MuJoCo数据集中进行了实验,实验结果表明,UWCQL算法具有更好的性能表现,从而验证了算法的有效性。
基于分阶段自编码器与注意力机制的舰载机着舰航迹实时预测模型
李哲, 刘奕阳, 王可, 杨杰, 李亚飞, 徐明亮
计算机科学. 2024, 51 (9): 273-282.  doi:10.11896/jsjkx.230700149
摘要 ( 144 )   PDF(4363KB) ( 365 )   
参考文献 | 相关文章 | 多维度评价
航空母舰舰载机着舰过程中应沿相对固定的航迹下滑,以保证触舰点位于舰艉拦阻系统所在的区域,因此舰载机航迹是着舰信号官进行指挥决策的重要依据之一。舰载机航迹实时预测有助于着舰信号官判断着舰作业发展态势,及时形成正确的航迹纠偏引导指令。为此,提出一种基于分阶段自编码器与注意力机制的着舰航迹实时预测模型。第一阶段采用降噪自编码器对历史航迹数据进行特征提取;第二阶段基于长短期记忆网络构建时序自编码器,同时引入注意力机制对不同时刻的编码器输出分配不同的权重,自适应学习其对最终预测结果的影响强度。通过仿真实验将所提模型与6种基线模型进行对比,结果表明,所提模型的综合性能优于基线模型,能够满足着舰航迹实时准确预测的应用需求。
基于离散变邻域蜉蝣优化的装配作业车间调度算法
陈雅莉, 潘友林, 刘耿耿
计算机科学. 2024, 51 (9): 283-289.  doi:10.11896/jsjkx.230900086
摘要 ( 100 )   PDF(1784KB) ( 332 )   
参考文献 | 相关文章 | 多维度评价
由于受到疫情影响,企业迫切地需要通过升级改造自动化柔性生产线来实现降本增效。在这一背景下,装配作业车间调度问题(Assembly Job Shop Scheduling Problem,AJSSP)再一次成为学术界和企业界的研究热点。AJSSP比普通作业车间调度问题多了一道装配阶段,故其存在前后工序相互制约和多机并行现象,问题求解也更加复杂。针对该问题,提出了一种基于离散变邻域蜉蝣优化算法(Discrete Variable Neighborhood Mayfly Algorithm,D-VNMA)的调度方法,主要工作如下:1)采用符合Lamarkian特性的编码解码机制,实现个体有效信息的迭代继承;2)使用Circle映射融合常见启发式算法初始化蜉蝣种群,保证种群的多样性;3)加入新的邻域探索策略,采用多种不同的邻域结构和搜索策略的差异组合,增加搜索方案的多样性,提高寻找局部最优解的搜索效率;4)提出改进的雌雄蜉蝣交配策略,提高算法全局探索能力,加快算法整体收敛速度。在实验过程中,通过试验设计(Design of Experiment,DOE)方法获得D-VNMA的最佳参数设置,并在不同规格AJSSP算例数据上将D-VNMA和其他算法进行比较。实验结果表明,D-VNMA得到最优解的概率提升了30%,且收敛效率最高可提升62.15%。
考虑无人艇运动学约束的IRRT*-APF路径规划算法
刘意, 齐洁
计算机科学. 2024, 51 (9): 290-298.  doi:10.11896/jsjkx.230900017
摘要 ( 146 )   PDF(3154KB) ( 363 )   
参考文献 | 相关文章 | 多维度评价
针对未知环境下无人艇(USV)的路径规划问题,提出了一种考虑无人艇运动学约束的改进RRT*-APF路径规划算法(IRRT*- APF)。通过引入改进的人工势场法(APF)提高了快速搜索随机树(RRT*)的避障性能,在人工势场中考虑无人艇与障碍物和目标点间的角度大小,加速了无人艇远离障碍物并接近目标点;使用曼哈顿距离法提高了RRT*算法的效率。所提出的IRRT*-APF方法,与滚动RRT*算法和PSOFS算法进行了仿真对比实验。结果表明,提出的方法所规划的路径转折的次数和转角均显著减小,有利于实现无人艇的平稳控制,同时缩短了路径长度和规划路径的时间。在风浪环境下的进一步仿真实验结果表明,所提出的算法在有风浪干扰时依然能规划出符合无人艇运动学的轨迹,具有较强的抗风浪鲁棒性。
基于时空间联合去噪的改进差分进化算法
王彬, 张鑫雨, 金海燕
计算机科学. 2024, 51 (9): 299-309.  doi:10.11896/jsjkx.230600074
摘要 ( 104 )   PDF(3066KB) ( 323 )   
参考文献 | 相关文章 | 多维度评价
在工程问题的优化求解过程中,对个体的适应度评价可能会受到环境噪声的干扰,进而影响对种群进行合理的优胜劣汰操作,造成算法性能下降。为了对抗噪声环境的影响,提出了一种基于时空间联合去噪的改进差分进化算法(SEDADE)。根据适应度排名将种群划分成两个子种群,对评价较差个体组成的子种群用分布估计算法(EDA)进化,采用高斯分布建模解空间,利用解空间中多个个体噪声的随机性抵消噪声影响;对评价较好个体组成的子种群用差分进化算法(DE)进化,并且引入基于时间的停滞重采样机制去噪,提高收敛精度。对时空间混合进化得到的两个子种群进行基于概率选择的EDA信息利用操作,利用EDA搜索得到的全局信息引导DE的搜索方向,避免陷入局部最优。在实验中使用了被零均值高斯噪声干扰的基准函数,可以发现SEDADE相比其他算法更具有竞争性,此外通过消融实验验证了所提算法包含的3个机制的有效性和合理性。
CCSD:面向话题的讽刺识别方法
刘其龙, 李弼程, 黄志勇
计算机科学. 2024, 51 (9): 310-318.  doi:10.11896/jsjkx.230600217
摘要 ( 130 )   PDF(1988KB) ( 368 )   
参考文献 | 相关文章 | 多维度评价
随着社交媒体的发展,越来越多的人在社交平台上发表对热点话题的看法,其中讽刺手法的运用严重影响了社交媒体中情感分析的精度。目前面向话题的讽刺识别研究未同时考虑上下文和常识知识的作用,也忽略了在同一个话题下进行讽刺识别的场景。为此,提出了基于上下文和常识的讽刺识别模型(Sarcasm Detection with Context and Common Sense,CCSD)。首先,模型使用C3KG常识库生成常识文本,并将目标句、话题上下文和常识文本作为预训练BERT模型的输入。其次,使用注意力机制来关注目标句和常识中重要的信息。最后,通过门控机制和特征融合,实现讽刺识别。文中构建了一个面向话题的讽刺识别数据集,以验证模型在特定话题中的有效性。实验结果表明,相比基线模型,新模型的性能更优。
计算机网络
面向多目标状态感知的自适应云边协同调度研究
周文晖, 彭清桦, 谢磊
计算机科学. 2024, 51 (9): 319-330.  doi:10.11896/jsjkx.240200036
摘要 ( 142 )   PDF(3627KB) ( 353 )   
参考文献 | 相关文章 | 多维度评价
随着智能城市和工业智能制造的蓬勃发展,从监控摄像头获取详尽信息以进行多目标视觉分析的需求日益突出。现有研究主要关注在服务器上进行资源调度以及改良视觉模型,往往不能很好地应对设备资源状态和任务状态的动态变化。随着边缘端硬件资源的升级和任务处理模型的改进,设计一个自适应的云边协同调度模型来满足任务的实时用户需求成为优化多目标状态感知任务的重要方式。因此,在深入分析云边场景下多目标状态感知任务特性的基础上,提出了一种基于深度强化学习的自适应云边协同调度模型ATS-SAC。ATS-SAC通过实时解析多目标状态感知任务的运行时状态,动态给出任务执行的视频流配置、模型部署配置等调度决策,从而显著优化环境不稳定的云边场景下多目标状态感知任务的精度、时延的综合性能质量。同时,还引入了一种基于用户体验极限阈值的动作筛选方法,有助于去除冗余的决策动作,进一步优化模型的决策空间。针对用户对多目标状态感知任务性能结果的不同需求,ATS-SAC模型能提供包括极速模式、均衡模式和精度模式在内的多种灵活的调度策略。实验结果表明,相比其他的任务执行方式,在ATS-SAC模型的调度策略下,多目标状态感知任务在精度质量和处理时延上更能满足用户的体验需求。同时,当实时运行状态变化时,ATS-SAC模型能够动态调整其调度策略,以保持稳定的任务处理效果。
面向轨道交通智能故障检测的边云计算方法
李志, 林森, 张强
计算机科学. 2024, 51 (9): 331-337.  doi:10.11896/jsjkx.231200190
摘要 ( 97 )   PDF(2241KB) ( 323 )   
参考文献 | 相关文章 | 多维度评价
轨道交通系统是当今社会中交通运力的主要承载系统,对安全性有极高的要求。轨道交通系统的多个组件由于直接暴露在环境中,受多种外界因素影响,易出现故障。这些故障可能会导致列车延误、乘客滞留、服务暂停,甚至是灾难性的生命或资产损失。因此,需要设计针对轨道交通系统的实时故障检测方案,进而才能采取有效的维护措施。不同于基于传统的机器学习(Machine Learning,ML)的故障检测工作,本研究采用中文双向编码器表示转换器(Bidirectional Encoder Representation from Transformer,BERT)深度学习(Deep Learing,DL)模型进行实时的智能故障检测。该模型能够在处理故障检测任务时获取双向上下文的理解,从而更准确地捕捉句子中的语义关系,使得其对故障描述的理解更为精准。BERT的训练需要大量的数据支持,而轨道交通领域中存在多个运营商,它们各自持有独立的故障检测数据。由于数据的保密性,这些数据无法进行共享,从而限制了模型的训练,故采用了联邦边云计算方法,允许多个运营商在保持数据隐私的前提下共同训练BERT模型。联邦学习结合边云计算方法,在本地对轨道交通各运营商的数据进行初步处理,然后将汇总后的梯度上传至云端进行模型训练,最终将训练得到的模型参数发送回各边缘设备,实现模型的更新。研究结果表明,采用联邦边云计算方法进行BERT模型训练,在轨道交通领域的故障检测任务中优于目前已有的先进方案。这一方法在解决数据保密性问题的同时,有效提升了轨道交通故障检测的准确性与可靠性。
面向电台通信的CLU-Net语音增强网络
姚瑶, 杨吉斌, 张雄伟, 李毅豪, 宋宫琨琨
计算机科学. 2024, 51 (9): 338-345.  doi:10.11896/jsjkx.230700200
摘要 ( 99 )   PDF(3019KB) ( 319 )   
参考文献 | 相关文章 | 多维度评价
为了消除电台系统中的环境噪声和信道噪声对语音通信质量的不利影响,提升电台语音通信的质量,提出了一种基于联合通道注意力与长短时记忆网络(Long Short Term Memory,LSTM)的深度可分离U形网络CLU-Net(Channel Attention and LSTM-based U-Net)。该网络采用深度可分离卷积实现低复杂度的特征提取,联合利用注意力机制和LSTM同时关注语音通道特征和长时上下文联系,在参数量较少的情况下实现对干净语音特征的关注。在公开与实测数据集上进行多组对比实验,仿真结果表明,所提方法在VoiceBank-DEMAND数据集上的PESQ和STOI等指标得分优于同类语音增强模型。实测实验结果表明,所提CLU-Net增强框架能够有效抑制环境噪声与信道噪声,在低信噪比条件下的增强性能优于其他同类型的增强网络。
增广立方体上边独立生成树的并行构造
李夏晶, 程宝雷, 樊建席, 王岩, 李晓瑞
计算机科学. 2024, 51 (9): 346-356.  doi:10.11896/jsjkx.230700041
摘要 ( 129 )   PDF(3639KB) ( 318 )   
参考文献 | 相关文章 | 多维度评价
近年来,围绕互连网络的研究工作越来越多。其中独立生成树(Independent Spanning Trees,ISTs)可以应用于信息的可靠传输、并行传输、安全分发以及故障服务器的并行诊断中,因此受到了许多研究者的关注。在一对多广播、可靠通信、多节点广播、容错广播、安全消息分发、IP快速重路由等网络通信中,边独立生成树(Edge-Independent Spanning Trees,EISTs)发挥着重要作用。n维增广立方体AQn是n维超立方体Qn的节点对称变型,它具有超立方体及其变型所没有的一些可嵌入性质。然而,目前增广立方体上边独立生成树的构造方法都是串行构造的。文中首先提出了一种并行算法,用于构造以AQn中的任意节点为根的2n-1棵树。然后证明算法得到的2n-1棵树是高度为n的边独立生成树,算法的时间复杂度为O(N),其中N表示增广立方体中的节点数。最后通过模拟实验来验证了所提方法的准确性。
面向集成的VPN解决方案
陶志勇, 阳王东
计算机科学. 2024, 51 (9): 357-364.  doi:10.11896/jsjkx.240200062
摘要 ( 91 )   PDF(3947KB) ( 362 )   
参考文献 | 相关文章 | 多维度评价
针对传统方式构建的VPN不支持承载多种数据类型、承载数据缺乏安全性、标签边缘设备负载过重等问题,提出了集成的VPN解决方案。该方案设计包含GRE VPN的建立、IPSEC VPN的建立、网络设备虚拟化、MPLS VPN的建立、私网数据的识别与隔离5个关键步骤,实现了各VPN技术数据的嵌套与各VPN技术的相互融合,融合后的VPN既支持承载多种数据类型,又支持数据交互的安全,且能实现私网数据访问控制与地址复用,还能实现数据的负载分担。为验证方案的可行性,对方案建立的隧道、网络资源池、标签转发路径等方面进行了测试与验证,达到了预期设定的目标。为凸显方案的优势,与传统方式在背板带宽、端口速率等方面进行了对比分析。分析结果表明,该方案的背板带宽与端口速率随着资源池中设备数的增加而增长,其数据传输能力相比传统方式成倍增长,且在数据的负载分担、数据安全、可管理性与可维护性等方面优于传统方案,为构建实用、可靠、安全的VPN提供了思路。
信息安全
基于图神经网络的SSL/TLS加密恶意流量检测算法研究
唐瑛, 王宝会
计算机科学. 2024, 51 (9): 365-370.  doi:10.11896/jsjkx.230800079
摘要 ( 241 )   PDF(2108KB) ( 436 )   
参考文献 | 相关文章 | 多维度评价
为实现SSL/TLS加密恶意流量的精准检测,针对传统机器学习方法过分依赖专家经验的问题,提出一种基于图神经网络的恶意加密流量检测模型。通过对SSL/TLS加密会话进行分析,利用图结构对流量会话交互信息进行表征,将恶意加密流量检测问题转化为图分类问题。生成的模型基于分层图池化架构,通过多层卷积池化的聚合,结合注意力机制,充分挖掘图中节点特征和图结构信息,实现了端到端的恶意加密流量检测方法。基于公开数据集CICAndMal2017进行验证,实验结果表明,所提模型在加密恶意流量二分类检测中,准确率高达97.1%,相较于其他模型,准确率、召回率、精确率、F1分数分别提升了2.1%,3.2%,1.6%,2.1%,说明所提方法对于恶意加密流量的表征能力和检测能力优于其他方法。
融合多模态物联网设备指纹与集成学习的物联网设备识别方法
卢徐霖, 李志华
计算机科学. 2024, 51 (9): 371-382.  doi:10.11896/jsjkx.230800076
摘要 ( 123 )   PDF(6754KB) ( 366 )   
参考文献 | 相关文章 | 多维度评价
现有物联网设备识别方法存在表征设备指纹的特征维度单一、流量特征信息选择不完备的问题,导致对流量特征的表征能力不足,且未充分挖掘多个网络模型的识别潜能,进而导致识别效果不够理想。针对上述不足,文中提出了一种融合多模态物联网设备指纹与集成学习的物联网设备识别(MultiDI)方法。首先,为了在保证流量特征信息不丢失的同时,提高物联网设备指纹的特征表示能力,通过将改进的Nilsimsa算法和数据图像化处理方法相结合,研究并提出一种多模态物联网设备指纹生成算法;然后,基于所生成的物联网设备指纹特征,使用3个神经网络模型深入挖掘多模态指纹特征的不同维度信息,对物联网设备的流量特征进行更充分的学习和识别;最后,为了进一步挖掘多个网络模型的识别潜能,通过分类加权和LeakyRelu激活函数构建分类连接网络,借助所提出的分类连接网络进行集成学习,用以整合多个网络模型的识别结果从而增强MultiDI方法的物联网设备识别准确率。实验结果表明,MultiDI方法在3个数据集上分别取得了91.3%,98.6%和99.2%的加权F1值,验证了该方法的有效性;与多种物联网设备识别方法相比,在识别效果上呈现出相对优势,验证了该方法的高效性。
基于深度学习的Linux系统DKOM攻击检测
陈亮, 孙聪
计算机科学. 2024, 51 (9): 383-392.  doi:10.11896/jsjkx.230700035
摘要 ( 125 )   PDF(1723KB) ( 349 )   
参考文献 | 相关文章 | 多维度评价
直接内核对象操纵(DKOM)攻击通过直接访问和修改内核对象来隐藏内核对象,是主流操作系统长期存在的关键安全问题。对DKOM 攻击进行基于行为的在线扫描适用的恶意程序类型有限且检测过程本身易受DKOM攻击影响。近年来,针对潜在受DKOM攻击的系统进行基于内存取证的静态分析成为一种有效和安全的检测方法。现有方法已能够针对Windows内核对象采用图神经网络模型进行内核对象识别,但不适用于Linux系统内核对象,且对于缺少指针字段的小内核对象的识别有效性有限。针对以上问题,设计并实现了一种基于深度学习的Linux系统DKOM 攻击检测方案。首先提出了一种扩展内存图结构刻画内核对象的指针指向关系和常量字段特征,利用关系图卷积网络对扩展内存图的拓扑结构进行学习以实现内存图节点分类,使用基于投票的对象推测算法得出内核对象地址,并通过与现有分析框架Volatility的识别结果对比实现对Linux系统DKOM攻击的检测。提出的扩展内存图结构相比现有的内存图结构能更好地表示缺乏指针但具有常量字段的小内核数据结构的特征,实现更高的内核对象检测有效性。与现有基于行为的在线扫描工具chkrootkit相比,针对5种现实世界Rootkit的DKOM行为,所提方案实现了更高的检测有效性,精确度提高20.1%,召回率提高32.4%。
基于Geohash的增强型位置k-匿名隐私保护方案
李勇军, 祝跃飞, 白利芳
计算机科学. 2024, 51 (9): 393-400.  doi:10.11896/jsjkx.230800183
摘要 ( 115 )   PDF(2245KB) ( 338 )   
参考文献 | 相关文章 | 多维度评价
随着LBS的广泛应用,位置隐私保护势在必行。近年来,作为应用较为广泛的位置k-匿名解决方案已成为研究热点,但k-匿名方案易受到敌手背景知识攻击,虽有学者们不同程度地考虑了位置相关的信息,但都不全面,并且当前形成匿名区的方案大多较为耗时。基于此,为抵御敌手的语义攻击和查询及位置同质性攻击,提出了增强型位置k-匿名方案,在匿名区构建时充分考虑与物理位置相关的语义信息、时间属性、查询概率及查询语义等信息;然后在进行位置选取时,保证所选位置相对分散;为降低匿名区构建时耗,采用Geohash进行位置编码;最后通过真实数据集上的实验表明,所提方案可提供较好的位置隐私保护。
基于注意力特征解耦的跨年龄身份成员推理
刘宇璐, 武淑红, 于丹, 马垚, 陈永乐
计算机科学. 2024, 51 (9): 401-407.  doi:10.11896/jsjkx.230600112
摘要 ( 121 )   PDF(3635KB) ( 366 )   
参考文献 | 相关文章 | 多维度评价
生成对抗网络(GANs)模型可以生成高分辨率的“不存在”的物体真实图像,近期被广泛应用于各种人工合成数据,尤其是人脸图像生成领域。然而,由于基于该模型的人脸生成器通常需要根据不同身份高度敏感的面部图像进行训练,其中存在潜在数据泄露使得攻击者能够对身份成员关系进行推断的问题。为此,首先设计对查询身份所获取样本与其实际参与训练样本之间存在巨大差异时的身份成员推理攻击,这些差异会导致基于样本推理身份成员关系的性能急剧下降;其次,在此基础上设计基于各身份解耦表征的重建误差攻击方案,在最大化消除不同样本间背景姿势等因素影响的同时,消除巨大年龄跨度导致的表征差异,进一步提高了攻击性能;最后,基于3个代表性的人脸数据集在3个主流GAN架构上训练生成模型并进行攻击,实验结果表明,在各种攻击场景下,此攻击方案较对比方法AUCROC值平均提高0.2。
基于双默克尔树区块结构的交易粒度联盟链修改方案
王冬, 李笑若, 祝丙南
计算机科学. 2024, 51 (9): 408-415.  doi:10.11896/jsjkx.231000054
摘要 ( 116 )   PDF(2090KB) ( 369 )   
参考文献 | 相关文章 | 多维度评价
随着区块链技术的蓬勃发展,以区块链为底层架构的信息系统已应用于包括数字货币、供应链等众多领域。在监管和实际应用双重需求的驱动下,可修改区块链技术因能够进行安全且权责分明的数据治理而成为当前研究的热点。然而,目前的修改方案中仍然存在修改权限过度中心化、修改效率不高等问题。针对上述问题,提出了一种交易粒度联盟链账本修改方案,构建了双默克尔树区块结构,利用椭圆曲线加密和迪菲-赫尔曼秘钥交换技术将变色龙哈希陷门信息(即变色龙哈希私钥)加密存储在区块中,降低密钥分发的系统通信开销。在此基础之上,通过默克尔树将修改权与用户绑定,修改提案受权限节点投票审查,有效防止了修改权的滥用,进一步提高了区块链系统的监管问责能力。实验表明,该联盟链账本修改方案的算法执行速率整体达到毫秒级,并大幅降低了链上数据修改操作的额外开销。
基于站点地图的Web访问控制漏洞检测方法
任家东, 李尚洋, 任蓉, 张炳, 王倩
计算机科学. 2024, 51 (9): 416-424.  doi:10.11896/jsjkx.230900075
摘要 ( 120 )   PDF(2285KB) ( 341 )   
参考文献 | 相关文章 | 多维度评价
攻击者通常利用Web应用程序的访问控制漏洞实现对系统的非授权访问、信息窃取等恶意行为。针对Web应用程序的访问控制漏洞的检测问题,现有方法由于页面覆盖率低、检测过程开销大等问题,因此漏报率过高且效率低下。为此,基于动态分析,提出了一种基于站点地图的Web访问控制漏洞检测方法。该方法首先为不同角色下的用户分别建立各自的站点地图,并形成不同角色的完整站点地图,再通过对其分析生成Web应用程序预期访问控制策略,构建非法测试用例进行动态访问并分析执行结果实现对未授权访问、越权访问等类型访问控制漏洞的检测。最后,在7个真实开源Web应用程序中对所提方法进行验证,结果表明该方法能有效降低开销,其页面覆盖率达到90%以上;发现了10个真实漏洞,准确率达到了100%。