1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2025年第5期, 刊出日期:2025-05-15
  
封面下载
目录
第52卷第5期目录
计算机科学. 2025, 52 (5): 0-0. 
摘要 ( 90 )   PDF(360KB) ( 89 )   
相关文章 | 多维度评价
高性能计算
AI+HPC:“智能+”驱动下的超算系统软件及应用技术发展综述
谭政源, 钟佳卿, 陈娟
计算机科学. 2025, 52 (5): 1-10.  doi:10.11896/jsjkx.241100177
摘要 ( 227 )   PDF(2035KB) ( 199 )   
参考文献 | 相关文章 | 多维度评价
人工智能(AI)和高性能计算(HPC)是计算机领域的两大重要技术。随着计算机技术的飞速发展,二者的联系逐渐紧密,并呈现出互相依赖、互相促进的关系。一方面,高性能计算系统面临的各种新问题与新挑战,需要人工智能方法技术辅助解决(AI for HPC);另一方面,人工智能领域理论的突破,依赖于HPC提供的强大的计算能力(HPC for AI)。在这样的背景下,AI和HPC两领域交叉融合,深度发展。文中系统回顾了近年来AI和HPC两个领域各自技术的发展脉络,着重从以下几方面展开分析:1)AI技术在解决HPC硬件体系结构、操作系统资源管理、编译优化和软件开发等几个方面问题的贡献;2)HPC为AI在硬件基础设施及软件应用上的支持;3)AI和HPC领域融合的未来发展前景与挑战。
面向国产超算的操作系统评测与优化
高亦沁, 罗智宇, 王一超, 林新华
计算机科学. 2025, 52 (5): 11-24.  doi:10.11896/jsjkx.240500103
摘要 ( 103 )   PDF(5755KB) ( 147 )   
参考文献 | 相关文章 | 多维度评价
超级计算机是“国之重器”,我国在“十四五”期间建设后E级国产超算,支撑关系国计民生的重大计算应用。操作系统作为超算核心系统软件之一,其开销将影响超算整机的运行性能,因此操作系统测评成为新一代国产超算技术路线的重要研究课题之一。openEuler在搭载了鲲鹏处理器的系统上有良好的性能与兼容性,但尚未在超算领域有过大规模应用,因此需要对其性能进行全面评测,并对存在的性能瓶颈进行优化。文中的工作分为两个部分。1)对openEuler在超算系统上的性能开展了评测,并以CentOS为参考对象进行了对比。结果表明,在运行非集合通信密集型应用时,openEuler的性能与CentOS相当。然而,在使用OpenMPI进行Allreduce等集合通信操作时,openEuler的性能会降低最多76.83%,并导致千核规模下通信密集型应用的性能降低最多23.01%。2)基于在评测过程中发现的MPI集合通信性能问题,提出了一种性能建模与优化方法。该方法基于点对点通信的霍克尼模型,为集合通信各实现算法进行建模,以预测不同进程数量和消息大小下的通信时间,从而选择合适的集合通信实现算法。所提方法可通过OpenMPI的MCA接口在运行时动态调整实现算法的选择。优化后,openEuler上的科学计算应用性能提升显著,运行时间最多缩短了26%。
基于TVM 的变维批处理小矩阵乘法的加速及应用
戴翰文, 陈长波
计算机科学. 2025, 52 (5): 25-40.  doi:10.11896/jsjkx.240500052
摘要 ( 109 )   PDF(4815KB) ( 126 )   
参考文献 | 相关文章 | 多维度评价
很多实际应用中需要高效计算大量不同维度的小矩阵乘积,如基于图神经网络的图分类需要将多个邻接矩阵与节点特征矩阵相乘。针对现有方法无法跨不同硬件平台高效计算此类维度各异(简称变维)批处理小矩阵乘法的问题,基于深度学习编译器TVM,提出了一种可以跨平台的高效算法BVSM,通过为小矩阵特制优化模板、运用张量化批处理和分组填充等技术使得TVM可以高效进行变维批处理小矩阵乘法。在真实图分类任务数据集上的实验表明,在CPU 端,BVSM相较于自动调度和调优的TVM(AnsorTVM)平均获得两倍以上加速,平均性能达到Intel MKL变维批处理矩阵乘法的95%,最高为其1.27倍;在 GPU 端,BVSM相较于AnsorTVM 平均获得62.05倍的加速,相较于cuBLAS平均获得28.82倍的加速,相较于MAGMA 的变维批处理矩阵乘法平均获得6.59倍的加速。
并行计时偏差评测指标及工具
廖秋承, 周洋, 林新华
计算机科学. 2025, 52 (5): 41-49.  doi:10.11896/jsjkx.241200053
摘要 ( 83 )   PDF(3624KB) ( 91 )   
参考文献 | 相关文章 | 多维度评价
在并行计算程序中插桩计时,是多核处理器中常用的性能测量和分析手段。然而,高精度并行计时的准确性受到计时方法、硬件配置和运行时环境等影响,测量结果不稳定,性能分析结论难以复现。近年来,高性能多核处理器的核心数量不断攀升,给多核心并行计时的准确性带来了更大挑战。目前,在真实计算程序中,高精度并行计时技术面临两大问题:1)无法定量比较不同计时函数的准确性;2)无法定量分析多种因素影响下微秒、毫秒级并行计时分布的偏差幅度。针对上述问题,首先设计了用于定量评测计时结果统计学分布偏差的指标,并开发了支持X86和Armv8指令集的多核心计时结果偏差评测工具ParTES。ParTES可以模拟真实计算场景的缓存特征和计时间隔,定量评测不同计时函数的测量偏差。其次,在鲲鹏、飞腾和海光高性能处理器上开展了微秒和毫秒级并行计时稳定性量化分析。实验结果表明,计时方法、缓存命中率、计时函数邻近指令和服务器硬件配置等因素,均会对并行计时结果的准确性产生影响。在鲲鹏、飞腾和海光处理器上,计时结果偏差最小且偏差幅度变化最稳定的计时方法分别是PAPI的计时函数、POSIX的clock_gettime计时函数和C86指令集汇编计时指令RDTSC。
优化器对神经网络力场性能的影响与分析
李恩吉, 胡思宇, 谭光明, 贾伟乐
计算机科学. 2025, 52 (5): 50-57.  doi:10.11896/jsjkx.241100176
摘要 ( 66 )   PDF(4086KB) ( 85 )   
参考文献 | 相关文章 | 多维度评价
分子动力学模拟是一种广泛应用于多个学科(如材料科学、计算化学等)的关键研究方法。近年来,随着计算能力的提升、神经网络模型的发展以及第一性原理数据的增加,神经网络力场模型已经展现出高精度的预测能力。目前存在多种神经网络力场模型的训练算法,而神经网络力场模型处于一个快速迭代的阶段,当前仍然缺乏神经网络力场模型及与之适配的优化器的指导建议。选取3种有代表性的神经网络力场模型和目前3种用于神经网络力场模型上的优化算法,在4个真实数据集上进行测试和评估,分析影响其收敛性的原因。设计实验对其进行全方位的评估,包括模型参数量对优化器的影响,神经网络宽度对收敛性的影响,以及模型训练时间与优化器的关联等。文中工作可以针对神经网络力场模型,给出优化器算法的建议。
面向深度学习编译器TVM的算子融合优化
高伟, 王磊, 李嘉楠, 李帅龙, 韩林
计算机科学. 2025, 52 (5): 58-66.  doi:10.11896/jsjkx.240100018
摘要 ( 57 )   PDF(2705KB) ( 67 )   
参考文献 | 相关文章 | 多维度评价
算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方案存在以下问题:首先,功能特性的算子分类方式下的融合规则不够通用,会错失算子融合机会,无法实现更大粒度的融合;其次,贪心的融合算法也无法实现算子融合的最优解。针对上述问题,对TVM进行改进,提出按照算子输入输出映射类型的算子分类方式,并设计通用的算子融合规则以扩大算子融合的粒度;提出基于动态规划的融合方案搜索算法和算子融合代价评估模型,并对搜索空间进行剪枝,使得算法能够在合理时间内搜索得到优化的融合方案。为评测融合方案的有效性,在CPU以及DCU等平台上对VGG-16,Efficient-B0,MobileNet-V1,YOLO-V4等深度学习模型的融合比和推理时延进行测试,实验结果表明,相较于TVM原有融合方案,所提方案融合比平均提升了27%,推理时延平均获得了1.75的加速比。
TS3:能效优先的特定起点分类最优线程数搜索
马兆阳, 陈娟, 周一畅, 吴贤瑜, 高鹏飞, 阮文浩, 詹昊明
计算机科学. 2025, 52 (5): 67-75.  doi:10.11896/jsjkx.241100175
摘要 ( 54 )   PDF(4508KB) ( 47 )   
参考文献 | 相关文章 | 多维度评价
最优线程数设置是影响多线程程序性能和功耗的关键之一。然而,目前寻找最优线程数的算法通常是从单一固定起点开始搜索,往往会造成搜索精度低、搜索开销大的问题。最优线程数的分布和位置与多种因素有关,包括程序所属类型、优化目标(性能、功耗和 EDP(Energy-delay Product))、并行的多线程区域、软硬件配置参数等。围绕能效优先的最优线程数搜索问题,提出了能效优先的特定起点分类最优线程数搜索算法( Energy-Efficiency-First Optimal Thread Number Search Algorithm based on Specific Starting Point Classification,简称TS3方法)”,通过设计基于程序分类的特殊起点设定方法来确定搜索起点,并采用启发式算法和二分查找方法搜索最优线程数,提升搜索效率,有效提升了能效优先目标(性能最优、功耗最优、能效 EDP 最优)下的最优线程数搜索精度并降低了搜索开销。在两个 x86 和一个 ARM 平台上用 8 个 benchmark 对算法有效性进行了详细实验验证,结果表明,与 Baseline 相比,TS3方法的性能平均提升 0.29%(平台 A)、0.17%(平台 B)、10.77%(平台 C);功耗平均降低 2.35%(平台 A)、1.87%(平台 B)、15.97%(平台 C);EDP 平均降低 6.36%(平台 A)、5.07%(平台 B)、46.94%(平台 C)。在3个平台上,与目前经典搜索方法相比,TS3方法的性能平均提升 10.16%,功耗平均降低13.45%,EDP 平均降低 23.77%;搜索开销平均降低 86.8%。
基于指导语句的函数向量化技术研究
刘丽丽, 单征, 李颖颖, 武文浩, 刘文博
计算机科学. 2025, 52 (5): 76-82.  doi:10.11896/jsjkx.231200174
摘要 ( 49 )   PDF(1748KB) ( 68 )   
参考文献 | 相关文章 | 多维度评价
随着处理器技术的不断发展,SIMD(Single Instruction Multiple Data)向量化已经在各个领域得到广泛的应用。然而,过去的研究主要集中在循环和基本块上,而全函数向量化可以更好地利用SIMD指令的优势,从而提高应用程序的性能。文中提出了一种基于指导语句的函数向量化方法。首先,在涉及函数调用的循环上加上一种较为简单的指导语句,即可对循环中涉及函数调用的指令进行向量化。其次,对于被调函数的向量化采用全函数向量化的方式,生成向量化的全函数而不是对其内联。最后,处理循环中的函数调用点,生成向量化的函数调用指令。这种方法可以充分利用SIMD指令的优势,提高应用程序的性能。从ISPC基准测试和SIMD库基准测试中选取了10个基准测试来评估所提方法,实验结果表明该方法与标量相比,平均加速比达到了6.949倍。
基于RISC-V Matrix指令集扩展的LLM矢量点积加速研究
陈煦豪, 胡思鹏, 刘洪超, 刘伯然, 唐丹, 赵地
计算机科学. 2025, 52 (5): 83-90.  doi:10.11896/jsjkx.241200074
摘要 ( 62 )   PDF(1479KB) ( 71 )   
参考文献 | 相关文章 | 多维度评价
鉴于边缘AI的高性能与低功耗需求,基于 RISC-V 指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效大语言模型(LLM) 推理计算的需求。 针对大语言模型的特性,基于RISC-V指令集扩展了自定义指令完成矢量点积计算,在专用的矢量点积加速硬件上进行大语言模型的运算加速;基于开源高性能RISC-V处理器核“香山”nanhu版本架构,实现了矢量点积专用指令集处理器nanhu-vdot,其在高性能处理器“香山”(nanhu版本)的基础上增加了矢量点积计算单元以及流水线处理逻辑;对nanhu-vdot进行FPGA硬件测试,在几乎没有增加额外的硬件资源和功耗消耗的前提下,矢量点积运算速度相比标量方法提高4倍以上,使用软硬件协同方案进行第二代生成式预训练(Generative Pre-Trained-2,GPT-2)模型推理,相比纯软件实现,速度提高了约30%。
面向脉动阵列加速器的软硬件协同容错设计
魏晓辉, 关泽宇, 王晨洋, 岳恒山, 吴旗
计算机科学. 2025, 52 (5): 91-100.  doi:10.11896/jsjkx.240800055
摘要 ( 55 )   PDF(5124KB) ( 62 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着模型推理精度的不断提高,卷积神经网络(CNN)在安全关键领域得到了广泛应用。为了满足CNN在实时性、高性能和低功耗计算方面的需求,领域专用架构的CNN加速器应运而生。其中,脉动阵列架构凭借其结构简单和高并行度等优势被广泛应用。然而,由于制程变异和设备老化等因素的影响,脉动阵列容易发生Stuck-At故障(SAF),进而可能导致灾难性事故。因此,制定针对脉动阵列的容错策略显得尤为重要。然而,现有的容错策略存在时间和资源开销大、网络参数修改过多等问题。为实现高效且低开销的轻量级容错策略,拟挖掘CNN的固有容错能力,对部分影响较小的SAF进行松弛处理,以减少整体容错开销。同时,充分考虑脉动阵列的计算特性,提出了行(列)交换和权重拆分两种软硬件协同容错设计,有效缓解SAF对模型推理精度的影响。实验结果表明,相较于传统行(列)跳过策略和选择保护策略,所提软硬件协同容错策略在执行效率和模型精度恢复方面更具优势。
基于局部加密网格的LBM程序负载均衡方法研究
黄晨希, 李家辉, 颜辉, 钟英, 卢宇彤
计算机科学. 2025, 52 (5): 101-108.  doi:10.11896/jsjkx.241100169
摘要 ( 46 )   PDF(2821KB) ( 51 )   
参考文献 | 相关文章 | 多维度评价
基于局部加密网格的格子玻尔兹曼方法(LBM),在大规模的非稳态计算流体力学问题中有着越来越广泛的使用。局部网格加密方法虽然可以有效减少计算量,但是也带来了严重的负载均衡问题。尤其是在大规模并行计算中,负载均衡算法的选择对整体的计算效率有重要的影响。使用自研的LBM程序,简单对比了开源框架Palabos的实现结果,然后探讨了基于局部加密网格格子玻尔兹曼方法的静态负载均衡算法。程序中分别基于全局负载和分层负载,使用贪心算法和空间填充曲线算法实现了多种负载均衡策略,提出了计算节点负载均衡优化,并使用小球绕流算例和DrivAer算例进行测试和比较。根据计算结果可知,基于分层负载策略的性能比基于全局负载策略的性能要好;同时,贪心算法和空间填充曲线算法对比各有优劣,前者有较好的可扩展性,而后者在进程数较少时效率较高;最后,基于分层负载,结合贪心算法和空间填充曲线算法实现了混合算法,在进程数较多时获得了最佳性能。
数据库&大数据&数据科学
面向在线问诊平台的医生推荐方法及应用研究综述
吴性丽, 张皓月, 廖虎昌
计算机科学. 2025, 52 (5): 109-121.  doi:10.11896/jsjkx.240600149
摘要 ( 69 )   PDF(2216KB) ( 65 )   
参考文献 | 相关文章 | 多维度评价
文章旨在强化个性化推荐技术在互联网医疗场景下的应用,辅助患者选择优质的医生资源,解决在线问诊规模不断扩大带来的信息过载问题。通过文献计量归纳热门研究方向,系统梳理现有在线医生推荐模式。根据医患匹配原理,将现有模式划分为5类:基于传统推荐算法的推荐模式、基于多属性决策的推荐模式、基于机器学习的推荐模式、混合推荐模式,以及其他推荐模式。对比各模式的应用现状、优缺点及适用范围,分析发展趋势并提出未来研究方向。在线医生推荐属于计算机科学、管理学及医学领域的交叉研究问题,相较于传统的推荐系统,它更侧重于对患者病情与医生专业领域的精准匹配。传统推荐算法在在线医生推荐领域应用较早,但受限于数据稀疏性与冷启动问题。基于多属性决策的推荐模式理论扎实,能灵活反映患者偏好,但对系统与患者间的交互需求高。基于机器学习的推荐模式能缓解数据稀疏难题,实现智能推荐,但需大量数据支持且欠缺可解释性。混合推荐模式通过整合多种算法优势,有望提升推荐效率与精准度,然而,如何有效组合与平衡各算法成为关键挑战。此外,基于优化理论与图模型等的推荐模式尚待深入研究。未来还需融合多学科理论方法,对跨平台多源异构型医患数据的挖掘、表达、整合进行研究,探索基于患者个性化需求及偏好的医生推荐模式。
基于自监督图网络的脑电情绪识别方法研究
张嘉翔, 潘敏, 张瑞
计算机科学. 2025, 52 (5): 122-127.  doi:10.11896/jsjkx.240200039
摘要 ( 58 )   PDF(2219KB) ( 70 )   
参考文献 | 相关文章 | 多维度评价
脑电情绪识别是指通过分析人类脑电信号来识别相应情绪状态的技术,其在医疗健康、人机交互等领域有着广泛的应用。目前,脑电情绪识别往往借助机器学习或深度学习方法对标签脑电数据进行充分训练从而能够辨别不同情绪状态。然而,以往方法严重依赖于大量标签数据,而数据标注耗时耗力,并且脑电信号的个体差异性导致传统方法表现不佳。同时,研究表明,脑电信号的空间结构信息能够反映不同情绪状态下蕴含的脑区相互作用,有助于提高情绪的辨识度。为此,提出了一种基于自监督图网络的脑电情绪识别方法。首先,使用减数分裂方法预处理脑电信号;其次,利用图卷积网络提取脑电信号的空间结构信息,并设计自监督辅助任务对图卷积网络进行训练;最后,在公开数据集SEED和SEED-IV上验证所提方法的可行性和有效性,其情绪识别准确率为95.16%和80.23%,优于现有方法。
基于地理时空关联和社会影响的兴趣点推荐
金红, 陈礼珂, 游兰, 吕顺营, 周开成, 肖奎
计算机科学. 2025, 52 (5): 128-138.  doi:10.11896/jsjkx.240200099
摘要 ( 53 )   PDF(2388KB) ( 64 )   
参考文献 | 相关文章 | 多维度评价
随着基于位置的社交网络的流行,个性化兴趣点推荐已经成为一项重要任务。然而现有研究在对上下文信息建模及融合时对其内在联系考虑不充分,其中地理与时间两种上下文之间往往是相互影响的;此外,在建模用户社会关系时主要通过度量不同用户签到的POI子集之间的直接相似性来表达用户社交行为的相似性程度,未能更好地缓解数据稀疏对不同用户签到POI子集相似性度量的影响。因此,合理地重构了上下文信息模型并有效地融合建模到用户偏好中,提出了一种基于地理时空关联和社会影响的兴趣点推荐方法。该方法根据不同时间状态下用户的主要地理活动中心呈现空间聚集现象,使用带有时间约束的方法评估POI间的地理相关性,以建模POI地理信息对用户签到的影响。进一步地,在对用户社会关系建模时假设具有更多共同签到的POI或签到POI的类别有着更大重合度的用户社交行为的相似性更高,结合POI类别信息来提高社会关系建模的有效性和作用。最后,将提出的地理时空关联模型和用户社会关系模型融合到加权矩阵分解中,进行用户的个性化POI推荐。对比实验结果表明,所提方法具有更好的POI推荐性能,说明了提出的模型在上下文建模和克服数据稀疏性方面更具优势。
基于特征网络对比学习的图协同过滤模型研究
吴鹏远, 方伟
计算机科学. 2025, 52 (5): 139-148.  doi:10.11896/jsjkx.240200078
摘要 ( 50 )   PDF(3331KB) ( 60 )   
参考文献 | 相关文章 | 多维度评价
基于图协同过滤的推荐技术因能高效处理大规模交互数据而备受关注,但现实场景中的数据稀疏性问题限制了其有效性。对比学习应用于图协同过滤可以增强其在数据稀疏性上的性能,但现有方法通常通过随机抽样方式构建对比对,未能充分发掘对比学习在推荐系统中的潜力。为此,提出一种基于特征网络对比学习的图协同过滤模型(FeatureNet Contrastive Learning,FCL)。该模型通过计算特征向量之间的余弦相似度和概率归一化策略建立节点特征相似度矩阵,再使用对比学习对节点特征相似度矩阵进行影响力分析以捕捉节点间的高阶连接性,还引入随机扰动来增强模型的鲁棒性。在多个数据集上进行大量实验,验证了所提模型的有效性,尤其在处理高稀疏度数据集时,效果更为明显。
基于图熵理论的图数据增强研究
富坤, 崔静远, 党兴, 成晓, 应世聪, 李建伟
计算机科学. 2025, 52 (5): 149-160.  doi:10.11896/jsjkx.240200016
摘要 ( 55 )   PDF(2665KB) ( 72 )   
参考文献 | 相关文章 | 多维度评价
图数据增强是一种通过变换和扩充图结构和节点特征来增加训练数据多样性、提高图神经网络性能的技术。为了应对图数据增强面临的难以综合信息完整性、特征平滑性、图多样性和局部依赖关系的挑战,缓解图神经网络的过平滑和过拟合问题,提高其性能,提出了一种基于物理热力学中的熵理论的图数据增强模型(Neighbor Replacement Based on Graph Entropy,NRGE)。首先,引入了一种新的图熵定义,用于度量数据流形平滑度;基于减少图熵损失的思想,提出了一种新的数据增强策略,用于生成更多合适的训练数据。然后,通过增强节点的采样邻居,以保证数据增强的一致性;采用随机替换节点的一阶邻居为二阶邻居的方式,增加了数据增强的多样性。最后,引入了邻居约束正则化方法,通过约束增强后的邻居之间的预测一致性来提高模型性能。消融实验结果表明,通过保持三角形图案的信息结构,NRGE模型能够有效降低图熵损失,从而改善学习效果。在Cora,Citeseer和Pubmed 3个公开数据集上进行了节点分类实验,相较于基准模型,NRGE模型在Cora数据集上提升了1.1%,在Citeseer数据集上提升了0.8%,在Pubmed数据集上略微降低了0.4%。结果表明,NRGE模型有效改善了图神经网络的性能,提高了其泛化能力。
基于差异共表达邻接网络的癌症致病基因预测算法
李志杰, 廖旭红, 李青蓝, 刘丽
计算机科学. 2025, 52 (5): 161-170.  doi:10.11896/jsjkx.240300110
摘要 ( 47 )   PDF(2216KB) ( 72 )   
参考文献 | 相关文章 | 多维度评价
癌症是人类健康的第一杀手。随着测序技术的快速发展,积累了海量的癌症基因表达数据,利用计算方法进行致病基因预测成为癌症研究领域新的热点。然而,目前致病基因预测大多基于基因相互作用网络等,很少考虑网络局部连接与基因差异表达间的潜在联系。针对上述问题,首先利用患病前后的基因表达差异数据,通过互信息计算基因间的相关性并构建邻接网络,然后设计特征向量模型用于癌症致病基因预测。向量特征包括候选基因及其近邻的差异表达信息。从TCGA,OMIM和GEO等公共数据库获取癌症相关的致病与非致病基因以及患病前后基因差异表达数据进行实验,利用邻接网络中基因及其近邻的差异表达信息进行癌症致病基因预测(Differential Information of Gene and Nearest Neighbor for Cancer Pathogenic Gene Prediction,DICPG)。实验结果表明,DICPG癌症基因分类模型的生物学意义明显,分类精度和AUC等性能指标优于同类方法。
计算机图形学&多媒体
基于对比学习的大气湍流退化图像复原方法
苗壮, 崔浩然, 张启阳, 王家宝, 李阳
计算机科学. 2025, 52 (5): 171-178.  doi:10.11896/jsjkx.240200020
摘要 ( 67 )   PDF(3218KB) ( 75 )   
参考文献 | 相关文章 | 多维度评价
大气湍流引起的图像退化严重影响了目标检测和图像识别等计算机视觉下游任务的性能。现有基于深度学习的大气湍流退化图像复原模型虽然取得了较好的效果,但未充分利用湍流效应的特征信息。为了获得更好的复原效果,提出了一种基于对比度学习的大气湍流退化图像复原方法。针对大气湍流退化引起的模糊与扭曲,设计了湍流缓解块。该块融合了基于Transformer的通道信息交互模块与基于CNN的空间信息交互模块,在全局和局部层面上抑制湍流对图像的干扰。同时,引入对比学习,将清晰图像和大气湍流退化图像视为正样本和负样本,在特征空间中拉近大气湍流复原网络的输出与正样本的距离,推远与负样本的距离,更有效地进行特征提取和图像复原。在Helen合成测试集和Places合成测试集上,所提方法分别达到了26.78 dB,22.42 dB的PSNR和0.790 9,0.682 0的SSIM,与现有的5种方法相比达到了最佳效果,更适用于提升大气湍流退化图像的质量。
引入双曲正切阈值函数的平稳小波变换心电信号去噪方法
王海勇, 丁顾霏
计算机科学. 2025, 52 (5): 179-186.  doi:10.11896/jsjkx.240100009
摘要 ( 42 )   PDF(2917KB) ( 55 )   
参考文献 | 相关文章 | 多维度评价
在心电信号的采集过程中,各种噪声充斥在心电信号中,这会使心电信号变得难以识别,从而影响医务人员的诊断。对心电信号进行去噪处理,是心电信号研究的重要环节。基于平稳小波变换的技术,针对平稳小波去噪过程中硬阈值、软阈值的缺陷,提出一种可变参数下的双曲正切函数(SWTaVHT)来对心电信号进行去噪;同时,为了防止在去噪过程中丢失一些高频信息段,引入利用R峰位置信息辅助的修正方法,以更好地保留有用的信号特征。为了评估SWTaVHT的有效性,在公开数据库MIT-BIH上与现有的方法进行对比实验。结果表明,去噪之后的信噪比(SNR)、均方根误差(RMSE)和均方根差百分比(PRD)均优于现有方法。SWTaVHT在不改变原始信号振幅的情况下,对心电信号数据进行去噪处理,其效果优于现有方法。
基于元增量学习的开放集识别方法
孙晋永, 王雪纯, 蔡国永, 尚之量
计算机科学. 2025, 52 (5): 187-198.  doi:10.11896/jsjkx.240600162
摘要 ( 57 )   PDF(3995KB) ( 60 )   
参考文献 | 相关文章 | 多维度评价
传统图像分类算法假定世界是静态、封闭的,而大数据时代的真实世界却是动态、开放的,新类别及其样本不断出现,导致传统图像分类算法的准确率降低。针对这种情况,研究者提出了适用于真实世界的开放集识别问题,目标是从样本集中识别出未知类样本,同时保持对已知类样本的分类准确性。但现有的开放集识别方法都忽略了对识别出的未知类样本的进一步利用,且未知类样本通常数量较少,这些情况导致开放集识别模型无法增量地学习到已识别出的未知类样本蕴含的知识,影响了开放集识别模型的准确性和泛化性。为此,提出一种基于元增量学习的开放集识别方法,来提高开放集识别模型的准确性和泛化性。该方法使用双层优化机制构建开放集识别模型,对未知类样本进行深度聚类,使模型能够对聚类后的未知类样本进行增量学习。具体来说,首先,构建基于双层优化机制的开放集识别模型,并对其进行训练,使其具备对少量未知类样本进行增量学习的能力。然后,使用权重激励注意力机制来获取开放集识别模型参数的重要性,对模型的非关键参数进行更新,减少增量学习对模型的已知类分类能力的影响。其次,设计深度DBSCAN方法对未知类样本进行聚类,将每簇样本标记为一类,并使模型对其增量学习,丢弃离散样本,减少离散样本对增量学习效果的影响。最后,在4个公开数据集上进行实验,结果表明,相较于主流的开放集识别方法,所提方法在AUROC和F1分数上均具有更好的效果,可以充分地学习识别出的未知类样本的知识。
基于深度位置感知Transformer的低重叠点云配准
孔煜, 熊风光, 张志强, 申超凡, 胡明月
计算机科学. 2025, 52 (5): 199-211.  doi:10.11896/jsjkx.240400172
摘要 ( 55 )   PDF(4810KB) ( 52 )   
参考文献 | 相关文章 | 多维度评价
针对特征提取阶段忽视局部几何嵌入的融合,特征交互阶段低重叠点云对之间的位置感知信息呈现弱相关性导致难以提取更富有表现力的特征,以及对应生成阶段出现部分错误对应导致求解的变换矩阵存在偏差等问题,提出了一种基于深度位置感知Transformer(DeepPAT)的三维点云低重叠配准方法。首先,设计了融合局部几何信息的局部特征提取网络,用于提取点云多层次特征;然后,设计了基于深度位置感知的Transformer(PAT)模块,通过学习点云自身和跨帧的几何和深度空间位置信息,提取低重叠率的源点云和目标点云的相关特征和重叠信息,以便进行低重叠特征匹配;最后,设计了由特征相似性项调节的极大团算法来减轻长度一致性所带来的空间模糊性,从而过滤离群点。其可作为一种即插即用的估计模块代替RANSAC等传统鲁棒估计器。在室内3DMatch数据集和合成ModelNet数据集上进行评估,实验结果表明:在测试ModelNet数据集的旋转和平移均方根误差方面,DeepPAT分别将误差降低至3.994和0.005;在测试3DMatch和3DLoMatch基准的配准召回率方面,DeepPAT分别比现有方法高出至少4.3%和3.6%。
改进U-Net的多尺度特征融合遥感图像语义分割网络
姜文文, 夏英
计算机科学. 2025, 52 (5): 212-219.  doi:10.11896/jsjkx.240300137
摘要 ( 67 )   PDF(2948KB) ( 77 )   
参考文献 | 相关文章 | 多维度评价
遥感图像的空间分辨率高,不同类型对象的尺度差异大、类别不平衡,是精准语义分割任务所面临的主要挑战。为了提高遥感图像语义分割的准确性,提出了一种改进U-Net的多尺度特征融合遥感图像语义分割网络(Multi-scale Feature Fusion Network,MFFNet)。该网络以U-Net网络为基础,包含动态特征融合模块和门控注意力卷积混合模块。其中,动态特征融合模块代替跳跃连接,改进上采样层和下采样层的特征融合方式,避免特征融合导致信息丢失,同时提高浅层特征和深层特征的融合效果;门控注意力卷积混合模块通过整合自注意力、卷积和门控机制,更好地捕获局部和全局信息。在Potsdam和Vaihingen数据集上开展对比实验和消融实验,结果表明MFFNet在两个数据集上的mIoU分别达到76.95%和72.93%,有效提高了遥感图像的语义分割精度。
基于超图卷积和多角度拓扑细化的骨骼行为识别方法
黄倩, 苏新凯, 李畅, 巫义锐
计算机科学. 2025, 52 (5): 220-226.  doi:10.11896/jsjkx.240600125
摘要 ( 63 )   PDF(1725KB) ( 81 )   
参考文献 | 相关文章 | 多维度评价
由于人体骨架是一个天然存在的拓扑结构,因此图卷积网络(GCNs)被广泛地应用于基于骨骼的人体行为识别。然而,目前的基于GCN的方法只关注关节点对之间的低阶关系,而忽略了潜在的关节点在关节点群中的高阶关系。同时,现有的方法忽略了空间拓扑随时间的动态变化。这些不足影响了模型的表现。为此,利用K-NN计算出相关性高的关节点构成超边,提出了超图构建方法和超边图卷积来动态地学习关节点间的高阶关系。此外,设计了一个从时间和通道角度细化的拓扑图来学习帧级的和通道级的关节点对之间的相关性。最后,开发了一个多角度拓扑细化的超图卷积网络(HyperMTR-GCN)用于骨骼行为识别,其在NTU RGB+D和NTU RGB+D 120数据集上具有显著优势。具体地,所提方法在NTU RGB+D的X-sub基准上比2s-AGCN提高了3.7%,在NTU RGB+D 120的X-sub基准上比2s-AGCN提高了5.7%。
人工智能
融合定长Seq2Seq网络的中文成语智能纠错模型
何春辉, 葛斌, 张翀, 徐浩
计算机科学. 2025, 52 (5): 227-234.  doi:10.11896/jsjkx.240400035
摘要 ( 51 )   PDF(3321KB) ( 74 )   
参考文献 | 相关文章 | 多维度评价
四字成语作为一类特殊词语,在中文使用中非常流行。随着中文纠错任务的发展,中文成语的智能纠错已经成为自然语言处理领域的一个研究热点。针对现有方法在中文成语智能纠错任务上准确率偏低的问题,提出了一种融合定长Seq2Seq网络的中文成语智能纠错模型。它在底层通过融合Seq2Seq网络架构和注意力机制,并结合混合数据集构造方法,共同训练得到输入和输出端序列长度固定的Seq2Seq模型,用来完成中文四字成语智能纠错任务。在大型公开中文成语纠错数据集上的实验结果表明,定长Seq2Seq模型优于现有方法,能够实现同一个模型同时兼容乱序、缺字和错字3种不同的中文成语智能纠错目标。它的综合纠错准确率可以达到91.3%,比最优基线模型高出11.73%。
一阶逻辑定理证明器CSE中矛盾体分离式的简化方法
吴鑫, 陈树伟, 姜世攀
计算机科学. 2025, 52 (5): 235-240.  doi:10.11896/jsjkx.241000175
摘要 ( 35 )   PDF(1559KB) ( 42 )   
参考文献 | 相关文章 | 多维度评价
一阶逻辑自动定理证明器能够解决大量形式化后的实际问题,具有重要的应用价值。矛盾体分离演绎发展了自动定理证明领域经典的归结原理,具有更强的证明能力。在基于矛盾体分离规则的自动定理证明器CSE(Contradiction Separation Extension)的基础上,提出一种矛盾体分离式的简化算法,通过优化数据结构,使用指针保存子句间的互补信息,并在此基础上选择实际参与演绎的子句,从而得到最简矛盾体分离式。这种新的简化算法可生成更简短的分离式,进一步利用子句的合一互补性,增强空子句演绎路径的检测能力,提高证明器的效率。实验结果显示,相比CSE,使用此简化算法后的证明器CSE_ BSCS能多证明39个测试例,平均证明时间减少了18.64%,在证明能力和效率上均更优。
面向知识蒸馏的多助教动态设置方法
司悦航, 成清, 黄金才
计算机科学. 2025, 52 (5): 241-247.  doi:10.11896/jsjkx.240700059
摘要 ( 46 )   PDF(3029KB) ( 62 )   
参考文献 | 相关文章 | 多维度评价
知识蒸馏在目标识别的模型压缩等关键领域受到重视。通过深入研究知识蒸馏的效率并分析教师模型和学生模型间知识传递的特点,发现合理设置助教模型可以显著缩小教师和学生之间的性能差距。然而,助教模型的规模和数量的不合理选择会对学生产生负面影响。因此,提出了一种创新的多助教知识蒸馏训练框架,通过动态调整助教的数量和规模,以优化知识从教师向学生传递的过程,从而提高学生模型的训练准确率。此外,还设计了一种动态停止知识蒸馏的策略,设置不同训练方法的学生模型作为对照组,实现对知识蒸馏停止回合的个性化设计,进一步提升学生模型的训练效率,并构建更精简高效的多助教知识蒸馏框架。通过在公开数据集上进行实验,证明了提出的面向知识蒸馏的多助教动态设置方法的有效性。
基于大语言模型的刑事案件智能判决研究
丛颖男, 韩林睿, 马佳羽, 朱金清
计算机科学. 2025, 52 (5): 248-259.  doi:10.11896/jsjkx.241100100
摘要 ( 90 )   PDF(2513KB) ( 70 )   
参考文献 | 相关文章 | 多维度评价
刑事案件判决的智能化一直是数字法院建设中的研究热点。传统方法基于自然语言处理技术,由模型依据案件事实直接预测判决结果,但应对复杂刑事案件案情时,模型难以发现法律要件之间的逻辑依赖关系,也难以清晰表达法律推理过程。文中提出一种基于大语言模型的刑事案件智能判决方法,该方法以“标记案件语料-预训练大模型-强化判决逻辑”为思路,首先通过自动化标注与人工校正相结合的方式,标注案情中的主体、客体、主观要件和客观要件等法律要素,构建结构化的推理数据集;其次基于GLM预训练框架,选取ChatGLM3-6b-32k作为基座大语言模型进行增量预训练;最后采用LoRA参数高效微调策略与大模型检索增强技术对模型进行参数调优与法律知识扩展,实现判决逻辑的强化。实验结果表明,与Qwen-7B-Chat和Baichuan2-7B-Chat相比,ChatGLM3-6b-32k模型在指令监督微调后性能更优。引入司法三段论显著增强了判决文本的逻辑性,使其更贴近人类法官的裁判说理。在罪名预测和刑期预测任务中,所提模型准确率相较于MTL-Fusion,Lawformer和BERT模型均有显著提升。此外,与基于欧美法律文本训练的Legal-BERT和CaseLawBERT相比,所提模型更适应中国刑事案件的判决逻辑,在处理长文本任务上展现出更强的能力。该研究不仅探索了大语言模型在刑事案件智能判决中的应用,还为司法领域大模型研究的范式提供了有益参考。
一种融合实体描述和拓扑结构的知识图谱补全方法
韩道军, 李云松, 张俊涛, 王泽民
计算机科学. 2025, 52 (5): 260-269.  doi:10.11896/jsjkx.240300012
摘要 ( 45 )   PDF(1757KB) ( 55 )   
参考文献 | 相关文章 | 多维度评价
知识图谱补全旨在预测给定三元组中缺失的实体和关系,以增强知识图谱的完整性和质量。现有的知识图谱补全方法通常只考虑三元组自身的结构信息或者是实体单一的附加信息(如实体的文本描述或拓扑结构信息),而忽略了融合多种附加信息来增强实体的特征信息,从而导致现有方法补全缺失实体时性能不佳。针对这个问题,提出一种融合实体文本描述和拓扑结构信息的知识图谱补全方法(FuDS-KGC),用于改善知识图谱补全任务的性能。该方法首先通过Transformer和注意力机制提取实体文本描述中特定于关系的特征表示,以增强实体描述的表示特征信息。然后,构建实体的一阶邻居子图,并通过图注意力网络获得实体的拓扑结构特征。最后,设计一种动态门控融合机制,融合实体的文本描述和拓扑结构特征,以增强实体的综合特征表示。在FB15k-237和WN18RR两个数据集上进行实验,实验结果证明了FuDS-KGC的有效性。
有限值终态零化神经网络及其在机器人运动规划中的应用
汪黎明, 仲国民, 孙明轩, 何熊熊
计算机科学. 2025, 52 (5): 270-280.  doi:10.11896/jsjkx.240400173
摘要 ( 35 )   PDF(3758KB) ( 62 )   
参考文献 | 相关文章 | 多维度评价
针对等式约束的时变二次规划求解问题,提出一种有限值终态零化神经网络,以保证计算误差的有限时间收敛,其有限值特性易于实现;对有限值终态零化神经网络进行理论分析,并给出该神经网络的收敛时间表达式。冗余机械臂的重复运动规划问题可描述为时变二次规划问题,采用有限值终态零化神经网络作为求解器,以获取末端执行器轨迹对应的关节轨迹。考虑到机械臂关节初始偏差难以避免,采用定参数/自适应参数的终态优化指标,在实现机械臂末端位置误差的有限时间收敛的同时,提高重复运动规划的精度。为保证机械臂的平稳运行,提出一种平滑修正的有限值函数用于终态优化指标设计。理论分析机械臂末端执行器位置误差的有限时间收敛条件。数值仿真以及UR5机械臂仿真与实验结果,验证了所提计算方案的有效性。
动态增量式逆向云变换算法研究
许昌林, 孔令卓
计算机科学. 2025, 52 (5): 281-290.  doi:10.11896/jsjkx.240100017
摘要 ( 45 )   PDF(4454KB) ( 70 )   
参考文献 | 相关文章 | 多维度评价
云模型作为研究不确定性信息的工具,在不确定性人工智能和数据挖掘方面具有重要意义。 其中逆向云变换算法为云模型的重要算法之一,可以实现定量数据到定性概念的转换。文中从动态增量的角度对逆向云变换算法进行研究。首先,针对现有的基于一阶绝对中心矩的经典逆向云变换算法中参数估计存在的不合理性进行了理论分析。其次,在理论分析的基础上,结合正向云变换算法生成云滴的特点,利用正态随机变量动态产生新的云滴作为新增样本,并将随机生成的样本和原有样本融合作为最终样本后再对参数进行估计,有效解决了已有算法存在的估算问题,从而提出了两种动态增量式的逆向云变换算法。然后,通过随机模拟实验,从有效性、稳定性、收敛性和参数的鲁棒性4个方面将所提出的逆向云变换算法与已有算法进行对比分析,实验结果表明所提出的动态增量式逆向云变换算法的估计误差较小、稳定性和收敛性较好,且对参数的变化具有较强的鲁棒性。最后,将提出的逆向云变换算法应用在对射击选手的射击水平模拟还原和评价中,实验结果进一步表明算法具有较好的实用性。
计算机网络
EvoTrace:基于非线性数据包遥测和批处理的轻量级带内网络遥测方法
王攀祥, 崔允贺, 申国伟, 郭春, 陈意, 钱清
计算机科学. 2025, 52 (5): 291-298.  doi:10.11896/jsjkx.240100164
摘要 ( 46 )   PDF(3727KB) ( 51 )   
参考文献 | 相关文章 | 多维度评价
带内网络遥测(In-band Network Telemetry,INT)使数据包能够携带网络状态信息,具有较高的测量准确性和精度。然而,这种提升是以增加数据平面开销为代价的。遥测信息的嵌入会导致数据平面的网络开销过大。同时,现有的遥测方法通常对大流的数据包进行大量的测量,忽略了对中小流数据包的测量。为了克服上述问题,提出了一个轻量级的INT方法——EvoTrace。EvoTrace设计了一种非线性数据包遥测方法,根据网络流的属性监测不同流的数据包。此外,EvoTrace还采用元数据批处理的方式对遥测元数据进行聚合,以减少网络带宽占用和遥测数据包的数量。在OpenvSwitch(OVS)上实现了EvoTrace并进行了测试,实验结果表明,与现有方法相比,EvoTrace在提高网络流监测覆盖率的同时,节省了40%以上的INT带宽占用。
DApp资源命名与寻址技术研究
叶崛宇, 伦占群, 岳巧丽, 李洪涛, 张海阔, 强济深
计算机科学. 2025, 52 (5): 299-306.  doi:10.11896/jsjkx.240700205
摘要 ( 38 )   PDF(2610KB) ( 45 )   
参考文献 | 相关文章 | 多维度评价
近年来,非同质化通证(Non-Fungible Token,NFT)、去中心化金融(Decentralized Finance,DeFi)、元宇宙等去中心化应用(Decentralized Application,DApp)点燃了国内外对Web3.0的热情。DApp资源部分存储于传统Web服务器中,部分存储于区块链等去中心化系统中,其命名与寻址技术与传统Web2.0网站资源的命名与寻址技术大相径庭,然而学术界在相关方面的研究几乎空白。针对这一现状,文章系统梳理了现有DApp资源命名与寻址技术,即基于传统域名的命名与寻址技术和基于Web3.0域名的命名与寻址技术,并分析了现有技术的优点和不足。在此基础上,针对现有技术在易用性方面的不足,提出了一种新型DApp资源命名与寻址技术,设计了功能架构和实施框架,并开发了原型系统进行验证。实验结果表明,新型技术具有良好的易用性且性能较现有技术无显著下降。
信息安全
个性化位置隐私保护技术综述
曹腾飞, 尹润天, 朱亮, 许长桥
计算机科学. 2025, 52 (5): 307-321.  doi:10.11896/jsjkx.240600067
摘要 ( 63 )   PDF(2178KB) ( 71 )   
参考文献 | 相关文章 | 多维度评价
随着移动网络和智能设备的普及,用户的地理位置信息被大量采集和利用,从而使数据隐私面临严峻挑战。在此背景下,用户不仅期望能得到有效的隐私安全保障,也对服务体验的质量提出了更高的要求。然而,保护用户位置隐私通常需要限制或模糊位置信息的精确性,这与提供个性化服务所需的高精度位置数据存在冲突。因此,如何在保护位置隐私和满足用户个性化需求之间进行权衡,成为了一个关键的科学问题。这一问题涉及到数据安全、用户体验和商业利益等多个领域,对于加强隐私保护、增强用户信任以及提升用户服务体验质量具有至关重要的作用。综述了近年来个性化位置隐私保护的研究进展。首先,分析了隐私泄露的原因和常见的攻击手段;接着,总结了位置隐私保护技术的定义及分类;然后,根据用户的个性化需求,探讨了如何在保障用户隐私偏好的基础上提供更适宜的位置隐私保护措施;最后,对个性化位置隐私保护技术的未来研究趋势进行了总结和展望。
大样本条件下随机性检测的误差分析及参数建议
孙月玥, 范丽敏
计算机科学. 2025, 52 (5): 322-329.  doi:10.11896/jsjkx.240700006
摘要 ( 38 )   PDF(1767KB) ( 38 )   
参考文献 | 相关文章 | 多维度评价
在信息安全领域,随机性检测在确保密码系统的安全性中起着至关重要的作用。这些测试的稳定性和可靠性直接影响密码系统的整体安全性。检测过程中的误差问题一直是学术界和工业界关注的焦点,特别是在处理大规模样本时,误差的累积更容易导致随机性检测的可靠性降低。因此,研究如何提高随机性检测的准确性和可靠性具有重要意义。GM/T 0005-2021标准中包含了9个具有可变参数的检测项目。针对大样本二元数据的随机性检测问题,根据其特点进行分类,并进行误差量化分析。当待检二元序列比特长度为1×108时,GM/T 0005-2021标准中的检测参数建议基本合理。对于Maurer通用统计检测,子序列长度取6时p值误差上界为0.001 492 8,相较于GM/T 0005-2021中建议的参数表现出更高的准确性。对于线性复杂度检测,更小的子序列长度同样会导致更小的误差。随着样本长度的增加,扩展研究了1×109时的参数选择,分析了不同样本长度和参数下的误差,并给出了样本长度为1×109时的检测参数建议。
基于多视角IB的安全风险关系抽取研究
李希望, 曹培松, 吴俞颖, 郭淑明, 佘维
计算机科学. 2025, 52 (5): 330-336.  doi:10.11896/jsjkx.240300162
摘要 ( 31 )   PDF(2257KB) ( 41 )   
参考文献 | 相关文章 | 多维度评价
安全风险管理是保障安全的核心任务,传统识别安全风险的方法已经不能满足智能化发展的需求。关系抽取是安全风险识别的方法之一,研究关系抽取对安全风险管理具有重要意义。尽管现有的模型已经取得了较好的性能,但是大多数现有的关系抽取模型忽略了领域实体表征不足的问题,并且数据中存在较多不相关信息。针对该问题,提出了一个基于多视角IB(Information Bottleneck)的安全风险关系抽取模型MIBRE(Multi-view Information Bottleneck for Relation Extraction),它通过融合多视角语义信息来达到增强领域实体语义的目的。这两个视角分别是文本视角和图像视角。为了最大化获取两个视角之间的相关信息,基于信息瓶颈方法构造了一个目标函数,在压缩两个视角信息的同时最大化地保留了相关信息。在两个真实的铁路领域数据集上的实验表明,MIBRE识别的F1值分别达到了64.28%和74.34%,相较于基于异构图的LGGCN模型F1值分别提升了4.41%和2.98%,相较于基于注意力机制的TDGAT模型F1值分别提升了1.89%和1.53%。实验结果验证了所提模型在安全风险识别上的有效性。
基于区块链的物联网可追踪匿名跨域认证方案
汪秋丽, 任志宇, 吴翔宇, 管秋国, 王海超
计算机科学. 2025, 52 (5): 337-344.  doi:10.11896/jsjkx.240100190
摘要 ( 44 )   PDF(2103KB) ( 55 )   
参考文献 | 相关文章 | 多维度评价
随着物联网技术的广泛应用,跨域信息共享需求日益迫切,跨域身份认证方案是确保跨域安全协作的基础。基于设备真实身份实现跨域认证存在隐私泄露的风险,而匿名认证方案又存在难以追踪恶意设备的隐患。针对上述问题,基于区块链技术提出了可追踪匿名跨域认证方案。结合单向哈希链和无证书密码,为设备生成多个无关联的假名身份及对应的公私钥对,利用动态累加器计算变更后的域信息,每次跨域认证使用不同的假名,依据域信息与密钥生成中心颁发的跨域凭证进行身份认证,既保护了设备隐私,又可以恢复恶意设备的真实身份,对其追责。BAN逻辑正确性分析和形式化安全证明表明,所提方案具有较高的安全性;与其他方案相比,认证过程中的计算开销和通信开销较低。
多云多副本的远程动态数据完整性检验方案
谈诗懿, 王化群
计算机科学. 2025, 52 (5): 345-356.  doi:10.11896/jsjkx.240300027
摘要 ( 38 )   PDF(2271KB) ( 48 )   
参考文献 | 相关文章 | 多维度评价
随着云存储服务的快速发展,越来越多的数据拥有者愿意将数据存储到云服务器中,从而减小自己在本地的存储负担。然而,一旦数据拥有者上传数据至云服务器,本地将不保存数据,数据拥有者将失去对数据的直接控制权。为了保证保存在云服务器上远程数据的完整性,数据完整性检验是必不可少的。它可以使得数据拥有者在不下载全部数据的情况下验证外包数据是否完整。为了提高外包数据的可用性和持久性,数据拥有者将多个副本存储在多个云服务器上。由于云服务器不是完全可信的,在公共云环境下保护数据拥有者的身份隐私是有必要的。当数据拥有者想要更改存储在云服务器上的数据文件时,数据动态操作如数据修改、数据删除、数据插入具有重要意义。因此,提出了在多云多副本环境下的远程动态数据完整性检验方案。该方案将环签名算法结合多云多副本环境,有效保护了数据拥有者的身份隐私,使得数据拥有者不用担心身份暴露问题。同时在多云环境下引入一种新的数据结构-分治邻接表实现数据动态操作,分治邻接表通过索引搜索指定数据并通过修改指针完成数据的插入和删除,相比其他数据结构如Merkle树等,提高了更新效率。基于标准困难问题,提出的方案是安全的。所提方案利用基于身份的公钥密码体制,消除了复杂的证书管理。通过性能分析和安全性分析,所提方案满足无条件匿名性、动态性和远程数据完整性验证。
基于位置服务的多因素假位置选择算法
李勇军, 祝跃飞, 吴魏, 白利芳
计算机科学. 2025, 52 (5): 357-365.  doi:10.11896/jsjkx.240200067
摘要 ( 37 )   PDF(3219KB) ( 51 )   
参考文献 | 相关文章 | 多维度评价
针对现有假位置在进行基于位置服务的快照位置隐私保护时,忽略位置本身时间因素引发的背景知识攻击,以及对敏感位置同等对待等问题,提出一种多因素的假位置选取算法(Multi-Factor Dummy Location Selection Algorithm,MFDLS)。该算法综合考虑了影响隐私泄露的因素,包括位置的地理属性、语义属性、时间属性,以及查询概率等背景知识和用户敏感偏好,确保所选假位置不仅能有效抵御位置同质攻击、位置语义攻击和查询概率分布攻击,还能应对位置分布攻击、敏感同质攻击和链接攻击等多种威胁。算法选取满足与当前请求时间段内查询概率接近,语义多样化、匿名空间大且时间相对一致,非离群点和中心点要求的假位置。安全性分析和仿真实验结果表明:与已有的假位置选取算法相比,所提算法在敌手错误方面提升16%以上,质量损失方面降低30%以上,能更有效地抵御背景知识攻击,满足用户隐私需求。
BDBFT:一种物联网场景下基于信誉预测模型的共识协议
王璞, 高湛云, 王振飞, 宋哲理
计算机科学. 2025, 52 (5): 366-374.  doi:10.11896/jsjkx.240300018
摘要 ( 38 )   PDF(2013KB) ( 48 )   
参考文献 | 相关文章 | 多维度评价
区块链技术在物联网场景的应用中具有强数据安全性和高可信度的优势,但区块链技术中的共识算法存在能耗高、计算成本高、可扩展性低等缺点,在物联网应用中部署区块链系统面临物联网节点存储容量小、能耗低和计算能力不足的问题。在实用拜占庭容错算法(PBFT)的基础上,提出了一种物联网场景下基于信誉预测模型的共识协议(BDBFT)。首先,根据分组策略的地理位置分类标准对节点进行分组以选取共识节点,减少组内通信的通信时延;其次,引入基于Dirichlet分布的细粒度信誉预测模型,根据每轮视图生命周期中的信誉信息动态地更新模型,并基于历史信誉信息和当前信誉信息投票高预测概率的节点作为共识节点。仿真实验结果表明,相对于PBFT算法和LRBFT算法,BDBFT算法有效地降低了拜占庭节点参与共识的概率,在时间延迟、吞吐量、通信开销和安全性4个方面具有明显的性能提升。
基于深度强化学习的微服务工作流容侵调度算法
李远博, 扈红超, 杨晓晗, 郭威, 刘文彦
计算机科学. 2025, 52 (5): 375-383.  doi:10.11896/jsjkx.240500033
摘要 ( 49 )   PDF(2422KB) ( 69 )   
参考文献 | 相关文章 | 多维度评价
随着微服务和容器技术的快速发展,云中执行的应用可以由多个具有依赖关系的微服务共同完成。然而,基于容器云的微服务由于共享资源而面临许多安全威胁。云中的攻击者可以通过侧通道、容器逃逸方式直接或间接地破坏它们,从而导致产生不正确的输出结果,这将给云中的用户带来巨大的损失。因此,在容器云环境下,提出了一种基于深度强化学习的微服务工作流容侵调度算法(ITSAMW),以提高系统的安全性。首先,该算法为每个微服务构建3个副本,并利用投票裁决机制保证安全性。算法研究了如何调度这些微服务副本,并证明了微服务入侵容忍调度需要满足的位置约束条件。其次,构建了微服务调度和完成时延模型,重新对微服务的安全调度问题进行了形式化描述定义,并利用深度强化学习的方法对问题进行了求解。最后,为了验证算法的有效性,使用Kubernetes搭建了容器云仿真平台,并使用入侵容忍度、完成时延和负载均衡性来对其进行评估。实验结果表明,与现有方法相比,ITSAMW在完成时延增加了17.6%的条件下,入侵容忍度提高了28.1%,负载均衡度降低了13.7%。
基于“隐形面具”的可逆人脸隐私保护方法
郑旭, 黄想杰, 杨杨
计算机科学. 2025, 52 (5): 384-391.  doi:10.11896/jsjkx.241100066
摘要 ( 45 )   PDF(3052KB) ( 53 )   
参考文献 | 相关文章 | 多维度评价
随着人工智能和计算机视觉技术的快速进步,人脸信息已经被广泛应用于智能安防、金融支付和社交媒体等多个领域。这些采集的人脸信息一旦被泄露或被不法分子非法售卖,就会造成严重后果。因此,如何防止采集的原始人脸数据库被恶意窃取从而进行非法训练和非法识别,是亟待解决的问题。对此,提出了一种基于“隐形面具”的可逆人脸隐私保护方法。该对抗人脸若被恶意窃取,可使未授权人脸系统错误识别,对于被授权用户,可以在摘除“隐形面具”后恢复原始人脸信息,保证授权人脸系统正确识别,从而达到保护人脸数据库的目的。实验结果表明,该方法生成的对抗人脸具有更高的视觉质量,与原始人脸的平均PSNR在无攻击层下可以达到55 dB,并且使未授权系统错误识别率达到99.6%。同时,该方法实现了可逆恢复人脸,恢复人脸具有更高的视觉质量,与原始人脸的平均PSNR达到61 dB,并且使授权系统正确识别率达到99.8%。实验证明了该方法可以有效地保护人脸数据库。