1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2026年第1期, 刊出日期:2026-01-15
  
封面下载
目录
第53卷第1期目录
计算机科学. 2026, 53 (1): 0-0. 
摘要 ( 51 )   PDF(361KB) ( 31 )   
相关文章 | 多维度评价
大语言模型技术研究及应用
大语言模型智能体操作系统研究综述
郭陆祥, 王越余, 李芊玥, 李莎莎, 刘晓东, 纪斌, 余杰
计算机科学. 2026, 53 (1): 1-11.  doi:10.11896/jsjkx.250500002
摘要 ( 151 )   PDF(3168KB) ( 73 )   
参考文献 | 相关文章 | 多维度评价
大语言模型智能体操作系统,也叫智能体操作系统,是整合大模型、工具资源以及多智能体协同的核心平台,目前正逐渐成为推动通用人工智能发展的一个关键研究方向。对智能体操作系统领域的研究进展进行了系统梳理,首先从基础理论着手,回顾了多种大模型的演进情况以及智能体和传统操作系统领域的进展;接着,围绕典型体系结构,如AIOS等,阐述了其分层架构与模块化设计是怎样达成资源管理与智能调度的。进一步地,明确了当前智能体操作系统在上下文整合、扩展性以及安全性等方面面临的技术挑战,同时也提出了未来借助轻量化设计、自监督学习机制以及动态调度算法来提升多智能体协作效率。该研究的主要贡献为,将那些分散的研究给予整合,促使技术框架变得更为明晰,并指出了智能体操作系统对新兴体系以及行业定制化实践覆盖不全面的情况。未来的研究需要侧重推动跨域智能体操作系统自我进化的能力,并且加快其在各个领域的落地等。
实际应用场景中的大模型高效推理技术综述
刘利龙, 刘国明, 齐保元, 邓雪杉, 薛迪展, 钱胜胜
计算机科学. 2026, 53 (1): 12-28.  doi:10.11896/jsjkx.250300030
摘要 ( 101 )   PDF(2904KB) ( 25 )   
参考文献 | 相关文章 | 多维度评价
近年来,大语言模型(Large Language Models,LLMs)技术迎来了快速发展,其在各行业的应用呈现出蓬勃增长的态势。从自然语言处理到智能推荐,再到信息检索和自动化写作,LLMs正逐渐成为许多领域中不可或缺的工具。然而,随着应用场景的逐渐多样化和需求的不断增加,LLMs推理效率问题日益凸显。在实际应用场景中,快速准确的推理能力对于响应用户请求、处理大规模数据和实时决策至关重要。为了应对这一挑战,学术界展开了广泛的研究和探索,致力于提高LLMs的推理效率。对此,全面调研了实际应用场景中有关LLMs高效推理的文献。首先,介绍了LLMs推理的原理,并分析了在实际应用场景中如何提高LLMs的推理效率。然后,引入了一个针对实际应用场景的分类系统,其主要分为3个层面,分别是算法优化层面、参数优化层面和系统优化层面;并对大模型进行相关研究的总结和归纳。最后,探讨了未来可能的研究方向。
基于大语言模型的业务流程长尾变化应变方法
邵欣怡, 朱经纬, 张亮
计算机科学. 2026, 53 (1): 29-38.  doi:10.11896/jsjkx.250100001
摘要 ( 104 )   PDF(3885KB) ( 34 )   
参考文献 | 相关文章 | 多维度评价
业务流程应变是业务流程管理的重要任务,旨在通过调整流程模型和实例行为来响应不断变化的环境,从而提高其柔韧性并实现业务目标。建模时,残留不确定性导致的长尾变化无法避免,给传统的业务流程应变技术带来了挑战。目前针对长尾变化最有效的应变方法基于一种三方协作框架,即由负责感知长尾变化和提出应变策略的前端业务人员、负责提供服务接口和合规性要求的后端技术人员和管理层,以及辅助应变实施的工具系统共同协作来应对长尾变化,保障业务目标达成。然而,长尾变化在不同时空条件下的多样性、复杂性和应变的迫切性,极有可能超出前端业务人员在应变时对当前情境的理解能力、依据情境制定应变策略的专业水平,以及将应变策略采用领域专用语言有效表达的熟练程度。为弥补这一缺憾并进一步拓展上述框架,提出了一种基于大语言模型的业务流程长尾变化应变方法LLM-Adapt,充分利用大语言模型的泛化能力、强大的内容生成能力,以及嵌入的事件与对策知识库,形成一种更高效、灵活的应变机制。首先,以基于长尾变化特征的提示词工程为媒介,使前端业务人员能够通过自然语言与大语言模型进行交互并获得应变方案。其次,结合后端管理层制定的业务基线目标约束对应变方案进行功能性约束验证,提出的SSDT-Lane算法基于流程结构相似性对应变方案进行筛选,消除了大语言模型在流程调整、业务和组织架构匹配等方面面临的幻觉风险。基于合成数据和真实开源数据集的典型案例分析实验显示,LLM-Adapt相比现有方法,在应变准确性、效率、适用性等方面都表现出显著优势。
大模型赋能战术对抗仿真实验体系架构及技术路径研究
刘大勇, 董志明, 郭齐胜, 高昂, 邱雪欢
计算机科学. 2026, 53 (1): 39-50.  doi:10.11896/jsjkx.250400064
摘要 ( 100 )   PDF(6214KB) ( 33 )   
参考文献 | 相关文章 | 多维度评价
战术对抗仿真实验是作战分析、模拟训练和基于仿真的装备活动的核心手段,其智能化、自动化水平直接影响实验效能和战斗力的生成。针对传统仿真实验存在的实验设计、模型构建、导调控制和人机交互效率低等问题,参考MCP协议提出大模型赋能战术对抗仿真实验的体系架构。该架构包含基础层、工具资源层、AI Agent层、赋能层、应用层,这5层架构自顶向下牵引,自底向上逐层整合,可实现大小模型与数据资源和传统小模型的耦合聚合,并赋能基于仿真的各项军事活动。在此基础上,重点研究讨论了大模型赋能战术对抗仿真实验的具体路径:大模型赋能仿真实验设计,大模型赋能决策模型构建,大模型赋能导调控制。最后,分析了大模型赋能战术对抗仿真实验面临的挑战,并给出了相应的应对措施。
基于多模态大模型辅助视频动作生成的预训练世界模型
万盛华, 徐兴业, 甘乐, 詹德川
计算机科学. 2026, 53 (1): 51-57.  doi:10.11896/jsjkx.250800033
摘要 ( 87 )   PDF(2984KB) ( 22 )   
参考文献 | 相关文章 | 多维度评价
预训练世界模型是提升强化学习样本效率的关键技术,但现有方法因视频数据缺乏显式动作标注,难以捕捉状态转移的因果机制。对此,提出多模态大模型辅助的视频动作生成预训练框架(MLM-generated Action-based Pre-training from videos for world models,MAPO),通过整合视觉语言模型的语义理解能力与动力学建模需求,突破传统预训练范式在动作语义缺失方面的局限性。具体地,MAPO在预训练阶段利用多模态大模型(QWEN2_5-VL-7B)解析视频帧序列,生成细粒度语义动作描述,构建具有因果解释性的动作-状态关联;设计上下文量化编码机制,解耦场景静态特征与动态控制因素,增强跨模态表征能力。在微调阶段,通过双网络协同架构实现预训练动力学特征与真实环境动作的端到端对齐。实验表明,MAPO在DeepMind Control Suite和Meta-World的8项任务中的平均回报较最优基线获得稳定提升,尤其在长时程任务中展现出卓越的性能。该研究为跨模态世界模型训练提供了新范式,揭示了语义动作生成在因果推理中的关键作用。
数据库&大数据&数据科学
图嵌入学习研究综述:从简单图到复杂图
黄苗苗, 王慧颖, 王梅霞, 王业江, 赵宇海
计算机科学. 2026, 53 (1): 58-76.  doi:10.11896/jsjkx.250300081
摘要 ( 92 )   PDF(2381KB) ( 5 )   
参考文献 | 相关文章 | 多维度评价
图数据作为一种具有强大表达能力的数据类型,因具有复杂的结构而难以高效建模。如何有效捕捉其中的内在信息,成为一个富有挑战性的问题。图嵌入方法将高维稀疏的图映射为低维稠密的特征向量,同时保留图的结构信息,已经引起了广泛关注。然而,现有综述对图嵌入方法的总结不够全面,尤其对复杂图嵌入的关注较少,导致处理多样化图数据的研究现状未能得到系统梳理。对此,从简单图到复杂图,对图嵌入学习方法进行了系统综述。首先,给出了各种类型的图和图嵌入的常见定义;其次,系统地归纳了简单图上的嵌入方法,包括浅层和深度图嵌入方法;然后,按照图的种类,总结了复杂图上的嵌入方法,重点介绍深度嵌入技术在动态图、异质图、多重图和超图等复杂图结构中的应用,以弥补现有文献对复杂图结构研究关注较少的不足;最后,讨论了图嵌入技术的实际应用场景,并展望了未来的发展方向。
基于持久内存的B+树索引优化综述
卢超, 杨朝树, 姚政竹, 刘颖, 张润宇
计算机科学. 2026, 53 (1): 77-88.  doi:10.11896/jsjkx.250200109
摘要 ( 69 )   PDF(3086KB) ( 5 )   
参考文献 | 相关文章 | 多维度评价
持久内存的出现为索引结构设计提供了新思路,同时在数据一致性、持久化开销和并发控制等方面也带来了设计挑战。作为存储系统中应用广泛的索引结构,B+树亟需针对持久内存的硬件特性进行适配优化,以充分发挥其字节寻址、非易失性和低延迟等优势。围绕持久内存上B+树索引优化问题,首先分析了构建基于持久内存B+树所存在的挑战,其次分别从单一持久内存架构和混合内存架构两个视角综述了优化方案。对于单一持久内存架构,总结了数据一致性方案、并发控制优化和叶节点创新设计的研究进展,探讨了如何在保证瞬时恢复的基础上提升写操作效率;对于DRAM-PM混合架构,分析了基于叶节点结构优化和基于辅助结构优化的策略,总结了如何在选择性持久化的基础上提升索引性能。最后,总结并分析了两类架构下不同方案的设计特点及优缺点,并对未来在两类架构下的B+树索引优化发展方向进行了展望。
基于KAN的无监督多元时间序列异常检测网络
王成, 金城
计算机科学. 2026, 53 (1): 89-96.  doi:10.11896/jsjkx.241200190
摘要 ( 119 )   PDF(1677KB) ( 20 )   
参考文献 | 相关文章 | 多维度评价
时间序列数据在金融、医疗、工业和交通等领域中广泛存在,异常检测对确保系统稳定和安全至关重要。由于异常样本的收集十分困难,当前大多数时间序列异常检测方法是无监督的。然而,这些方法普遍存在过泛化问题,即模型不仅能重建正常样本,还能很好地重建异常样本。这一问题使得异常检测效果不佳。因此,提出了一种基于Kolmogorov-Arnold表示理论的时间序列异常检测方法TS-KAN,利用其参数高效性与局部可塑性,使模型更好地拟合正常样本并缓解过泛化问题。此外,提出了局部特征增强层Local-KAN,以增强时域特征的表达能力,提高上下文异常检测能力。在5个主流时间序列异常检测数据集上的实验表明,TS-KAN的异常检测能力显著优于现有方法。
基于图注意力交互的行人轨迹预测方法
刘宏鉴, 邹丹平, 李萍
计算机科学. 2026, 53 (1): 97-103.  doi:10.11896/jsjkx.250300132
摘要 ( 79 )   PDF(1868KB) ( 13 )   
参考文献 | 相关文章 | 多维度评价
行人轨迹预测在自动驾驶领域和智慧交通领域均取得了显著的研究进展。由于行人的行为受到自身和环境因素的双重影响,其轨迹具有不确定性和复杂性,因此准确利用轨迹数据的交互特征生成多模态轨迹仍存在较大挑战。目前,该领域中的主要挑战是准确建模行人之间的时空交互。面对复杂的行人时空交互,提出了一种基于图注意力的时空图神经网络,其量化表示行人之间的空间交互并重点关注关键交互,从而将行人轨迹信息表示为有向时空图,利用图注意力机制提取空间位置特征和交互特征,同时结合自注意力机制在时间维度提取时间特征并融合时空特征信息,最后生成结合历史轨迹和交互信息的多模态未来轨迹。在ETH-UCY数据集上的实验表明,与最佳基线模型相比,所提出的方法在平均位移误差(ADE)和最终位移误差(FDE)方面分别降低3.4%和2.1%,并具有较短的推理时间,确保实现实时推理响应。可视化的结果表明,所提出的方法能够生成具有可接受性的未来行人轨迹,展现了良好的工程应用前景。
基于多视图多样性学习的联合谱嵌入聚类算法
李顺勇, 郑孟蛟, 李嘉茗, 赵兴旺
计算机科学. 2026, 53 (1): 104-114.  doi:10.11896/jsjkx.241100070
摘要 ( 125 )   PDF(4783KB) ( 12 )   
参考文献 | 相关文章 | 多维度评价
现有的大多数多视图聚类算法仅依赖于视图间的低阶相似性信息,未能有效地捕捉数据中的高阶结构特性,且对多视图数据的多样性特征关注不足,导致聚类结果的准确性和鲁棒性受限。针对以上问题,提出了一种基于多视图多样性学习的联合谱嵌入聚类算法——JSEC。首先通过视图多样性学习,保留数据间的多样特征,从而有效去除了视图中的噪声;然后提出了一种挖掘视图高阶信息的方法,使得视图的多样性特征尽可能靠近混合相似图,从而实现不同视图信息的高效整合,实现视图间的多样性和补充性融合;最后在谱嵌入模块将视图的多样性特征矩阵融合为联合谱嵌入矩阵,通过谱聚类实现图聚类。另外,设计了一种交替迭代的方法,用于优化目标函数。在与目前最新的多视图聚类算法的对比中,JSEC算法在5个中小规模的真实数据集的3个指标上均展现出优越的性能,同时在2个大规模数据集上也有优异的表现,相比次优算法,ARI指标在不同规模数据集上分别有1.27%和2.57%的提升,从而在理论和实验上验证了所提算法的稳健性。
基于隔离森林集成策略的分类型属性分组离群检测
宋亦静, 张继福
计算机科学. 2026, 53 (1): 115-127.  doi:10.11896/jsjkx.241000163
摘要 ( 67 )   PDF(2429KB) ( 8 )   
参考文献 | 相关文章 | 多维度评价
属性分组是高维离群检测的有效途径之一,但现有的属性组离群检测集成策略仅利用了各属性组内的局部离群信息,忽略了属性组的全局离群信息,导致属性组离群信息集成出现偏差。为此,利用属性组局部与全局离群信息,提出了一种基于隔离森林集成策略的分类型属性分组离群检测方法。该方法根据属性之间的相关性,将属性自动划分为若干属性组,获得数据对象在各属性组中的离群信息;理论分析了现有离群信息集成策略存在集成偏差,并定义了属性组集成偏差系数;利用隔离森林设计了一种离群信息集成策略,有效地刻画了属性组局部与全局离群信息,降低了属性组离群检测集成偏差,并在此基础上提出了一种分类型属性分组离群检测算法。实验结果表明,与对比方法相比,该算法的 AUC 指标、效率分别平均提高了7.83%和48.43%。
计算机图形学&多媒体
基于深度学习的OCT/OCTA视网膜图像分析方法综述
薛静艳, 夏佳楠, 霍蕊莉, 刘杰, 周雪忠
计算机科学. 2026, 53 (1): 128-140.  doi:10.11896/jsjkx.241100047
摘要 ( 116 )   PDF(2925KB) ( 14 )   
参考文献 | 相关文章 | 多维度评价
深度学习是人工智能的一个分支,其依赖深度神经网络进行数据处理与分析。近年来,深度学习在医学影像领域,尤其在图像分类、分割及疗效评估方面取得了显著突破。在眼科领域,应用深度学习技术高效、准确分析光学相干断层扫描成像(Optical Coherence Tomography,OCT)和光学相干断层扫描血管成像(Optical Coherence Tomography Angiography,OCTA)的需求日益增加。相比传统的手工方法,深度学习方法在处理复杂眼底结构和病理变化时展现出更高的精度和更强的自动化能力。然而,以往的综述多侧重于单一成像模式或单一任务的研究,往往忽视了不同成像技术之间的相关性以及任务间的承接性和关联性。对此,不仅详细总结了常用数据集,系统回顾了基于不同OCT和OCTA设备的视网膜相关疾病生物标志物的分割方法,还从不同疾病特性的角度总结了视网膜相关疾病的典型分类方法。最后,从数据隐私与安全性、模型可解释性,以及模型通用性等角度展望了未来的研究方向,为后续研究提供了有价值的参考。
PKHOI:利用先验知识增强人-物交互检测算法
赵文豪, 梅萌, 王小平, 罗航宇
计算机科学. 2026, 53 (1): 141-152.  doi:10.11896/jsjkx.250100086
摘要 ( 65 )   PDF(4406KB) ( 5 )   
参考文献 | 相关文章 | 多维度评价
人-物交互检测(Human-Object Interaction,HOI)在视觉场景理解中起着至关重要的作用,随着深度学习技术的发展,基于视觉的交互检测模型已经能够获得良好的性能。然而,现有方法大多缺乏对先验的逻辑知识的运用,有时会推导出不合理的结果。其次,一些方法将空间信息和人体姿态信息用于推理,但它们仅在推理结果和标注之间构造损失,导致解码器无法学习到准确的隐含关系。因此,提出一种利用先验知识增强现有人-物交互检测算法的方法PKHOI,该方法能够有效增强现有人-物交互检测算法的准确性。具体而言,从训练集中构建了一个包含物品功能性、空间关系、人体姿态和动词共现的逻辑规则表,将其形式化为一阶逻辑并映射到连续空间中,在训练阶段和推理阶段分别以损失函数和矩阵乘法的形式将先验的逻辑规则融入神经网络,提升模型的准确性。此外,提出一种通过融合多模态信息(空间、语义和人体姿态信息)生成人-物对查询的方法,结合逻辑损失函数,可以引导解码器学习到更多的隐含知识。利用提出的方法增强了两个主流的人-物交互检测算法UPT和PViC,并在V-COCO,HICO-DET和Flickr30k数据集上进行了评估,实验结果表明,提出的方法可以有效提高现有方法的性能。
EvR-DETR:融合事件与RGB图像的轻量级端到端目标检测
周秉泉, 蒋杰, 陈江民, 詹礼新
计算机科学. 2026, 53 (1): 153-162.  doi:10.11896/jsjkx.250300021
摘要 ( 98 )   PDF(3771KB) ( 4 )   
参考文献 | 相关文章 | 多维度评价
基于神经脉冲信号的事件摄像机可以提供光线变化的信息,以弥补传统RGB相机目标检测在恶劣环境性能下降的缺陷。然而,传统融合事件相机的现有方法存在模型参数大和非端到端训练方法的问题,限制了模态融合的有效性。因此,提出了一种事件与RGB信息融合的轻量级端到端对象检测框架,基于两种模态各级尺度特征进行不同细粒度的信息融合,同时基于重参数化卷积实现轻量级的融合模块并进行端到端的训练,从而提升模型对于两种模态互补信息的提取能力,以克服自动驾驶中具有挑战性的不利环境。所提出的模型在大规模数据集PKU-SOD上进行了测试,该数据集提供了低光、高速运动模糊与正常光照环境下车辆行驶的视觉数据。实验结果表明,与此前的多模态目标检测框架相比,所提方法在模型参数量上大幅下降,并提升了目标检测的准确率与推理速度,表现出优于现有方法的性能。
基于类别标签引导的协同显著性目标检测方法
李芳芳, 孔雨秋, 刘洋, 李朋玥
计算机科学. 2026, 53 (1): 163-172.  doi:10.11896/jsjkx.250100071
摘要 ( 69 )   PDF(2859KB) ( 7 )   
参考文献 | 相关文章 | 多维度评价
像素级标签的获取耗时耗力,而图像级标签的获取要容易得多。目前,使用图像级标签解决协同显著性目标检测任务尚未得到深入探索。对此,运用一种两阶段方法解决弱监督协同显著分割任务,仅依赖图像级标签(即类别标签) 进行模型训练。利用类别标签的语义信息,实现对协同显著目标的定位和分割。在第一阶段,提出了伪标签生成网络,利用类别标签作为监督信号,生成输入图像的显著图;在第二阶段,提出了协同显著分割网络,用上一阶段得到的显著图作为伪标签进行监督训练。此外,在训练过程中还引入了自我校正学习策略,以提升模型的性能。文中首次提出使用图像级标签来解决协同显著性目标检测问题,并在3个具有代表性的数据集上进行了实验验证,得到的结果证实了所提方法的有效性和可行性。
基于双向交叉注意力跨域融合的航拍图像伪装目标识别方法
李昂, 章杰元, 刘逊韵
计算机科学. 2026, 53 (1): 173-179.  doi:10.11896/jsjkx.250300009
摘要 ( 114 )   PDF(2986KB) ( 14 )   
参考文献 | 相关文章 | 多维度评价
针对航拍图像中伪装目标与环境高度融合以及实时性要求高的挑战,提出了一种基于双向交叉注意力跨域融合的伪装目标识别方法。首先,提出跨域双分支特征提取网络,分别从RGB域和频域进行提取特征,从而增强对低对比度图像的特征提取能力。同时,通过设计双向交叉注意力融合模块,在多个尺度上将频域特征与RGB特征进行基于注意力机制的双向特征融合,从而有效提升网络表征能力。实验结果表明,相比其他代表性算法,所提出的方法在目标识别准确性与实时性上达到了更优的平衡。
结合性别信息的多任务语音情感识别
姚佳, 李冬冬, 王喆
计算机科学. 2026, 53 (1): 180-186.  doi:10.11896/jsjkx.241200006
摘要 ( 53 )   PDF(2261KB) ( 7 )   
参考文献 | 相关文章 | 多维度评价
现有的语音情感识别方法通常依赖深度学习模型提取声学特征,但大多仅关注通用特征的建模,未能充分挖掘数据中与情感密切相关的先验知识。为此,提出了一种端到端的多任务学习框架,利用自监督预训练模型WavLM提取包含丰富情感信息的语音特征,并将性别识别作为辅助任务,以捕捉性别差异对情感识别的潜在影响。针对传统多任务学习框架中固定权重计算损失导致的学习不均衡问题,进一步提出了一种自适应温度系数的动态权重平均方法(Temperature-aware Dynamic Weight Averaging,TA-DWA)。该方法通过动态调整温度系数平衡不同任务的学习速度,并结合任务损失变化率实现更合理的权重分配。实验结果表明,在IEMOCAP和EMODB数据集上,所提方法显著提高了情感识别准确率,验证了性别识别作为辅助任务的有效性以及动态权重策略在多任务学习中的优势。
跨模态不一致感知下双视角交互融合的多模态情感分析
卜韵阳, 齐彬廷, 卜凡亮
计算机科学. 2026, 53 (1): 187-194.  doi:10.11896/jsjkx.241100029
摘要 ( 64 )   PDF(2614KB) ( 6 )   
参考文献 | 相关文章 | 多维度评价
在社交媒体上,人们的评论通常会描述对应图像中的某一情感区域,图像和文本之间是具有对应信息的。以往的大多数多模态情感分析方法只是从单一视角探索图像和文本的相互影响,捕获图像区域和文本单词的对应关系,导致结果不是最优的。此外,社交媒体上的数据具有强烈的个人主观性,数据中的情感是多维和复杂的,导致出现了图像和文本情感一致性弱的数据。针对上述问题,提出了一种跨模态不一致感知下双视角交互融合的多模态情感分析模型。一方面,从全局和局部两种视角对图文特征进行跨模态交互,提供更全面、准确的情感分析,从而提升模型的表现和应用效果。另一方面,计算图文特征的不一致分数,用于代表图文不一致程度,以此来动态调控单模态表示和多模态表示的最终情感特征的权重,从而提高模型的鲁棒性。在MVSA-Single和MVSA-Multiple两个公共数据集上进行广泛实验,结果证明所提出的多模态情感分析模型与现有基线模型相比F1值分别提高0.59个百分点和0.39个百分点,具有有效性和优越性。
通道注意力指导全局-局部语义协同的表情识别
吕景刚, 高硕, 李玉芝, 周金
计算机科学. 2026, 53 (1): 195-205.  doi:10.11896/jsjkx.250900051
摘要 ( 81 )   PDF(3593KB) ( 5 )   
参考文献 | 相关文章 | 多维度评价
情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通道注意力策略,并结合全局和局部特征的协同机制来提升识别性能。首先,提出了一种抗噪数据增强策略,通过随机高斯模糊、透视变换和色彩扰动等抗噪预处理技术,结合图像拼接、随机翻转和旋转,在保留原始表情的细微特征的同时,提升图像清晰度并丰富数据集多样性和模型在细微情感识别中的鲁棒性。然后,设计了自适应分组排序的通道注意力模块(Channel Attention Module with Adaptive Channel Reordering,CAM-ACR),根据通道注意力函数对通道特征进行重排序,再经分组卷积和拼接获取包含多维度语义信息的局部特征。其次,在局部-全局特征增强机制中,利用局部特征指导优化全局特征的提取,增强全局特征对复杂情感模式和上下文信息的表征能力。最后,将局部特征与全局特征输入改进的交叉注意力融合模块,实现全局与局部特征之间的双向引导与协同增强。实验结果表明,所提方法在RAF-DB,CK+,FER2013和FER2013PLUS数据集上准确率分别达到91.21%,98.31%,74.54%和86.74%,在RAF-DB上学习效率和收敛稳定性均有优势1)
基于文本-图像多模态融合的变电所布局图纸图符检测方法
范家斌, 王宝会, 陈继轩
计算机科学. 2026, 53 (1): 206-215.  doi:10.11896/jsjkx.250200090
摘要 ( 111 )   PDF(4645KB) ( 8 )   
参考文献 | 相关文章 | 多维度评价
为了解决人工识别变电所布局图纸过程中存在操作不便、效率低、识别数据管理难等问题,提出了一种基于形态学的大尺寸图纸分割方法和基于文本-图像多模态融合的图纸图符检测方法,结合图符检测的后处理方法,形成了一种可推广到其他领域的大尺寸布局图纸图符检测思路。其中,文本-图像多模态融合图纸图符检测模型基于开集目标检测模型YOLO-World进行改进,通过引入卷积注意力协同模块(Convolutional Attention Collaboration Module,CTCM)、小目标图符特征增强模块(Small Object Feature Enhancement Module,SOFEM)和上下文引导融合模块(Context-aware Joint Feature Fusion Module,CJFFM),使模型在图符识别精度上有了明显提升。使用提出的方法,实现了对真实高铁牵引变电所布局图纸数据集的图符检测。改进模型相比原始模型,在保证模型复杂度未明显增大的情况下,图符识别平均精度达到了97.5%,mAP@50:95和mAP@90分别提高了1.1%和3.0%。
基于BEV感知的视觉平面图定位
陈集伟, 陈泽彬, 谭光
计算机科学. 2026, 53 (1): 216-223.  doi:10.11896/jsjkx.250300045
摘要 ( 62 )   PDF(2659KB) ( 3 )   
参考文献 | 相关文章 | 多维度评价
视觉平面图定位任务通过视觉观测数据与场景平面图表示的匹配实现位姿估计。实际应用中,有效融合视觉观测与平面图之间的几何和语义关联对提升定位精度至关重要。然而,现有方法存在两个主要局限:一是未能充分挖掘相机视野内的语义信息;二是缺乏几何与语义线索的联合匹配机制。针对上述问题,提出基于鸟瞰图(Bird Eye View,BEV)感知的视觉平面图定位框架,其包含3个核心模块:首先,BEV语义建图模块通过多模态图像投影变换构建局部场景的BEV语义表征,实现观测数据的结构化表示;其次,预期观测生成模块在平面图空间内生成预期观测数据库,通过可微分渲染方法实现观测数据的快速生成;最后,多层次匹配定位模块提出几何-语义联合匹配机制,通过层次化匹配策略融合BEV观测中的几何布局和语义类别信息,实现与平面图的精确匹配。实验结果表明,该框架在公开数据集Structured3D和自建仿真环境数据集IndoorEnv上的定位召回率分别从0.32%和4.82%提升到了3.12%和58.77%,显著优于现有基线方法Laser和F3Loc,从而验证了所提方法在复杂室内场景中的有效性和鲁棒性。
人工智能
基于长尾词分布的藏汉机器翻译数据增强方法
格桑加措, 尼玛扎西, 群诺, 嘎玛扎西, 道吉扎西, 罗桑益西, 拉毛吉, 钱木吉
计算机科学. 2026, 53 (1): 224-230.  doi:10.11896/jsjkx.241200147
摘要 ( 79 )   PDF(2186KB) ( 7 )   
参考文献 | 相关文章 | 多维度评价
现有藏汉机器翻译语料中存在领域数据分布不平衡的问题,导致训练出来的模型对各个领域数据的翻译能力表现不均衡。反向翻译作为一种常见的数据增强方法,通过提供更多样化的伪数据来提高模型的性能。然而,传统的反向翻译方法难以充分考虑数据的领域分布不平衡问题,导致模型在整体性能提升过程中难以提升资源稀缺领域的翻译性能。对此,通过深入分析语料中的长尾词的分布,有针对性地利用现有藏汉双语语料的长尾词来选取单语数据,通过反向翻译构造伪数据进行数据增强操作。这一策略旨在提升藏汉机器翻译模型整体性能的同时,改善数据匮乏领域的翻译性能。实验结果表明,通过充分考虑领域数据不平衡情况,结合长尾词数据增强,能够有效提升机器翻译模型在稀缺领域的翻译性能,为解决领域数据不平衡问题提供了一种有针对性的策略。
基于双层注意力网络的强化学习方法求解柔性作业车间调度问题
王皓焱, 李崇寿, 李天瑞
计算机科学. 2026, 53 (1): 231-240.  doi:10.11896/jsjkx.250100088
摘要 ( 96 )   PDF(2408KB) ( 11 )   
参考文献 | 相关文章 | 多维度评价
柔性作业车间调度问题作为作业车间调度问题的一种变体,因其广泛的适用性成为现代制造业智能化转型中的重要研究内容。近年来,深度强化学习被用于求解柔性作业车间调度问题,但允许将操作分配给具有不同处理时间的多台兼容机器的特点给决策和状态表示带来了额外的复杂性。为此,提出了一种基于改进的注意力机制和近端策略优化算法的端到端深度强化学习框架,用于解决柔性作业车间调度问题。基于异构析取图结构的特点,设计了一种基于分层注意力思想的双层注意力网络,包括节点级注意力层与类型级注意力层,充分提取操作与机器间的复杂信息,以支持高质量的调度决策。在合成数据集和公开数据集上的实验结果表明,所提方法在保持高效率的同时,性能和泛化能力均优于传统的优先调度规则方法和目前先进的深度强化学习方法。
基于任务同步的异构多核实时系统节能调度算法
赵小松, 黄超, 李鉴, 康玉龙
计算机科学. 2026, 53 (1): 241-251.  doi:10.11896/jsjkx.250300148
摘要 ( 57 )   PDF(2538KB) ( 11 )   
参考文献 | 相关文章 | 多维度评价
目前,多核实时系统中同步任务的节能调度研究主要针对的是同构多核处理器平台,而异构多核处理器架构能够更有效地发挥系统性能。将现有的研究直接应用于异构多核系统,在保证可调度性的情况下会导致能耗变高。对此,通过使用动态电压与频率调节(Dynamic Voltage Frequency Scaling,DVFS)技术,研究异构多核实时系统中基于任务同步的节能调度问题,提出同步感知的最大能耗节省优先算法(Synchronization Aware-Largest Energy Saved First,SA-LESF)。该算法针对所有任务的速度配置进行迭代优化,直至所有任务均达到其最大限度节能的速度配置。此外,进一步提出基于动态松弛时间回收的同步感知最大能耗节省优先算法(Synchronization Aware-Largest Energy Saved First with Dynamic Reclamation,SA-LESF-DR)。该算法在保证实时任务可调度的同时,实施相应的回收策略,进一步降低系统能耗。实验结果表明,SA-LESF与SA-LESF-DR算法在能耗表现上具有优势,在相同任务集下,相比其他算法可节省高达30%的能耗。
基于协作语义融合的多智能体行为决策方法
段鹏婷, 温超, 王保平, 王珍妮
计算机科学. 2026, 53 (1): 252-261.  doi:10.11896/jsjkx.250300145
摘要 ( 81 )   PDF(4318KB) ( 9 )   
参考文献 | 相关文章 | 多维度评价
多智能体行为决策方法,为工程应用领域,特别是协作任务下的智能体控制提供了广泛的应用前景。基于策略梯度的强化学习方法能够对智能体策略分布进行直接建模,更有利于复杂奖励机制下的策略多样性探索,在离散和连续空间中均能够提供较高的经验效能。基于策略梯度的多智能体联合策略生成通常采用参数共享等机制提升收敛效率,然而,这种机制缺乏对行为语义的建模,难以有效克服行为趋同性问题。针对该问题,从图建模的视角提出了一种基于协作语义融合(Collaborative Semantics Fusion,CSF)的行为序列预测方法。CSF方法利用图自编码器学习行为空间语义关系,获取相关性感知的行为语义嵌入;通过智能体行为特征与语义嵌入的交互实现信息融合。这种融合方式将具有协作关系的行为信息聚合于特定智能体的行为表示,实现多个智能体行为相互依赖的策略空间探索。在星际争霸和谷歌足球环境的多个复杂任务场景中开展实验,结果表明,CSF方法明显优于现有先进算法,验证了所提方法可以实现智能体间的高效协作。
用户数据驱动的App消退功能研究
贾经冬, 侯鑫, 王哲, 黄坚
计算机科学. 2026, 53 (1): 262-270.  doi:10.11896/jsjkx.250100070
摘要 ( 55 )   PDF(2220KB) ( 3 )   
参考文献 | 相关文章 | 多维度评价
为有效促进App功能迭代,现有大量研究通过挖掘用户评论来改善或增加新功能以促进版本更新,但忽视了从用户评论中识别应该消退的功能。针对此问题,提出了用户数据驱动的App消退功能分析方法。首先从应用市场采集用户评论,构建关键字模板过滤出含消退功能的评论,应用语法范式从中挖掘功能短语,并训练分类器识别功能短语以提取出待研究的消退功能,从而构建消退功能数据集。根据版本更新日志和用户评论回溯找到消退功能的生命周期。然后进行消退功能生命周期的用户评论分析。基于文本情感分析,提出字数权重阈值法对虚假评分进行检测和更正,运用BERT进行评论文本分类,提出BERTopic-Corex主题模型产生主题词,结合之前的分析结果和评论字数识别出关键用户评论,实现了从用户评论中有效分析和识别消退功能。实验结果和实例证明了所提方法的可行性和有效性。
基于元学习的跨语言知识图谱实体对齐框架
陈壮壮, 邓怡辰, 余敦辉, 肖奎
计算机科学. 2026, 53 (1): 271-277.  doi:10.11896/jsjkx.241100069
摘要 ( 68 )   PDF(2284KB) ( 11 )   
参考文献 | 相关文章 | 多维度评价
跨语言知识图谱实体对齐是连接不同语言知识图谱的关键步骤,在多语言信息检索、数据融合等任务中有重要作用。然而,现有的实体对齐方法依赖知识图谱中的多种信息,难以很好地处理稀疏知识图谱实体对齐任务,并且对新的语言的适应性较差。针对该问题,提出了基于元学习的跨语言实体对齐框架。该框架总体分为外循环与内循环两个阶段:在外循环阶段,通过基于任务相似度的采样方法选取出多个任务,然后对模型进行多任务联合训练,构建教师模型;在内循环阶段,利用外循环阶段训练好的教师模型指导学生模型进行训练和实体对齐任务,提升学生模型实体对齐的性能和泛化性。在SRPRS和WK31-60K数据集上的实验结果表明,所提框架在实体对齐问题中,Hits@1指标平均提升3.5%,Hits@10指标平均提升4.0%,MRR指标平均提升6.3%。
融合主题和实体嵌入的双向提示调优事件论元抽取
陈千, 成凯璇, 郭鑫, 张晓霞, 王素格, 李艳红
计算机科学. 2026, 53 (1): 278-284.  doi:10.11896/jsjkx.250100046
摘要 ( 101 )   PDF(3244KB) ( 4 )   
参考文献 | 相关文章 | 多维度评价
近年来,提示学习在自然语言处理领域得到了广泛应用。据调研,论元角色与文本中的主题往往有高度的语义相关性,且现有的提示调优方法忽略了实体信息和论元之间的交互。为此,提出一种融合主题和实体嵌入的双向提示调优事件论元抽取模型(TEPEAE)。首先,使用主题模型提取主题特征并进行主题嵌入化表示;其次,基于触发词、论元和实体信息构建提示模板,并将主题嵌入融入模板;然后,利用掩码语言模型预测每个实体的角色标签;最后,将标签从标签词空间映射到论元角色空间。在ACE2005-EN和ERE-EN数据集上的实验结果表明,TEPEAE优于基线模型,F1值分别达到79.53%和78.60%,验证了TEPEAE的有效性。此外,其在低资源场景下依然展现出卓越的性能,进一步证明其具有更强的鲁棒性。
信息安全
Android SDK安全性研究综述
许腾, 刘路遥, 姜灏宇, 罗畅, 李珩, 袁巍
计算机科学. 2026, 53 (1): 285-297.  doi:10.11896/jsjkx.250500023
摘要 ( 51 )   PDF(3236KB) ( 7 )   
参考文献 | 相关文章 | 多维度评价
Android SDK是Android应用开发所使用的软件工具包。由于单个Android SDK可以被集成至多个应用,给Android生态带来的安全性影响是链式的,因此Android生态安全面临着来自SDK的全面威胁。近年来一系列与Android SDK有关的安全问题,如SDK跨库调用隐私数据、SDK库资源合并覆盖等,引起了工业界和学术界的高度重视。但目前对于Android SDK的安全性研究缺乏完备性综述,对此,对现有相关工作进行详细整理,从Android SDK的内部组件代码安全与运行数据交互安全展开,在内部组件代码安全上整理了系统SDK层面和三方SDK层面的研究,在运行数据交互安全上整理了SDK本体违规和SDK外部入侵方面的研究,并分析了近年来的Android SDK安全性工作,引入了性能指标进行横向对比,梳理了其发展脉络和演化过程。最后展望了该领域与如今AI大模型等新兴技术结合使用的未来研究方向。
车联网边缘服务场景下的隐私保护计算:技术基础与研究进展综述
李佳惠, 李英龙, 陈铁明
计算机科学. 2026, 53 (1): 298-322.  doi:10.11896/jsjkx.250200113
摘要 ( 82 )   PDF(3942KB) ( 7 )   
参考文献 | 相关文章 | 多维度评价
随着智能汽车、边缘计算与无线通信技术的深度融合,“车-路-云”协同的智能车联网边缘服务体系快速发展,通过实时数据处理优化了交通效率与驾驶安全性。然而,开放边缘网络环境下海量车辆感知数据(如位置轨迹、驾驶行为)的交互与计算,面临窃听攻击和推理攻击等隐私泄露风险。虽然现有的隐私保护方案逐步增强了隐私保护效果,但车联网边缘环境下的动态拓扑与资源受限等特性,使得隐私保护强度与服务性能存在矛盾。隐私保护计算作为一种有效的隐私保护手段,对于维护用户的个人权益以及促进车联网产业的可持续发展具有重要意义,已成为保障车联网服务的关键研究领域之一。首先,概述了车联网边缘服务架构,并分析了其中潜在的隐私泄露风险。然后,根据隐私保护计算技术的不同机制,分类探讨了基于数据变换、安全多方计算、联邦学习和可信执行环境技术的车联网隐私保护计算方法。在此基础上,从隐私泄露风险、数据效用、开销和可扩展性4个关键评价维度出发,对隐私保护计算技术在车联网中的实际应用进行了系统性的分析与比较,可以更清晰地了解不同隐私保护计算方法在车联网中的优势、局限性和适用场景。此外,还阐述了相应的优化策略,为未来的研究和实践提供参考和指导。最后,探讨了未来车联网隐私保护计算的研究切入点和问题的解决思路。
分区稀疏攻击:一种更高效的黑盒稀疏对抗攻击
温泽瑞, 姜天, 黄子健, 崔晓晖
计算机科学. 2026, 53 (1): 323-330.  doi:10.11896/jsjkx.241200002
摘要 ( 73 )   PDF(3146KB) ( 8 )   
参考文献 | 相关文章 | 多维度评价
深度神经网络长期以来受到对抗样本的攻击威胁,特别是黑盒攻击分类下的稀疏攻击,这类攻击依靠目标模型的输出结果来指导生成对抗样本,通常只需扰动少量像素即可达到欺骗图片分类器的目的。然而现有的稀疏攻击方法采用固定步长和欠佳的初始化策略,使得对扰动的利用率较低,导致整体攻击效率不佳。为解决这些问题,分区稀疏攻击(SSA)方法1)应运而生。不同于其他方法使用的固定步长策略,SSA利用历史搜索信息来自适应调整步长,从而加速对抗样本的发现过程。此外,针对不同稀疏攻击在黑盒环境中都倾向于扰动高重要性像素的共性,设计了一种基于类激活图(CAM)可解释性方法的初始化策略,使得SSA能够快速识别并初始化具有高重要性像素的种群。最后,为了在随机搜索过程中将扰动限制在关键区域内并提升扰动的利用率,提出了分区搜索策略以进一步缩小SSA的搜索空间。实验结果表明,SSA在攻击传统卷积网络和视觉Transformer模型时均表现出色。与现有的先进方法相比,SSA能够将攻击成功率提高2%~8%,效率提升近30%。
基于贝叶斯理论的PBFT共识算法
潘彦炀, 杨槟豪, 纪庆革
计算机科学. 2026, 53 (1): 331-340.  doi:10.11896/jsjkx.241100053
摘要 ( 65 )   PDF(1978KB) ( 10 )   
参考文献 | 相关文章 | 多维度评价
共识算法是一种用于确保区块链网络中所有节点达成一致的方法,常见的有工作量证明(Proof-of-Work,PoW)和权益证明(Proof of Stake,PoS)等,共识机制的优劣影响着区块链系统的性能。为了解决现有区块链共识算法存在的吞吐量较小、时延较长等问题,对区块链中实用拜占庭容错(PBFT)算法进行改进,引入基于Bayes理论的动态信任模型(Dynamic Trust Model),通过节点信任机制改变节点在共识轮中的信任度,并按照信任度进行分组等操作,在保证PBFT稳定性的同时提高了系统可扩展性,且完善了网络节点的加入退出机制,使得网络可拓展性得到提高。通过实验测试,相比传统PBFT,改进后的算法在吞吐量上有25%的提升,在节点数量达到50的情况下时延只有PBFT的一半,所提方法的这两项指标相比HotStuff算法和Paxos算法也有20%~30%的提升。
基于STPA的飞行导引系统模式转换的安全性分析研究
左辰翠, 黄志球, 胡军, 谢健, 徐恒, 石帆
计算机科学. 2026, 53 (1): 341-352.  doi:10.11896/jsjkx.241000156
摘要 ( 42 )   PDF(4897KB) ( 5 )   
参考文献 | 相关文章 | 多维度评价
在民机自动飞行过程中,飞行导引系统的模式转换是影响安全的重要因素,应对其进行充分的安全性分析。传统安全分析方法主要关注各个组件的失效因素,忽略了由组件间非线性交互产生的安全问题。为此,采用系统理论过程分析(System Theory Process Analysis,STPA)方法,对飞行导引系统模式转换进行系统且完整的分析。同时,鉴于STPA方法中存在需人工分析的部分,引入了基于时间自动机理论的形式化模型检查工具UPPAAL对系统进行建模与验证,以确保控制结构图的正确性,并识别真正不安全控制行为(Unsafe Control Action,UCA),从而避免资源的浪费。最后,提出规范化的致因因素分析框架对通过验证的UCA进行逐一分析。实例证明,所提方法对航空类复杂系统安全性分析具有较好的效果。
基于变分量子的离散对数求解算法
张兴兰, 容潇军
计算机科学. 2026, 53 (1): 353-362.  doi:10.11896/jsjkx.241100181
摘要 ( 59 )   PDF(2704KB) ( 7 )   
参考文献 | 相关文章 | 多维度评价
离散对数问题是数论中的一个重要问题,因其求解困难,经典计算机没有高效的算法可以解决这一难题,故离散对数问题被广泛用于公钥密码体系中,而一旦离散对数问题被破解,将直接威胁密码系统的安全。但随着量子计算理论的引入,人们开始考虑采用量子计算机解决离散对数问题。目前求解离散对数问题的量子算法基本都基于Shor算法,但Shor算法由于自身的局限性,大多存在量子线路深度过大、使用量子比特数过多、后处理步骤复杂等问题,Shor算法难以在有噪声的中等规模量子(Noisy Intermediate-scale Quantum,NISQ)计算机上实现。为了解决这些问题,提出了基于变分量子的离散对数求解算法。首先,利用量子计算的并行性来计算参数化量子态的模幂,并设计标记解线路,将符合离散对数问题的解映射到辅助位上。然后,通过经典优化器不断对含参量子线路中的参数进行调整,使设计好的损失函数不断降低。最后,将经典优化器调整后的参数提出,并放入测量线路中进行测量,即可以较高的概率得到离散对数问题的解。与Shor算法相比,基于变分量子的离散对数求解算法减少了所需量子比特,同时将量子线路的深度减小了近一半。此外,还给出了详细的量子线路设计并用Python中的Qiskit包验证了所提算法的正确性。
基于可验证凭证的软件定义边界匿名身份认证方案
司雪鸽, 贾洪勇, 李惟贤, 曾俊杰, 门蕊蕊
计算机科学. 2026, 53 (1): 363-370.  doi:10.11896/jsjkx.250100080
摘要 ( 65 )   PDF(3111KB) ( 11 )   
参考文献 | 相关文章 | 多维度评价
标准软件定义边界(SDP)架构采用基于访问者身份的认证与授权策略,实时监控与审计访问行为。但访问者需完全披露身份信息以获取访问权限,可能泄露与服务无关的敏感数据,从而带来隐私风险。针对当前软件定义边界架构下存在的用户隐私信息难以得到有效保护、访问记录容易遭受恶意关联等问题,提出一种适用于软件定义边界架构的基于可验证凭证的匿名认证方案。基于双线性映射和 CL 签名构建可验证凭证的验证算法,并将可验证凭证体系与标准软件定义边界架构相融合,在不改变原有基于单包授权与 TLS 安全连接认证模式的前提下实现用户匿名访问。理论分析表明,此方案能够抵抗敲门放大攻击、身份仿冒攻击等常见的网络攻击。实验结果表明,此方案在多节点网络环境进行身份认证所产生的时延更短。
攻击图辅助下基于深度强化学习的服务功能链攻击恢复方法
周德强, 季新生, 游伟, 邱航, 杨杰
计算机科学. 2026, 53 (1): 371-381.  doi:10.11896/jsjkx.250300076
摘要 ( 62 )   PDF(4797KB) ( 3 )   
参考文献 | 相关文章 | 多维度评价
服务功能链(SFC)凭借按需编排、灵活组网等优势为6G六大场景提供定制化服务,6G网络则对服务功能链性能提出更高要求。弹性首次在6G网络中受到关注,要求服务功能链具备确保基本功能持续稳定的能力,其中弹性恢复是关键阶段。现有恢复方法往往基于备份机制,导致资源浪费,同时忽略了攻击路径对恢复的影响,导致恢复效果难以保证。因此,充分考虑网络攻击特征,利用服务功能链攻击图确定服务功能链,定制化攻击恢复方案,包括VNF恢复范围及攻击恢复等级需求。为进一步求解符合定制化攻击恢复方案的放置方案,提出了一种基于深度强化学习的服务功能链攻击恢复算法DRL-SFCAR。仿真结果表明,与现有方法相比,DRL-SFCAR在保证恢复成功率的同时,在时延和恢复成本方面表现优异,能够保证攻击恢复效果,同时最小化长期恢复成本,为网络攻击场景下的SFC恢复提供可行方案。
联合视觉-文本特征的复合型触发器后门攻击
黄荣, 唐迎春, 周树波, 蒋学芹
计算机科学. 2026, 53 (1): 382-394.  doi:10.11896/jsjkx.241200105
摘要 ( 60 )   PDF(4493KB) ( 4 )   
参考文献 | 相关文章 | 多维度评价
后门攻击指攻击者通过毒化数据集,隐蔽地诱导受害模型关联中毒数据和目标标签,对人工智能技术的可信和安全产生威胁。现有后门攻击方法普遍存在着有效性和隐蔽性之间顾此失彼的矛盾,有效性强的触发器隐蔽性差,反之,隐蔽性好的触发器有效性弱。针对该问题,提出一种联合视觉-文本特征的复合型触发器净标签后门攻击。复合型触发器由通用型和个性化两部分可学习的触发器叠加而成。复合型触发器的设计和优化均以块内像素值的同余为约束,旨在诱导受害模型捕捉同余规律,建立起触发器和目标标签的关联,形成后门。通用型触发器使得中毒图像的块内像素值对位权2同余,其信号形态对于所有的中毒图像单一固定;个性化触发器使得中毒图像的边缘像素值对LoSB(Lower Significant Bit)的位权同余,其信号特定于图像的边缘位置。两部分触发器相叠加,有利于兼顾有效性和隐蔽性。在此基础上,引入CLIP(Contrastive Language-Image Pre-training)模型,联合视觉和文本特征构建驱动复合型触发器训练的监督信号。预训练的CLIP模型具有较强的泛化能力,能够引导复合型触发器吸收异类的文本特征,起到弱化图像内容特征的作用,进一步增强触发器的有效性。在CIFAR-10,ImageNet,GTSRB这3个数据集上开展了实验。结果表明,所提方法能够抵御后门防御技术的侦测,在攻击成功率指标上平均超越次优方法2.48个百分点;在峰值信噪比、结构相似性度量、梯度幅度相似性偏差和学习感知图像块相似度4项指标上分别平均超越次优方法10.61%,0.31%,68.44%和46.38%。消融实验的结果验证了联合视觉和本文特征引导复合型触发器训练的优势,还验证了通用型和个性化两部分触发器对后门攻击的有效性和隐蔽性。
基于威胁感知的Tor多路径选择
陈尚煜, 扈红超, 张帅, 周大成, 杨晓晗
计算机科学. 2026, 53 (1): 395-403.  doi:10.11896/jsjkx.241200118
摘要 ( 52 )   PDF(3057KB) ( 6 )   
参考文献 | 相关文章 | 多维度评价
随着机器学习和深度学习的发展应用,攻击者可以通过Tor用户链路上的恶意节点以及恶意AS对其进行流量分析,从而对Tor用户进行去匿名化攻击。目前,常见的针对流量分析攻击的防御方法有两类:一类是通过插入虚拟数据包,或者延迟真实数据包从而改变流量特征,这种方法会引入带宽和时延开销;另一类将用户流量分割并通过多个路径传输从而进行防御,这种方法缺少对电路上存在的恶意节点以及恶意AS的感知,当攻击者搜集到完整流量踪迹时,依旧难以抵御流量分析对Tor用户的去匿名化攻击。为了弥补多路径防御方法在路径选择上存在的缺乏威胁感知的问题,提出了融合恶意节点感知以及恶意AS感知的基于威胁感知的多路径选择算法。首先提出一种改进的节点距离度量的方法,然后使用改进后的距离度量,基于K-Mediods算法对节点进行聚类,提高了恶意节点的检测效果;之后改进了AS感知算法,提高了匿名性要求;最后融合恶意节点检测以及AS感知算法提出了一种基于威胁感知的多路径选择算法。实验结果表明,该算法不仅能抵抗多种流量分析攻击,而且保证了一定的Tor电路性能。
自适应约束上界的对抗攻击优化方法
周强, 李哲, 陶蔚, 陶卿
计算机科学. 2026, 53 (1): 404-412.  doi:10.11896/jsjkx.250600144
摘要 ( 58 )   PDF(3034KB) ( 9 )   
参考文献 | 相关文章 | 多维度评价
深度神经网络易受对抗样本攻击。现有迁移攻击优化方法普遍使用固定的约束上界表示不可察觉性强度,重点关注如何提升攻击成功率,忽略了样本间的敏感性差异,导致不可察觉性(FID)效果有待提高。受自适应梯度方法的启发,以提高不可察觉性为主要目的,提出了一种自适应约束上界的对抗攻击优化方法。首先,通过梯度幅值建立敏感性指标,量化不同样本的敏感性差异程度;在此基础上,自适应确定对抗攻击优化方法的约束上界,实现敏感样本低强度、非敏感样本高强度对抗扰动的差异化处理;最后,通过替换投影算子和步长,将自适应约束机制无缝集成至现有攻击方法。ImageNet-Compatible数据集上的实验表明,所提方法在相同的黑盒攻击成功率下,FID较传统固定约束方法降低2.68%~3.49%;基于该方法的MI-LA对抗攻击算法较对抗攻击领域表现优异的5种攻击方法,FID降低6.32%~26.35%。
基于注意力机制的文档图像屏摄鲁棒水印方法
张小敏, 赵军智, 和红杰
计算机科学. 2026, 53 (1): 413-422.  doi:10.11896/jsjkx.241100040
摘要 ( 74 )   PDF(5047KB) ( 8 )   
参考文献 | 相关文章 | 多维度评价
屏摄鲁棒的水印算法在版权保护、追踪溯源等领域具有重要意义。现有的抗屏摄鲁棒水印算法大多关注于自然图像,忽视了对文档图像的研究。文档载体本身的冗余信息较少,水印的鲁棒性和不可感知性很难得到平衡。为解决这一问题,提出了一种基于注意力机制的文档图像屏摄鲁棒水印方法。为提升水印的不可感知性,在编码器网络中引入注意力特征融合模块,实现浅层特征和深层特征的自适应聚合。为提高算法的鲁棒提取能力,在解码器网络中设计了自适应通道与空间注意力模块,突出通道和空间维度中与水印信息高度相关的特征。同时,在屏摄噪声模拟过程中设计了摩尔纹失真层,以提高算法抵抗真实摩尔纹干扰的鲁棒性能。实验结果显示,所提方法的平均PSNR为33.4 dB,SSIM为0.988 5,RMSE为5.48,在多种屏摄场景的平均提取准确率可达99.49%。在图像质量和水印鲁棒性方面,均优于现有同类方法。
基于鲁棒分区水印的深度学习模型保护方法
吕正浩, 咸鹤群
计算机科学. 2026, 53 (1): 423-429.  doi:10.11896/jsjkx.241200005
摘要 ( 78 )   PDF(2010KB) ( 9 )   
参考文献 | 相关文章 | 多维度评价
机器学习涉及到昂贵的数据收集和训练成本,模型所有者可能会担心自己的模型遭到未授权的复制或使用,损害到模型所有者的知识产权。因此,如何有效保护这些模型的知识产权成为一个亟待解决的问题。为此,研究人员提出了模型水印的概念。类似于数字水印技术将水印嵌入图像的方式,模型水印通过将特定的标识嵌入机器学习模型中,以达到版权确认的目的。然而,现有的水印方案在实际应用中存在一些局限性。首先,水印的嵌入不可避免地会对模型性能产生一定影响;其次,水印可能会通过微调等技术手段被移除。针对此类问题,提出一种新型的神经网络水印方案,采用区域化和分阶段的嵌入方式。这种方法不仅旨在最大限度地减少对模型性能的影响,还力图提升水印本身的鲁棒性。在MNIST,CIFAR-10和CIFAR-100数据集上的实验验证了该方案的有效性。实验结果表明,该水印方案在保持水印存活率的同时,对模型性能的影响极小,相较于现有的基线水印方案,模型性能提升幅度最高可达18个百分点。此外,所提出的方案对微调等攻击手段表现出较强的鲁棒性,并且不受模型剪枝操作的影响。即便攻击者试图完全移除水印,也必须以显著降低模型性能为代价。