计算机科学

第53卷第3期目录

计算机科学. 2026, 53 (3): 0-0.

摘要 ( 191 )

PDF(411KB) ( 289 )

相关文章 | 多维度评价

图神经网络后门攻击与防御综述

丁艳, 丁红发, 喻沐然, 蒋合领

计算机科学. 2026, 53 (3): 1-22. doi:10.11896/jsjkx.250700093

摘要 ( 571 )

PDF(5345KB) ( 722 )

参考文献 | 相关文章 | 多维度评价

在人工智能技术驱动的智能信息系统中,图神经网络(GNN)因其强大的图结构建模能力,被广泛应用于社交网络分析和金融风控等关键场景的知识发现与决策支持。然而,此类系统高度依赖第三方数据与模型,使GNN面临隐蔽的后门攻击威胁。攻击者通过注入后门触发器或篡改模型,可诱导系统对含特定模式的输入产生预设错误输出,进而破坏智能信息服务的可信性与可靠性。为保障智能信息系统的安全可控,从数据和模型两个层面对GNN后门攻击与防御研究进行了系统性综述。首先,深入分析了GNN在数据集收集、模型训练和部署阶段面临的后门攻击风险,构建了清晰的GNN后门攻防模型。其次,依据GNN后门攻击的实施阶段和攻击者能力,将后门攻击分为包含了6种面向数据的攻击和2种面向模型的攻击;依据防御实施阶段和防御者能力,将GNN后门防御方法分为面向数据、面向模型和面向鲁棒训练的防御;对各类方法的核心原理、技术特点进行了详细对比分析,阐释了其优缺点。最后,总结了当前研究面临的主要挑战,并展望了未来研究方向。提出的后门攻防模型和分类体系,有助于深入理解智能信息系统中的GNN后门安全威胁的本质及技术演进,推动下一代可信智能信息系统的安全设计与实践。

大语言模型服务系统服务级目标和系统级指标优化

王智彬, 李世鹏, 周宇航, 李雪, 张中辉, 蒋智威, 顾荣, 田臣, 陈贵海, 仲盛

计算机科学. 2026, 53 (3): 23-32. doi:10.11896/jsjkx.250900173

摘要 ( 321 )

PDF(3130KB) ( 488 )

参考文献 | 相关文章 | 多维度评价

在大语言模型服务系统中,用户体验是一个关键考量因素。服务级目标和系统级指标是两种关键的性能衡量标准,前者关注单个请求的体验,后者关注系统的整体性能。然而,现有的度量标准存在两个与直觉相悖的问题:1)通过刻意延迟部分词元的交付可以提升服务级目标指标;2)主动丢弃不满足服务级目标的请求可以改善系统级指标。为解决上述问题,重新分析了大语言模型服务中的服务级目标和系统级指标,并提出了一种与用户体验更一致的新型服务级目标。基于此服务级目标,提出了一种名为“平滑有效吞吐量”的综合度量框架,其通过整合服务级目标和系统级指标来反映大语言模型服务中用户体验的本质。利用该统一框架,对不同大语言模型服务系统在多种工作负载下的性能进行了重新评估。评估结果表明,所提出的度量框架能够对词元交付和请求处理提供更全面的评估维度,并有效地捕捉在不同服务策略下用户体验与系统性能的最优点。

面向海光DCU基于自适应转置的大语言模型训练系统

周悦媛, 卢冠泽, 向佳为, 章家维, 邵恩, 何鑫

计算机科学. 2026, 53 (3): 33-40. doi:10.11896/jsjkx.250600073

摘要 ( 282 )

PDF(4132KB) ( 533 )

参考文献 | 相关文章 | 多维度评价

随着中美贸易摩擦加剧,我国对国产加速芯片的研发任务愈发紧迫。海光DCU采用类CUDA架构,凭借优异的兼容性和性价比,成为人工智能领域替代美国高端芯片的有力候选。然而,在海光DCU平台上,作为大语言模型训练关键算子的GEMM核函数的性能差异显著。针对该现象,研究了矩阵转置对rocBLAS算法库中GEMM核函数性能的影响,并提出最小化转置与自适应转置两种优化方法,以有效降低大语言模型的训练耗时。修改了PyTorch的线性层实现,提出了大语言模型分布式训练的最小化转置和自适应转置优化方法。实验结果表明,这两种优化方法在多种大规模语言模型(如 OPT-6.7B,LLaMA-7B,Bloom-7B 等)的分布式训练中均能显著降低训练时间。在83个测试样例中,自适应转置优化方法在72种情况下表现更优,相比基于原始PyTorch的Megatron-LM端到端训练时间提升最高达 24.27%。

基于大语言模型和深度网络的认知评估量表自动诊断

陈涵, 徐泽锋, 蒋究, 樊凡, 章军建, 何楚, 王文伟

计算机科学. 2026, 53 (3): 41-51. doi:10.11896/jsjkx.250600034

摘要 ( 275 )

PDF(4674KB) ( 515 )

参考文献 | 相关文章 | 多维度评价

认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究有较大意义。针对这一问题,聚焦于一个常用认知评估量表——蒙特利尔认知评估量表(Montreal Cognitive Assessment,MoCA),提出由大语言模型和基于深度网络的图像分类模型组成的自动诊断MoCA的框架,并在此框架下选用模型。为增强基础模型对量表题目的处理能力,提出了融合线性注意力的CSWin-FLA Transformer(Cross-Shaped Window With Focused Linear Attention Transfromer)和基于少样本的自动生成提示方法AGPoFS(Automatic Generation of Prompts Based on Fewer Samples),并设计了一个MoCA诊断流程。鉴于不存在公开的MoCA数据集,收集整理了武汉大学中南医院提供的量表数据组成数据集,从各个方法到整体系统分别进行实验,结果表明,该系统在提出的数据集上取得了最好的应用性能,证明了相关改进和整体系统的有效性。

SQL-MARS:面向用户模糊需求的 Text2SQL 结构化数据推荐系统

徐嘉雯, 郑云贵, 周伟, 徐尧强, 胡卉芪, 周烜

计算机科学. 2026, 53 (3): 52-63. doi:10.11896/jsjkx.250700096

摘要 ( 307 )

PDF(2845KB) ( 486 )

参考文献 | 相关文章 | 多维度评价

随着大语言模型(Large Language Model,LLM)技术的成熟,基于自然语言的数据库交互系统(如Chat2DB,ChatExcel)已实现广泛应用。然而,现有系统普遍依赖于“精确查询”假设,难以应对现实场景中广泛存在的模糊需求,即用户需要在与系统交互的过程中明确其查询需求。为了应对这个挑战,提出了SQL-MARS(SQL-oriented Multi-Agent Recommender System)。该系统基于“感知-行动-评估”闭环机制的多智能体协同框架,实现面向数据库模糊查询需求的动态判别与自适应处理。系统提出三层元数据架构建模用户需求以实现模糊感知。在此基础上,系统实现数据导航功能,根据用户的模糊需求分粒度向用户推荐查询建议,渐进式地引导用户澄清查询需求。同时,系统提出外部资料与本地数据融合机制,充分利用外部资料中有价值的信息。此外,还创建了Bird-fuzzy模糊需求数据集,系统实现了自动化评估。实验结果表明,SQL-MARS能够识别模糊需求并有效引导用户澄清数据需求。

基于节点影响力的图遗忘学习近似最差遗忘集构造算法

赵正彪, 卢涵宇, 丁红发

计算机科学. 2026, 53 (3): 64-77. doi:10.11896/jsjkx.250700094

摘要 ( 239 )

PDF(2171KB) ( 398 )

参考文献 | 相关文章 | 多维度评价

图神经网络(Graph Neural Networks,GNNs)因其在社交网络、推荐系统等领域的广泛应用而备受关注。近年来,个人信息遗忘权、数据产权保护、数据使用权过期等原因产生的数据遗忘需求不断加剧,使得图遗忘学习、深度遗忘学习和大模型遗忘等遗忘学习成为人工智能领域的研究热点。然而,现有研究大多设置为随机遗忘,忽视了对数据所有者数据遗忘权的最大保障,忽视了构造更极端场景以对不同遗忘学习算法进行深度综合评估。为此,面向图遗忘学习,提出一种基于图数据节点影响力的近似最差遗忘集构造算法,以近似最优构造图遗忘学习的遗忘节点样本集合。该算法结合节点的训练损失和结构中心性对图数据训练样本的节点影响力进行排序,从中识别出最具影响力且最难遗忘的节点集,从模型效用影响和节点重要性两个方面综合优选遗忘节点集合。利用不同图神经网络模型、图数据集和多个图遗忘学习算法进行实验,所提算法能使图遗忘学习算法更有效地降低模型效用,相较于随机遗忘策略模型效用下降幅度达15%;同时,该算法显著增强了不同图遗忘学习算法在多个指标上的差异性,能够更有效地对遗忘学习算法进行多维度评估。

基于双分支融合与分段域适应迁移学习的疲劳驾驶检测

李泽群, 丁飞

计算机科学. 2026, 53 (3): 78-87. doi:10.11896/jsjkx.250500025

摘要 ( 286 )

PDF(4566KB) ( 432 )

参考文献 | 相关文章 | 多维度评价

疲劳驾驶是引发交通事故的重要原因之一。针对实际场景中摄像头角度、环境光等因素导致的特征提取不足和不同数据下模型适应性差的问题,提出了一种新型基于迁移学习的疲劳驾驶检测框架。该框架通过设计卷积神经网络与Transformer双分支特征提取与融合结构,实现CNN与Transformer的优势互补,增强了模型的特征表征能力,充分提取了驾驶员的局部与全局面部特征。为提高模型在源域与目标域之间的自适应能力,框架采取分段域适应策略,在特征提取阶段采用对抗域适应和多核最大均值差异(MK-MMD)策略,并在特征融合阶段进一步引入MK-MMD和最小类别混淆损失(MCC),使模型充分适应不同数据。在两个具有显著特征差异的数据集上的实验结果表明,该框架在目标域上的检测准确率达到了93.3%(A为源域,B为目标域)和75.1%(B为源域,A为目标域),显著提升了模型的适应性与鲁棒性。

融合传播结构的群体语义驱动超图网络虚假信息检测方法

崔梦天, 何俐汶, 谢琪, 王方

计算机科学. 2026, 53 (3): 88-96. doi:10.11896/jsjkx.250800013

摘要 ( 249 )

PDF(3805KB) ( 428 )

参考文献 | 相关文章 | 多维度评价

在高频交互的社交网络环境中,虚假信息常通过用户群体的协同扩散来迅速传播,呈现出复杂的多阶传播结构和语义关联,是国家安全技术领域亟待应对的关键挑战之一。然而,现有仅依赖文本内容或传统传播图结构的检测方法无法有效建模这种高阶语义交互与协同行为。为此,提出一种融合传播结构的群体语义驱动超图网络方法(GSHN-DD)。该方法首先基于用户行为与信息主题构建初始超图,以捕捉群体协同与语义关联;然后通过链路预测与双层筛选机制挖掘潜在高阶超边,构建增强型超图拓扑结构;在此基础上,采用超图卷积网络与双层注意力机制,实现对全局群体传播模式与局部关键超边特征的融合;最后将传播特征与超图语义特征融合,生成统一的嵌入表示,并将其输入全连接分类器,完成虚假信息识别。在PolitiFact和GossipCop数据集上进行了实验,结果表明,GSHN-DD相较于最优基线方法,准确率提升了2~5个百分点,F1值提升了2~7个百分点。

多尺度聚合协同轴向语义引导的实体关系联合抽取方法

钱清, 陈辉程, 崔允贺, 唐瑞雪, 付金玫

计算机科学. 2026, 53 (3): 97-106. doi:10.11896/jsjkx.250500095

摘要 ( 221 )

PDF(4098KB) ( 435 )

参考文献 | 相关文章 | 多维度评价

近年来,基于表填充的实体关系联合抽取方法取得了显著效果,但现有研究尚未考虑到词对间的边界关联性建模,以及构建词对语义相似性问题。为解决上述问题,提出了一种基于多尺度聚合协同轴向语义引导的实体关系联合抽取模型。首先,设计的多尺度语义聚合模块通过并行多个不同尺寸的深度卷积提取不同排列下词对间的边界关联信息,从而丰富词对语义,识别隐形实体。其次,轴向语义引导模块通过行列带状卷积从轴向上进行卷积注意力校准,强化词对关键语义表征,从而改善词对间语义相似问题。最后,在数据集NYT^*,WebNLG^*,NYT和WebNLG上进行实验,该方法分别取得了93.2%,94.5%,93.2%和91.4%的F1得分,相较于基线模型分别提高了0.1个百分点、0.6个百分点、0.4个百分点和1.0个百分点,表明其能够捕获词对边界关联以及精细化词对语义,提升了实体关系联合抽取的性能。

融合多视角习题表征与遗忘机制的深度知识追踪

于程程, 姜永发, 陈方疏, 王家辉, 孟宪凯

计算机科学. 2026, 53 (3): 107-114. doi:10.11896/jsjkx.250700092

摘要 ( 224 )

PDF(2896KB) ( 378 )

参考文献 | 相关文章 | 多维度评价

知识追踪是智能教育系统中的核心任务,即根据学习者历史答题行为对知识点掌握程度进行建模并预测下一个答题结果。然而,现有方法普遍存在3个局限:1)多数依赖习题编号或知识点标签,未充分挖掘习题和知识点之间复杂的图结构特征以提高习题表征能力;2)未充分利用习题多维度属性信息来进一步提升习题嵌入表达能力;3)未充分考虑学习者学习知识遗忘规律对知识掌握的影响,导致预测效果受限。因此,提出一种融合多视角习题表征与遗忘机制的深度知识追踪模型(MEFKT),利用预训练模型学习具有高质量表达能力的习题嵌入,并结合学习者学习规律对答题行为进行预测。首先,基于习题关系图,利用无监督对比学习方法预训练包含图结构信息的习题表征;同时,基于习题/知识点相似性、习题难度、习题类型和习题答题时长等信息,构建包含多维度属性的预训练习题表征;接着,利用线性融合对齐机制,将多视角习题表征映射到同一表征空间,得到最终的习题表征;最后,结合遗忘机制构建行为预测模型,实现对学习者知识状态的动态更新及对下一个答题结果的预测。在两个公开数据集上进行的实验表明,MEFKT在预测效果上显著优于基准模型,其具备有效性和先进性。

图扩散模型方法与应用研究综述

赵海华, 唐瑞, 莫先

计算机科学. 2026, 53 (3): 115-128. doi:10.11896/jsjkx.250200118

摘要 ( 462 )

PDF(3305KB) ( 441 )

参考文献 | 相关文章 | 多维度评价

图扩散模型作为新兴的深度生成范式,凭借其渐进式生成机制和结构灵活等优势,在复杂图结构数据建模领域展现出了显著优势。为此,系统综述了图扩散模型的方法演进及其应用进展。首先,从生成机理层面解析了去噪扩散概率模型、基于分数的扩散生成模型和基于随机微分方程的扩散模型三大核心范式。其次,针对图数据的高维离散与非欧特性,对3种基本扩散模型在图数据上的创新性技术突破进行分类总结及深入分析。在此基础上,系统性总结和分析了图扩散模型的评价体系。在应用研究层面,重点探讨了图扩散模型在推荐系统和分子建模领域的应用研究。最后,基于以上论述,分别从图数据的离散性、图扩散模型的条件生成、应用的扩展以及评价体系4个方面对图扩散模型的未来发展的挑战和潜在研究方向进行展望。

基于二次学习的行为克隆优化方法

范文殊, 万盛华, 李新春, 孙海航, 黄楷宸, 甘乐, 詹德川

计算机科学. 2026, 53 (3): 129-135. doi:10.11896/jsjkx.250600131

摘要 ( 162 )

PDF(3076KB) ( 341 )

参考文献 | 相关文章 | 多维度评价

在行为克隆这一模仿学习方法中,智能体遇到专家数据中不包含的状态会随机采取行动,导致与专家策略产生偏移。这种现象被称为复合误差,是影响行为克隆性能的重要因素。为解决这一问题,首先说明行为克隆本质是二次学习的简易形式,接着指出在离散动作环境下,行为克隆只关注对齐专家策略采取的动作,忽视其他动作概率信息,对专家信息的提取不够完全。通过类比二次学习,提出能够提取专家数据中更多信息的完全行为克隆方法,并设计了多组对比实验,说明完全行为克隆不仅能缓解行为克隆的复合误差,还具备设备可迁移性高、抗噪能力强、专家数据依赖少等优点。实验结果表明,行为克隆仅需少量改进即可极具实用性,并且保持运行简便。此外,结果也进一步验证了二次学习在强化学习问题中的指导作用和有效性。

大模型指令微调的数据压缩:基于推理贡献度的精化

李昊, 丁立中, 傅稼润, 令狐赵桓

计算机科学. 2026, 53 (3): 136-142. doi:10.11896/jsjkx.250600087

摘要 ( 152 )

PDF(2335KB) ( 308 )

参考文献 | 相关文章 | 多维度评价

基于推理数据的大模型指令微调,通过显式建模复杂任务的多步逻辑关联,显著提升模型的推理准确性,然而微调过程依赖海量高质量数据,导致算力开销急剧攀升。已有数据压缩技术主要聚焦于原始规模缩减,普遍缺乏针对推理数据的压缩方法设计,忽视了推理数据中的多步逻辑关联、语义依存关系等,致使关键推理链完整性受损,进而降低了推理性能。为此,提出基于推理贡献度的精化(Refinement Based on Inference Contribution,RBIC)。通过分析推理数据的语义相似性构建知识领域图谱,精准定位核心信息。将数据样本的语义与大模型的推理准确率相结合,划分难度梯度,覆盖全场景推理需求。通过多步推理数据的逻辑复杂度量化推理贡献度,精化对模型推理贡献度最高的数据样本。实验结果表明,基于RBIC精化的推理数据进行微调后,模型平均推理性能仅下降1.13%,而训练时间缩短为原耗时的 16%,验证了RBIC在模型效能与资源消耗间实现了最优平衡,有望推动多领域大模型在资源受限环境下的高效部署与微调优化。

基于贝叶斯网的故障根因分析

刘华帅, 陶厚国, 岳昆, 段亮

计算机科学. 2026, 53 (3): 143-150. doi:10.11896/jsjkx.241200100

摘要 ( 200 )

PDF(2134KB) ( 293 )

参考文献 | 相关文章 | 多维度评价

故障根因分析旨在找到导致特定问题、故障或事件发生的原因,是多个领域中追踪溯源的重要支撑技术,但现有方法在效率、准确性和稳定性等方面仍不能满足故障根因分析任务的实际需求。对此,将贝叶斯网作为相关属性之间依赖关系表示和推理的知识框架,提出基于贝叶斯网的故障根因分析方法。首先,针对高维数据和稀疏样本带来的挑战,提出基于向量量化自编码器的高维属性约简算法,并给出α-BIC评分准则,高效地学习根因贝叶斯网(Root Cause Bayesian Network,RCBN)。随后,基于贝叶斯网嵌入技术实现RCBN的高效推理,高效计算各原因条件下故障产生的可能性,进而使用因果模型中的Blame机制度量各原因对给定故障的贡献度,从而实现故障根因分析。在3个公共数据集和3个合成数据集上的实验结果表明,所提方法的平均检测准确性和效率明显优于对比方法,在CHILD数据集上精度提升了7%,运行时间快了60%。

针对多标记表格数据的半监督学习方法

葛泽庆, 黄圣君

计算机科学. 2026, 53 (3): 151-157. doi:10.11896/jsjkx.250600149

摘要 ( 129 )

PDF(2060KB) ( 300 )

参考文献 | 相关文章 | 多维度评价

表格数据在医学、金融和制造业等领域具有广泛应用,其多标记分类任务对揭示现实世界中复杂的关联特性至关重要。然而,获取大规模标记数据集往往成本高昂,这给研究带来了挑战。虽然半监督学习利用未标记样本在图像和文本数据中取得了成功,但由于表格数据缺乏固有的空间或语义结构,使得传统方法效率较低。为了应对这些挑战,提出了一种针对多标记表格数据的半监督学习框架。该方法引入了一种结构保留的数据增强方法,在特征表示空间内添加高斯噪声保留原始数据结构,与基于一致性的正则化技术,在样本及其扰动版本之间进行正则化,以增强泛化能力。此外,还开发了一种基于注意力机制的机制,有选择地从标记数据中聚合邻域信息,从而使模型能够有效地利用局部特征相关性。在10个公共多标记表格数据集上进行了广泛的实验,结果证明了该方法的有效性。

基于指示词表征学习的半监督聚类方法

王一鸣, 焦敏, 赵素云, 陈红, 李翠平

计算机科学. 2026, 53 (3): 158-165. doi:10.11896/jsjkx.250600063

摘要 ( 169 )

PDF(2371KB) ( 378 )

参考文献 | 相关文章 | 多维度评价

当前聚类方法通过联合学习聚类友好的表征空间和聚类分配来提高性能,局限于视觉编码器产生的固定表征空间,并基于特征空间内的欧氏距离或余弦相似度的度量体系进行聚类分配。受扩散模型在稳定训练特性与指示词表征的条件控制能力的启发,在方法上,通过将类簇中心编码为可学习的条件嵌入向量,构建噪声预测误差驱动的生成式度量函数,突破传统欧氏空间线性可分性限制,并设计监督预训练与无监督调整两阶段动态优化策略,利用语义锚定和匹配损失协同平衡类内紧致性与类间可分性;在理论上,基于拉德马赫复杂度与噪声预测有界性假设,推导出聚类期望风险上界为$\mathcal{O}$(k／n),证明方法在大规模数据下的渐进一致性,保证所提出方法的泛化能力,同时,揭示监督信息通过强凸性约束和去噪网络Lipschitz连续性可将误差主项衰减速率提升至$\mathcal{O}$(1＼/nm_c),阐明标注量对假设空间的压缩效应;在实验上,所提方法在ImageNet-10等基准数据集上表现出竞争性结果,消融实验为该方法提供了实证支撑。

面向有向图的k-plex稠密子图挖掘算法

侯景乐, 李振军, 代强强, 李荣华, 王国仁

计算机科学. 2026, 53 (3): 166-172. doi:10.11896/jsjkx.250400086

摘要 ( 162 )

PDF(1795KB) ( 313 )

参考文献 | 相关文章 | 多维度评价

有向图的有向边可以表示关系的指向或数据的传递,在稠密子图挖掘中引入并拓展一些无向图的经典稠密子图模型对图挖掘工作有着重要帮助。为此,结合有向图的特点与k-plex的定义,称有向图中任意一个顶点的非出边邻居和非入边邻居均不超过k的子图结构为有向k-plex。已有工作给出了在无向图中枚举极大k-plex的输出敏感算法,然而它们无法直接应用于有向图。为了解决这一问题,提出了一种基于图分解的递归枚举算法。为了更进一步优化运行效率,引入了基于支撑点的剪枝策略,还提供了基于有向k-plex上界的优化算法来终止一些无效的搜索分支。在真实图数据上进行实验,结果表明,图分解算法与剪枝优化均取得了良好的效果,所提算法在处理真实图数据时具有很强的实用性,能在2 h内完成对KONECT数据集中数百组真实世界有向图的处理。

基于机械遗忘的部分域自适应

吴嘉豪, 彭力, 杨杰龙

计算机科学. 2026, 53 (3): 173-180. doi:10.11896/jsjkx.250200111

摘要 ( 178 )

PDF(2467KB) ( 344 )

参考文献 | 相关文章 | 多维度评价

域适应将知识从标签丰富的源领域转移到标签稀缺的目标领域,在减少目标领域数据标注需求的情况下,实现模型性能在目标领域的提升。作为一种更现实的扩展,部分域自适应放宽了源领域和目标领域完全共享标签空间的假设,并处理目标标签空间是源标签空间子集的情况。所提出的机械遗忘方法,通过遗忘异常权重类别来帮助解决具有挑战性的部分域自适应问题。具体而言,该方法首先采用传统部分域适应方法作为初始化模型,同时通过类别权重机制识别出异常权重类别;然后根据异常权重类别筛选源域数据集并生成噪声样本数据集,进而对模型进行遗忘操作,解决源域和目标域标签空间不匹配的问题;最后利用伪标签技术,让模型进一步对齐目标域的特征分布,从而促进正迁移。在Office-31和Office-Home这两个公开的基准数据集上进行的大量实验表明,所提出的机械遗忘方法在与最新的部分域自适应方法的性能相近的同时,显著超过了传统的部分域适应方法。

类型引导边匹配的异质图相似度学习方法

桑士龙, 陈可佳,

计算机科学. 2026, 53 (3): 181-187. doi:10.11896/jsjkx.250300002

摘要 ( 138 )

PDF(2857KB) ( 365 )

参考文献 | 相关文章 | 多维度评价

图相似度学习是通过学习图的结构特征来匹配图之间相似程度的方法。目前,基于图神经网络的图相似度学习方法仍局限于节点级或图级的匹配范式,忽视了边级表示及其对图结构匹配的贡献。此外,现实图中的边通常具有不同类型,代表节点间不同的语义关系,可用于引导跨图交互。因此,提出了一种类型引导边匹配的异质图相似度学习方法(TEM-HGSL),首先设计基于线图的异质图同构网络以更好地学习边的嵌入,然后通过类型对齐的边匹配机制以更好地利用边的语义信息,最终实现边-图双层级的图相似度计算。在4个异质图据集上的实验结果表明,TEM-HGSL方法计算的均方误差比最优基线平均降低了25.65%,能有效实现细粒度相似度计算。

基于KAN的双通道图神经网络

王静红, 李鹏超, 王熙照, 张自立

计算机科学. 2026, 53 (3): 188-196. doi:10.11896/jsjkx.250600067

摘要 ( 191 )

PDF(4107KB) ( 407 )

参考文献 | 相关文章 | 多维度评价

图神经网络(GNNs)是一种专门针对图数据的神经网络模型,近年来被成功应用在各种图学习任务上,如节点分类、链路预测等。然而,目前的图神经网络模型大多基于消息传递范式,无法充分捕捉节点的结构信息与特征信息之间的多维关联关系。此外,传统激活函数容易导致信息丢失和模型解释性不足的问题。为此,提出了一种基于Kolmogorov-Arnold网络(KAN)的双通道图神经网络(KDCGNN)。KDCGNN利用结构卷积和特征卷积,从两个通道分别提取图的结构信息和特征信息,生成节点的结构编码和特征编码,拼接融合后,进一步借助KAN对嵌入表示进行特征转换,提升分类性能和模型的可解释性。同时,引入一致性损失函数,鼓励结构编码和特征编码之间的分布一致性,从而增强模型的泛化能力。在3个经典引文网络数据集(Cora,Citeseer,Pubmed)上的实验表明,KDCGNN在节点分类任务中的表现优于现有基准方法。KDCGNN的提出为图神经网络的可解释性与性能优化提供了新思路。

基于多专家协同和信息交互的社会化学习

李林昊, 许亚楠, 董永峰, 王振

计算机科学. 2026, 53 (3): 197-206. doi:10.11896/jsjkx.250100068

摘要 ( 135 )

PDF(3184KB) ( 373 )

参考文献 | 相关文章 | 多维度评价

在分布式环境中,数据异质性表现为数据特征差异。专家模型协同存在知识孤立与任务分配不合理的问题,导致专家训练效果参差不齐,难以充分发挥各模型优势,使得整体性能受限。针对这些问题,提出了一种基于多专家协同和信息交互的社会化学习框架(Social Learning Based on Multi-expert Collaboration and Information Interaction,MECII)。该框架结合混合专家模型和社会化学习思想,通过多专家协同、门控网络、自适应信息交互和门控选择约束这四大模块,优化了专家间的知识共享与互补机制,有效解决了分布式学习中的数据异质性和专家协同问题。MECII通过精准的专家选择与任务分配,促进了专家之间的信息流动,使每个专家在处理特定数据时的准确率得到提升,增强了整体模型性能。实验结果表明,MECII在CIFAR-10和CIFAR-100数据集上相比传统的联邦学习基准方法有显著的性能提升,特别是在数据异质性场景下,与先进的FedL2P方法相比,MECII将分类准确率分别提高了6.69个百分点和5.13个百分点,且有效优化了每个专家的准确率。实验结果验证了MECII在促进专家协作和提升个体精度方面具有显著优势。

图正则化模糊自动编码器的重叠社区检测

邹晓阳, 鞠恒荣, 曹金鑫, 马星如, 黄嘉爽, 丁卫平

计算机科学. 2026, 53 (3): 207-213. doi:10.11896/jsjkx.250100093

摘要 ( 174 )

PDF(3594KB) ( 345 )

参考文献 | 相关文章 | 多维度评价

在复杂网络分析中,挖掘社区结构是一个重要且具有挑战性的研究方向。现有的基于深度学习方法在图相关任务中取得了不错的效果,但鲜有处理社区检测任务,尤其是重叠社区检测,并且也未能充分挖掘和利用网络的拓扑结构信息。为此,提出了一种图正则化模糊自动编码器的重叠社区检测方法(Overlapping Community Detection with Graph Regularized Fuzzy AutoEncoder,FAE)。首先,运用自动编码器将网络拓扑编码为低维表示,进一步通过模糊C均值聚类形成模糊隶属度矩阵,随后解码模糊隶属度矩阵以重构网络拓扑。然后,将用于刻画网络中结构信息的图正则融入上述自动编码器。再者,融合后的自动编码器构成堆叠自动编码器,以获取深度模糊隶属度矩阵。最后,基于模糊集理论,使用深度模糊隶属度矩阵划分重叠社区。在3组人工网络和6个真实网络上的实验结果表明,该方法基于重叠标准互信息熵(ONMI)、杰卡德指数(Jaccard)、F1分数(F1-Score)的评估性能优于7种经典算法的大部分算法,展示了其在处理复杂网络重叠社区检测问题上的潜力。

计算机视觉在轨道交通中的应用

赵斌贝, 朱力, 赵红礼, 李雨彤

计算机科学. 2026, 53 (3): 214-224. doi:10.11896/jsjkx.250400009

摘要 ( 171 )

PDF(3295KB) ( 396 )

参考文献 | 相关文章 | 多维度评价

轨道交通系统作为交通网络的骨干,因具有高效、便捷的特点,在现代社会中扮演着至关重要的角色。随着技术的持续进步,计算机视觉技术已成为推动轨道交通系统向更高效和更可靠发展的关键因素。对此,深入探讨了计算机视觉技术在轨道交通领域的研究现状,评估了该技术对提升运输效率和安全性的重要贡献,并分析了在实际应用中遇到的挑战以及可能的改进方向。从车站安全检测、轨道安全检测和车体状态检测这3个应用方向,分析了计算机视觉技术的应用内容以及当前研究的发展方向。最后,对未来发展趋势进行了展望,预测了计算机视觉技术将如何进一步推动轨道交通系统的自动化、智能化,以及在保障数据安全的前提下,为轨道交通领域带来更多创新和突破。

基于三维高斯溅射的低码率实时多视点视频流传输

王义总, 宁泓博, 王昊峰, 马思伟, 高文

计算机科学. 2026, 53 (3): 225-230. doi:10.11896/jsjkx.250700104

摘要 ( 188 )

PDF(2502KB) ( 413 )

参考文献 | 相关文章 | 多维度评价

多视点视频能够为用户提供沉浸式体验并支持多种应用,但其传输带宽需求远高于传统视频。现有多视点编码算法主要利用二维视点间的冗余信息,未考虑三维空间冗余。为此,提出一种多视点视频流传输方法,将多视点视频转换为稀疏视点紧凑表示来降低三维空间冗余,并基于该表示在接收端进行三维重建,合成剩余视点。具体包括:1)提出一种基于稀疏视点的多视点视频紧凑表示,利用三维高斯重建与溅射合成剩余视点;2)设计视点选择方法,以优化合成视点的视觉质量。实验表明,提出的系统相比基线方法可降低至少44.6%的码率,同时支持端到端30 FPS以上的实时传输。

关联策略多特征增强的多目标跟踪

陈云芳, 方倩, 吕尊威, 张伟

计算机科学. 2026, 53 (3): 231-239. doi:10.11896/jsjkx.241100094

摘要 ( 186 )

PDF(3244KB) ( 412 )

参考文献 | 相关文章 | 多维度评价

在复杂场景下,多目标跟踪面临密集的目标遮挡、目标非线性运动、关联匹配算法欠佳导致身份匹配错误以及频繁的身份切换等问题。对此,以ByteTrack为基线算法,充分利用现有的判别性特征,从运动模型、弱特征数据关联、匹配算法3个方面对其关联策略进行改进,提出了一种关联策略多特征增强的多目标跟踪算法。首先,针对常规卡尔曼滤波难以对非线性运动的目标位置进行预测的问题,利用预测相似度以及检测置信度动态调整卡尔曼滤波的噪声协方差,提升运动模型对位置预测的准确性。其次,整合二次关联算法,在低置信度检测框和第一次关联后未匹配的轨迹之间,执行弱特征数据关联,减少其与轨迹之间的匹配错误。最后,针对低置信度检测目标,利用相对深度对检测目标以及轨迹进行分解,并采用级联匹配算法进行关联,有效减少IoU匹配碰撞,提高了算法在密集遮挡场景下的跟踪表现。在MOT17与MOT20测试集上,所提算法的HOTA分别为64.5%与63.2%,与基线算法相比,所有评估指标均取得显著提升。

协同汇聚点内线束平滑布局方法

高景一, 罗睿明, 罗月童

计算机科学. 2026, 53 (3): 240-245. doi:10.11896/jsjkx.250300101

摘要 ( 142 )

PDF(2722KB) ( 403 )

参考文献 | 相关文章 | 多维度评价

随着电气化和智能化的不断发展,飞机、汽车等产品中的线束越来越多且复杂,布局安装也越来越困难。众多线束通过一系列被称为卡箍的汇聚点进行安装,一根线束会通过多个汇聚点,一个汇聚点包含多根线束。如果线束在汇聚点内的布局不合理,就可能导致线束之间产生交叉、扭转等问题,不满足线束平滑要求。目前主要由工程师根据经验手工调整汇聚点内线束的布局,但因为汇聚点多,且汇聚点之间相互影响,所以手工调整不仅工作量大,而且难以获得最优效果。针对这个问题,提出协同汇聚点内线束平滑布局算法。该方法首先把多汇聚点内线束布局转换为一组优化问题,通过优化求解获得满足平滑性要求的初步布局;对线束平滑问题进行数学建模,运用优化算法获得线束在所有汇聚点内的布局,保证线束的平滑性;然后提出保布局的线束紧凑算法,在保持线束平滑性的基础上,对汇聚点内的线束进行紧凑布局,以节约安装空间,提升线束稳定性。该算法已应用于合作方产品,合成案例与实际案例的测试结果展示了其有效性。

基于改进YOLO算法的学生行为检测方法

王鑫钰, 高东怀, 宁玉文, 许浩, 齐浩楠

计算机科学. 2026, 53 (3): 246-256. doi:10.11896/jsjkx.241100165

摘要 ( 186 )

PDF(5717KB) ( 392 )

参考文献 | 相关文章 | 多维度评价

为了解决课堂情景下学生行为检测因尺度变化大、遮挡严重、计算负担大而难以大范围普及等问题,提出了一种基于改进YOLOv8的轻量化学生课堂行为检测方法BDEO-YOLO。首先,在YOLOv8n的基础上引入动态卷积(Dynamic Convolution)对YOLOv8中的C2f模块进行改进,增强了模型对课堂复杂场景的适应性和特征表达能力。其次,通过结合双向特征金字塔网络(Bidirectional Feature Pyramid Network,BiFPN)和全局局部空间聚合(Global-to-Local Spatial Aggregation,GLSA)模块,优化了模型的多尺度特征融合能力,在模型的Backbone部分引入了高效局部注意力(Efficient Local Attention,ELA)机制,增强了模型对小目标和细节特征的检测能力。最后,设计了轻量化的检测头one13结构,简化了特征提取过程,大幅降低了模型的计算负担。在公开数据集STBD-08上的实验结果表明,BDEO-YOLO模型的mAP达到92.2%,比原始YOLOv8n提高了1.3个百分点,计算量从8.1 GFLOPs降低至4.8 GFLOPs,比原模型降低了40.7%,模型大小仅有5.7MB,验证了轻量化设计的有效性。在公开数据集SCB-Dataset3和VOC2007上进行验证,改进后的算法在各项性能指标上均有所提升,验证了模型的泛化能力,其在处理课堂中的遮挡、尺度变化和光照变化等问题上表现出较高的鲁棒性。

基于多粒度特征聚合与二分搜索的高效多视图立体重建

许立君, 赵宇杰, 赵敏, 马为駽, 陈侃松

计算机科学. 2026, 53 (3): 257-265. doi:10.11896/jsjkx.250200094

摘要 ( 157 )

PDF(3817KB) ( 374 )

参考文献 | 相关文章 | 多维度评价

在基于深度学习的多视图立体重建方法中,代价体构建面临高计算复杂度和内存消耗的挑战。现有研究多采用级联架构或迭代优化方法降低内存消耗,但级联架构的粗到细采样策略可能导致细节信息丢失,削弱关键特征感知能力。为此,提出了一种基于级联结构的二分搜索与多粒度特征聚合的多视图立体网络框架。该框架通过级联架构减少内存占用,利用二分搜索策略将深度范围划分为多个预选区域,并通过离散分类方法压缩深度值搜索空间,提高深度检索效率并降低内存需求。此外,提出了多粒度特征信息聚合策略,将粗粒度全局语义信息嵌入细粒度代价体构建中,同时关注细粒度局部纹理信息。通过融合不同层次的特征表示,并在聚合模块中引入视图内自适应聚合和逐视图自适应加权策略,增强了模型对全局结构和局部细节特征的感知能力。实验结果表明,在DTU和Tanks & Temples公共数据集上,此方法在保持低内存消耗的同时,实现了优异的点云重建效果。

融合ByteTrack的EAP-YOLOv8无人机Marker点检测与追踪

唐心亮, 潘晓润, 王建超, 苏鹤

计算机科学. 2026, 53 (3): 266-276. doi:10.11896/jsjkx.241100115

摘要 ( 182 )

PDF(4767KB) ( 387 )

参考文献 | 相关文章 | 多维度评价

随着科技不断发展,无人机的应用越来越广泛,实现无人机的精准动作捕捉成为其核心技术。光学动作捕捉系统在对无人机进行检测与追踪时,由于受到复杂环境、飞行速度等多方面的干扰,会出现对无人机所粘贴的Marker点识别不准确的情况。为了解决这一问题,提出一种基于YOLOv8改进的目标检测算法EAP-YOLOv8,以提高Marker点识别检测的准确率。首先,在骨干部分构建新型通道注意力机制MAP-ECA,增强全局视角信息和不同尺度大小的特征,提升了小目标的检测能力;其次,在原有检测头的基础上利用多层次自适应特征融合形成新的检测头D-SASFF,利用多尺度融合来强化小目标特征信息;最后,设计了损失函数PIoUv3,通过改进加快了模型收敛速度,提高了小目标检测能力。为验证EAP-YOLOv8算法的有效性,在自制数据集上进行实验,结果表明,EAP-YOLOv8算法在mAP@0.5和mAP@0.5:0.95上分别达到了96.5%和50.2%,相较于其他算法有显著提升。在此基础之上,通过结合多目标追踪算法ByteTrack显著提高了Marker点的追踪准确率。此外,在公开数据集MOT16上进行追踪实验,结果表明,所提模型在HOTA,MOTA,MOTP上追踪准确率分别达到了37.60%,25.64%,80.76%,相较于当前算法有显著提升,为后续实现无人机精准跟踪提供了有效途径。

CA-SFTNet:基于空间特征变换和浓缩注意力机制的皮肤病灶分割模型

张伟, 梁敦英, 周婉婷, 程祥

计算机科学. 2026, 53 (3): 277-286. doi:10.11896/jsjkx.250200049

摘要 ( 170 )

PDF(4007KB) ( 413 )

参考文献 | 相关文章 | 多维度评价

针对皮肤病灶边缘模糊、毛发等噪声导致的分割病灶区域不完整、病灶特征分布差异较大等问题,基于U-Net提出一种结合浓缩注意力机制和残差空间特征变换的皮肤病灶分割算法CA-SFTNet。首先,在模型下采样过程中进行特征切分,保留皮肤病灶浅层语义信息。其次,在跳跃连接处引入浓缩注意力机制(Condensed Attention Neural Block),使得模型能够聚焦于病灶区域,提高分割精度。最后,在模型尾部加入残差空间特征变换层(Residual Spatial Feature Transformation Layer),增强对皮肤病变图像不同区域的自适应调整能力,提高模型对特征分布差异较大病灶的识别能力。实验在ISIC2017和ISIC2018数据集上进行,结果表明,CA-SFTNet在分割性能上优于传统U-Net,Dice系数分别达到93.12%和92.36%,比U-Net提升7.15个百分点和4.81个百分点;IoU值分别为82.59%和82.31%,比U-Net提升6.23个百分点和4.45个百分点。相比TransUNet和Swin-UNet等拓展算法,Dice系数提升2~6个百分点,IoU值提升1.8~4个百分点。这些结果证明了改进算法在皮肤病变区域分割上的优越性,其能够有效提高分割精度。

基于少量目标数据和深度学习的行人重识别方法

付昱凯, 李庆珍, 董志学, 师冬丽, 赵鹏

计算机科学. 2026, 53 (3): 287-294. doi:10.11896/jsjkx.260100073

摘要 ( 209 )

PDF(3158KB) ( 347 )

参考文献 | 相关文章 | 多维度评价

行人重识别(ReID)在跨摄像头检索场景中具有重要的应用价值,但深度模型在真实部署时常面临显著的域偏移问题,即在源域数据集上训练良好的模型迁移到新的目标摄像头网络后性能大幅下降。现有无监督域自适应方法通常依赖大量目标域未标注数据进行离线聚类,但在临时部署、隐私受限或目标数据难以提前收集的情况下,该前提往往难以满足。针对此问题,提出一种基于少量目标数据的深度行人重识别适配框架,以源域预训练模型为起点,冻结主干参数,仅引入轻量参数高效适配模块进行目标域校准;同时采用基于原型的稳定小样本决策,将少量目标标注样本聚合为类中心,以减少小样本噪声;并结合原型分类损失和排序约束共同优化,兼顾目标域适应能力与特征稳定性。在 Market-1501 与 DukeMTMC-reID 的跨数据集迁移实验中,所提方法在两个迁移方向均取得显著的性能提升。在 Market→Duke 上mAP和Rank-1分别达到 79.68%和 93.10%,在 Duke→Market 上mAP和Rank-1分别达到 76.07% 和 93.79%,并在逐轮增量适配中表现出持续的性能提升趋势。该方法能够在不依赖大规模目标数据的前提下实现有效且可迭代的跨域适配。

表格问答研究综述

吴贤杰, 李彤亮, 李舟军

计算机科学. 2026, 53 (3): 295-306. doi:10.11896/jsjkx.250900006

摘要 ( 211 )

PDF(2866KB) ( 400 )

参考文献 | 相关文章 | 多维度评价

表格作为一种重要的数据载体,能以紧凑的形式承载大量高价值信息,被广泛应用于经济、金融及科研等领域。表格问答(Table Question Answering,TableQA)旨在针对用自然语言描述的问题,从表格数据中自动进行推理并生成相应的答案,是自然语言处理与数据分析交叉领域的重要研究方向。与传统的文本问答和知识库问答相比,表格问答不仅需要理解自然语言,还须解析表格的二维结构,并处理数值计算与复杂逻辑推理,因此面临更大的挑战。近年来,随着多样化数据集的持续构建,表格问答技术不断取得进展。其研究范式经历了从基于规则与模板的方法,到统计学习与神经网络模型的应用,再到预训练语言模型的引入,整体性能不断提升。尤其是近年来大语言模型(Large Language Models,LLMs)的兴起,进一步推动了表格问答进入新的发展阶段。凭借卓越的跨任务泛化能力与推理能力,大语言模型加速了新型研究范式的形成与发展,为方法创新提供了有力支撑。文中系统梳理了表格问答技术的演进脉络与代表性方法,重点总结了大语言模型驱动下的最新研究进展,概述了当前研究面临的关键挑战,并对未来发展趋势进行了展望。

大语言模型驱动的言语障碍评估方法综述

徐成, 刘宇轩, 王欣, 张铖, 姚登峰, 袁家政

计算机科学. 2026, 53 (3): 307-320. doi:10.11896/jsjkx.250300125

摘要 ( 199 )

PDF(3221KB) ( 411 )

参考文献 | 相关文章 | 多维度评价

随着言语障碍对个体认知发展和社会适应能力的负面影响日益凸显,构建智能化评估体系成为语言康复领域的重要课题。传统评估方法依赖人工观察和浅层特征分析,存在主观性强、效率低及跨场景泛化能力不足等局限性。大语言模型驱动的评估技术通过融合多模态数据与深层语义建模,提升了病理语音检测的客观性和精准度。对此,系统梳理了言语障碍评估领域的技术演进路径,从声学特征提取到多模态融合架构,重点分析基于Transformer架构的多模态融合方法在跨语言迁移和实时干预中的创新应用。通过对比分析主流数据集与评价指标,揭示了大语言模型在语音清晰度量化、语义一致性检测等任务上的性能优势,但现有方法仍面临评估标准动态适配不足、生成偏见治理机制缺失等核心挑战。未来研究需构建动态可扩展的评估体系,通过伦理约束机制与跨模态对比学习框架突破高维语义一致性建模瓶颈,同时深化临床验证与隐私保护机制,推动智能评估技术向精准化、公平化方向迭代升级,为构建精准化、可扩展的智能评估系统提供方法论指导,推动其在教育干预与远程医疗场景的规模化应用。

基于大型语言模型增广的少样本持续毒性检测

李雯莉, 冯小年, 钱铁云

计算机科学. 2026, 53 (3): 321-330. doi:10.11896/jsjkx.250600010

摘要 ( 152 )

PDF(2950KB) ( 350 )

参考文献 | 相关文章 | 多维度评价

毒性言论检测是困扰网络社交媒体的一个具有挑战性的问题。现有方法尽管能够有效识别常见的有毒信息或经由特定扰动模式产生的有毒信息,但也面临两大挑战:1)由于毒性类型和语言表达的多样性,训练集不可能覆盖所有样本,毒性检测技术面临着毒性文本数据缺乏的问题;2)现实中的恶意用户倾向于创建新的扰动模式来欺骗文本毒性检测器,如何将模型对旧扰动模式的检测能力迁移到新扰动模式上,已成为一个亟待解决的问题。对此,提出了一种基于大型语言模型增广的少样本持续毒性检测模型。其基本思想是利用大型语言模型对训练集中的样例进行增广,再将持续学习与毒性检测技术相结合,确保毒性检测模型能够持续高效地检测文本中的毒性。通过上述方式,模型不仅能够更精确地理解有关不同扰动模式的特征,还能提高其在少样本持续毒性检测任务中的适应性与鲁棒性。在最新的DynEscape数据集上进行的实验表明,该模型优于现有基线模型,达到了最佳性能。

融合本体和实例的知识图谱嵌入模型

秦晶, 李贯峰, 陈昱胤, 肖毓航

计算机科学. 2026, 53 (3): 331-340. doi:10.11896/jsjkx.250200101

摘要 ( 174 )

PDF(1698KB) ( 328 )

参考文献 | 相关文章 | 多维度评价

知识图谱嵌入通过将实体和关系投影到连续的低维向量空间中,为机器学习模型提供更强大的知识表示输入,从而支撑更多的知识图谱应用场景。近年来,研究人员试图利用知识图谱中的本体和实例之间的潜在语义信息来增强知识图谱的嵌入。然而,它们未能有效融合概念的层次结构和实例的特定信息,并且忽略了isA关系之间的传递性,导致模型在处理知识图谱中的长尾实体时的性能和泛化能力受限。为了弥补上述不足,提出了一个融合了本体和实例的知识图谱嵌入模型JMOI(Representation Learning of Knowledge Graph via Jointly Modeling Ontology and Instances)。该模型通过引入自注意力机制,能够捕捉到概念和实例之间复杂的语义关系,并增加了一个可学习的参数来调整概念嵌入的邻域范围,以区分不同概念的层次信息,从而对isA关系的传递性进行建模。在YAGO26K-906和DB111K-174数据集上的实验结果表明,与现有技术相比,JMOI在大多数情况下都达到了最佳性能,与次优模型相比,在链接预测 Hits@1 指标上最大提升了6.5%,在三元组分类中召回率指标最大提升了 6.9%。

基于特征增强式多轮机器阅读理解的方面情感三元组抽取

郝渊斌, 段利国, 李爱萍, 陈嘉昊, 崔娟娟, 常轩伟

计算机科学. 2026, 53 (3): 341-350. doi:10.11896/jsjkx.250300039

摘要 ( 169 )

PDF(3003KB) ( 365 )

参考文献 | 相关文章 | 多维度评价

方面情感三元组抽取(ASTE)旨在同时提取出文本中的方面及其对应的观点和情感极性,是一项新兴且具有挑战性的方面级情感分析任务。现有方法中,基于多轮机器阅读理解的方法有效实现了情感三元组抽取,但仍存在一定的局限性:其一,多轮阅读理解中单一的文本特征难以适应特定子任务;其二,全局自注意力机制缺乏对语法层面更重要单词的关注,且其对不重要单词赋予更高的注意力权重。针对这些问题,提出一种特征增强式多轮机器阅读理解方法(EMT-MRC),在每轮机器阅读理解中设计双向注意力流构建文本与问题的交互关系,从而获得特定任务感知的文本表示。同时,将依存句法关系整合到Transformer编码器,通过依存距离约束模型注意力分布,加强模型对句子语法层面的关注。通过在两组基准数据集上的实验,证明了提出方法的有效性。

基于目标相似性驱动与双端变量引导搜索的大规模多目标进化算法

杨昌好, 秦进, 王豪

计算机科学. 2026, 53 (3): 351-365. doi:10.11896/jsjkx.250200091

摘要 ( 163 )

PDF(3680KB) ( 375 )

参考文献 | 相关文章 | 多维度评价

大规模多目标优化问题涉及成百上千维的决策变量,致使探索空间过于庞大,这给进化算法在有限资源内快速得到理想解集合带来了巨大挑战。为此,提出一种基于目标相似性驱动与双端变量引导搜索的大规模多目标进化算法(LMOEA/OS-DES)。LMOEA/OS-DES包含3种策略:第一种是基于目标相似性驱动的多种群共同进化策略,以快速得到反映Pareto最优解分布特点的解;第二种策略根据精英解在决策空间上的分布特点,设计多种决策变量分组方案,以适应不同目标向量方向最优解的分布差异,再结合分组方案,增强探索性的双端变量引导搜索采取较之前策略更大的探索强度,生成与先前精英解分布特点相近的新解,以加速优化收敛性与多样性;在最后一种策略中,借助竞争群优化在优解周围探索,以优化多样性。将LMOEA/OS-DES与其他8个具有竞争力的算法,在100至5 000维的LSMOP及UF问题上进行对比实验。结果表明,LMOEA/OS-DES具有显著优势。

优化概率选择求解SAT问题

贾书恒, 付慧敏

计算机科学. 2026, 53 (3): 366-374. doi:10.11896/jsjkx.241200211

摘要 ( 137 )

PDF(1989KB) ( 305 )

参考文献 | 相关文章 | 多维度评价

在SAT问题的随机局部搜索算法中,主流变量决策策略基于概率选择变量,如probSAT求解器通过计算变量的break值确定选择概率。然而,该方法易陷入局部最优,尤其在应用类问题中表现不佳。为此,提出了一种结合配置检测策略的变量决策方法,动态调整变量选择概率函数。当环境不变时,优先选择break值较低的变量,增强全局优化能力。针对长子句的高扫描开销问题,引入重要邻居数组策略,将高活跃度变量纳入数组,降低计算复杂度。同时,设计了重启机制,利用probSAT在初期快速降低不可满足子句数量的优势,避免后期全局重复翻转现象,提升求解效率。改进后的probSAT_PCCR求解器在长期未解决的数学应用问题测试中表现显著提升,比原始probSAT多解决了142个案例,性能提升546.1%。在美国联邦通信委员会(FCC)的实际应用问题测试中,多解决了1 596个案例,性能提升33.5%。结果表明,通过多种策略改进的 probSAT 求解器在解决 SAT 问题的应用类问题上性能大幅提升,具有重要应用价值。

基于Transformer架构的RNA二级结构预测方法

喻定, 李章维

计算机科学. 2026, 53 (3): 375-382. doi:10.11896/jsjkx.250100005

摘要 ( 155 )

PDF(3822KB) ( 370 )

参考文献 | 相关文章 | 多维度评价

RNA二级结构预测是生物信息学中的核心问题,近年来,深度学习技术的发展为该领域带来了显著进步。然而,现有方法在预测精度和对外部先验模型的依赖性方面仍存在不足,这些限制可能对模型的鲁棒性和泛化能力造成影响。针对上述问题,提出了一种基于Transformer架构的RNA二级结构预测模型。该模型设计了两条特征编码通路,通过线性嵌入和独热编码生成序列特征,并利用交叉注意力机制高效融合两种特征表示。在特征提取阶段,模型采用改进的Swin-Transformer与U-Net相结合的架构(Swin-UNet),实现深层次特征提取,并最终生成RNA二级结构配对概率矩阵。实验结果表明,该模型在多个标准数据集上的F1得分领先了其他模型3%以上,且无须依赖外部模型的先验信息。研究结果为RNA结构预测提供了新的解决方案,同时展现了Transformer架构在生物序列分析中的广阔前景。

基于多任务学习的眼科视频特征融合与多维画像

杜剑彤, 管泽礼, 薛哲

计算机科学. 2026, 53 (3): 383-391. doi:10.11896/jsjkx.260200058

摘要 ( 151 )

PDF(2912KB) ( 387 )

参考文献 | 相关文章 | 多维度评价

针对社交网络眼科视频存在的视觉特征区分度低、文本描述口语化严重以及多模态语义异构等挑战,提出了一种基于多任务学习的眼科视频特征融合与多维画像构建方法(OVP),从非结构化的视频流与文本流中挖掘具有医学语义价值的多维特征,以实现对眼科视频的精准表征。利用预训练深度残差网络提取视频关键帧的高维视觉表征,捕捉眼科图像特有的细粒度特征;提出基于眼科知识图谱的眼科视频文本特征提取方法,通过检索并融合外部实体注解与关联知识,有效弥补了社交媒体文本专业语义稀疏的问题,并结合BERT模型提取富含领域知识的文本特征;在此基础上,设计跨模态注意力融合机制,动态计算视觉与文本特征的交互权重,实现了图像信息与医学语义的深度对齐。构建多任务联合优化与眼科多维画像,协同训练视频疾病分类、传播热度预测与内容质量评估3个子任务,利用任务间的共享信息提升泛化能力。在真实眼科视频数据集上进行实验,实验结果表明,OVP方法在眼科视频疾病分类准确率、热度预测及质量评估性能上均显著优于现有基线方法,验证了该方法在复杂眼科视频特征融合与多维度画像构建方面的有效性。

基于服务器无感知计算的网络带宽快速测量方法

杨若萱, 金飞宇, 曲连威, 周子杰, 郑奇斌, 李振华

计算机科学. 2026, 53 (3): 392-399. doi:10.11896/jsjkx.250600011

摘要 ( 263 )

PDF(2098KB) ( 316 )

参考文献 | 相关文章 | 多维度评价

以5G/6G和WiFi 6/7为代表的新一代移动网络在显著提升接入带宽(简称网速)的同时,也加剧了网络性能(如吞吐量、时延和丢包率)的波动,导致测速时间延长、流量开销增加、用户体验下降,并且难以满足基于微内核的泛在计算系统(如MINIX,QNX和seL4)在任务管理与进程间通信时对网络低成本、高实时性的迫切需求。基于云函数和云容器的服务器无感知计算虽然提供了潜在的解决思路,但现有的以 Swiftest 为代表的快速带宽测量方法深受长尾流量效应的制约,造成了严重的流量浪费。为此,提出一种基于服务器无感知计算的智能化网络带宽快速测量方法。首先,结合底层传输机制与实际测量数据分析了现有方法中长尾效应存在的原因。在此基础上,设计了突发式快启动的数据传输机制,将传统的平滑递增数据包发送策略分解为多轮短时的突发传输模式,通过客户端的动态反馈,实时调控发送速率、缩短传输时间并提高测量精度,规避因控制反馈延迟而引起的长尾流量浪费问题。多个典型网络场景下的实验结果表明,相比Swiftest,所提出的方法将服务端的发包流量减少了85％,测量时间缩短到平均1.6秒,显著降低了服务端资源压力和用户端流量开销,并且具备良好的泛在计算环境工程可部署性。

数据中心网络SWCube的连通度和诊断度

张昕帆, 程宝雷, 樊建席, 王岩

计算机科学. 2026, 53 (3): 400-410. doi:10.11896/jsjkx.250400096

摘要 ( 167 )

PDF(2258KB) ( 339 )

参考文献 | 相关文章 | 多维度评价

随着服务器规模的日益增大,数据中心网络需要更高效的性能。为此,研究者提出了各种新型数据中心网络以改进传统数据中心网络存在的可靠性低、部署成本高、吞吐量小等劣势。SWCube是一种基于广义超立方体构建的新型数据中心网络,其通过将交换机部署在广义超立方体的节点上并将双端服务器部署在广义超立方体的边上连接交换机而得到,其逻辑图是广义超立方体的线图。SWCube被证明具有二部带宽高、容纳服务器数量多、可扩展性强等诸多优势,然而其可靠性尚未得到论证。网络的可靠性分为容错能力和故障诊断能力,通常使用连通度衡量容错能力,并用在不同模型下进行系统级诊断,得到的诊断度用于衡量网络的故障诊断能力。为此,给出了SWCube逻辑图SWC(m_r,m_r－1,…,m₁)的递归定义,并据此得到了SWCube逻辑图SWC(m_r,m_r－1,…,m₁)的连通度,其在r=2且m₂=2时是$\sum_{i=1}^{r}\left(m_{i}-1\right)$,在r≠2或m₂>2时则是$2 \sum_{i=1}^{r}\left(m_{i}-1\right)-2$,并基于此得到了SWCube在PMC模型和MM^*模型下的诊断度。

基于应用程序的隐蔽信道研究综述

常慧妍, 扈红超, 周大成, 许德鹏, 程国振

计算机科学. 2026, 53 (3): 411-423. doi:10.11896/jsjkx.250400047

摘要 ( 169 )

PDF(2092KB) ( 338 )

参考文献 | 相关文章 | 多维度评价

近年来,在安全可信的应用程序所生成的网络信息流中应用隧道实现信息隐蔽,已成为构建隐蔽通信信道的常见技术手段。随着隐蔽信道技术的发展,基于各类不同应用程序的隐蔽信道系统被相继提出,但当前综述多聚焦于深入探讨其技术原理和定义,在分类的详细解析上略显不足,并且缺乏对分类依据以及各类系统优缺点的详尽阐述。因此,对基于应用程序的隐蔽信道这一领域进行全面并深入的综述。从底层应用程序角度出发,将其分为多媒体流应用程序型和实时在线游戏型两大类。依据嵌入隐蔽数据所处环节的不同,将基于多媒体流应用程序的隐蔽信道分为在原始多媒体流中嵌入和在压缩多媒体流中嵌入两类方法。此外,通过深入细致地分析各类方法所具备的独特优势及潜在问题,对多种基于多媒体流的隐蔽信道进行多维对比分析,旨在揭示各类隐蔽信道技术的特性与差异。在现有研究的基础上,归纳总结该领域核心挑战并展望未来发展趋势。

基于对比学习的双通道源代码漏洞检测模型

宋建华, 何佳伟, 张龑

计算机科学. 2026, 53 (3): 424-432. doi:10.11896/jsjkx.250200124

摘要 ( 165 )

PDF(2365KB) ( 347 )

参考文献 | 相关文章 | 多维度评价

随着软件漏洞日益增多,系统安全正面临着严峻的挑战。源代码漏洞检测可以在软件开发阶段及时发现软件应用中的潜在安全威胁,对保障软件应用的安全性至关重要。目前,主流的源代码漏洞检测方式为基于深度学习模型的漏洞检测方式。然而,现有的许多深度学习模型仅依赖单一形式特征,未能充分挖掘源代码语义中的全局和局部信息,并且这些模型往往忽略了不同样本之间的差异性和相似性,导致其在处理复杂漏洞模式时表现不佳,误报率和漏报率较高。为了解决上述问题,提出了一种基于对比学习的双通道源代码漏洞检测模型。该模型使用不同通道来分别提取源代码语义中的全局特征和局部特征,并引入对比学习,使得模型能够学习不同样本之间的相似性和差异性,并以此来优化特征提取过程。实验结果表明,此模型在真实世界的漏洞数据集Devign和Reveal上的召回率、F1分数相较于基线模型显著提升。在Devign上平均提升14.65个百分点和6.30个百分点;在Reveal上平均提升31.18个百分点和22.44个百分点。

基于数据分布匹配的单体式固件基地址识别方法

蔡瑞杰, 贾凡, 尹小康, 赵方方, 刘胜利

计算机科学. 2026, 53 (3): 433-442. doi:10.11896/jsjkx.250400026

摘要 ( 175 )

PDF(4738KB) ( 407 )

参考文献 | 相关文章 | 多维度评价

单体式固件基地址识别是开展固件安全研究的基础。现有研究和相关工具存在识别率低、性能差和资源占用率高等问题。针对该问题,提出一种基于数据分布匹配的单体式固件基地址识别方法。该方法首先计算固件各部分的有效字符密度,并基于有效字符密度将固件划分为文本数据段和非文本数据段。从固件的文本数据段提取固件包含的字符串常量数据。通过对寄存器字装载指令进行识别和解析,提取固件所包含的绝对地址数据,并将这些绝对地址数据按照所传入函数及传入函数前所在寄存器的组合划分为多个绝对地址簇。最终通过将绝对地址簇和字符串常量数据在固件中的分布间隔相匹配来确定绝对地址数据和字符串常量数据的对应关系,从而实现基地址的求解。实验表明,基于数据分布匹配的固件基地址识别方法的识别效率远高于现有方法,对于由30个固件组成的测试集,所提方法的基地址识别成功率达到了100%。

基于Transformer的域自适应物联网流量入侵检测方法

朱枫, 叶宗国, 李鹏, 徐鹤

计算机科学. 2026, 53 (3): 443-452. doi:10.11896/jsjkx.241200167

摘要 ( 144 )

PDF(2076KB) ( 325 )

参考文献 | 相关文章 | 多维度评价

随着物联网(Internet of Things,IoT)设备的普及,使用入侵检测来保护IoT设备免受恶意攻击至关重要。但是,IoT的数据稀缺性限制了传统入侵检测方法的效果。同时,现有基于域自适应的入侵检测方法的对齐方式粗糙,忽略了内在语义属性的转移,降低了特征的可区分性。为解决上述问题,提出了一种基于Transformer的域自适应物联网入侵检测(Transformer-Based Domain-Adaptive IoT Intrusion Detection,TDAIID)模型,从域间、类间和样本间3个层次对齐互联网入侵(Network Intrusion,NI)域和物联网入侵(Internet of Things Intrusion,II)域。交叉注意力机制聚焦于NI源域和II目标域中相同类别样本之间的相似特征,实现样本级别的域特征对齐;多重几何语义对齐从域级和类级两个角度进行语义对齐,有助于交叉注意力机制学习更丰富、更准确的源NI域知识。此外,为了充分挖掘未标记II目标域的潜力,从几何角度提出了一种动态中心感知伪标签算法,用于提高伪标签标记的准确性,有效降低错误分配伪标签造成的负迁移。在多个常用入侵检测数据集上的综合实验表明,TDAIID模型的性能优于当前先进的基线模型。

基于深度学习的GIFT-128与ASCON算法神经差分区分器研究

苏睿韬, 任炯炯, 陈少真

计算机科学. 2026, 53 (3): 453-458. doi:10.11896/jsjkx.250600176

摘要 ( 225 )

PDF(2363KB) ( 348 )

参考文献 | 相关文章 | 多维度评价

差分分析是评估分组密码安全性的关键方法,通过追踪明文差分的传播以区分密码与随机置换。传统分析方法应对复杂算法时存在局限,而深度学习的特征提取优势为密码分析开辟了新路径。为实现分组密码的安全性评估,提出了一种融合传统差分分析与深度学习方法的神经差分区分器构造方法。在数据集构造方面,采用多密文对三元组输入格式,保留差分特征并捕捉跨密文对相关性。网络架构基于卷积神经网络并融合残差收缩网络,构建深度扩张结构及多尺度特征融合机制。在GIFT-128和ASCON-PERMUTATION算法上的实验表明:对于GIFT-128算法,其6轮、7轮区分器的准确率最高可达99.70%和95.47%,分别提升了9.30%和13.09%;在ASCON的4轮分析中,准确率最高达到53.54%。这证明了深度学习方法在密码安全性分析上的有效性。

云存储环境下具有审计功能的高效数据共享方案

张宇航, 常金勇, 杨璐瑶, 徐茂智

计算机科学. 2026, 53 (3): 459-468. doi:10.11896/jsjkx.241200102

摘要 ( 146 )

PDF(2072KB) ( 302 )

参考文献 | 相关文章 | 多维度评价

随着云存储技术的普及,其安全性问题也越来越突出:云服务器可能因故障或外部攻击导致用户的存储数据丢失;同时,基于云存储的数据共享过程还可能面临恶意用户的非法访问风险。现有研究多聚焦于云存储环境下单一安全性功能的实现。对此,在对云存储数据完整性进行安全审计的基础上,完成了数据共享过程的安全访问控制。在数据完整性审计过程中,采用基于身份的同态认证技术为存储数据生成标签,用户通过验证云服务器返回的聚合标签可以获知其存储数据的完整性,从而解决云存储数据意外丢失的问题;在数据共享阶段,采用基于属性加密与对称加密结合的混合形式,不仅可以降低外包数据的计算、通信和存储开销,还可以实现对未授权用户的控制权限管理,从而解决数据共享过程中的高效性与权限管理的平衡问题。性能分析表明,所设计的系统在数据完整性审计和共享过程中均具有较低的计算、通信开销以及存储冗余,为云存储环境下的数据安全存储与高效共享提供了新的研究思路。