计算机科学

第53卷第5期目录

计算机科学. 2026, 53 (5): 0-0.

摘要 ( 159 )

PDF(386KB) ( 259 )

相关文章 | 多维度评价

个性化学习资源推荐的分类、算法与挑战

孙奕菲, 李咏桉

计算机科学. 2026, 53 (5): 1-12. doi:10.11896/jsjkx.250600184

摘要 ( 512 )

PDF(1964KB) ( 578 )

参考文献 | 相关文章 | 多维度评价

个性化学习资源推荐是技术与教育深度融合的高级表现形式,近年来受到学术界的广泛关注。现有综述在基础理论框架、推荐方法和评估指标等方面进行了有价值的论述。在此基础上,可以进一步丰富个性化学习资源推荐的分类体系及算法梳理,尤其是对传统推荐方法的全面回顾和对新兴大语言模型在个性化学习推荐中的应用研究。通过构建多维分类框架,从应用场景、算法类别和学习者特征建模3个维度对个性化学习资源推荐进行了系统分类,全面解析了传统推荐算法、基于知识的算法、机器学习算法、智能优化算法、深度学习算法及强化学习算法的技术原理及最新进展,系统分析了个性化学习资源推荐面临的技术挑战和学习者角度面临的困境,并据此提出了融合多种推荐方法、引入教育理论指导和提升数据质量等未来研究方向。该综述旨在为教育技术研究者与实践者提供系统化的理论框架与技术路线图,促进个性化学习生态系统的持续优化与创新发展。

学习轨迹研究综述

王碧璇, 陈仕明, 高志泽樟, 冯筠, 王惠亚

计算机科学. 2026, 53 (5): 13-21. doi:10.11896/jsjkx.250600159

摘要 ( 240 )

PDF(1667KB) ( 360 )

参考文献 | 相关文章 | 多维度评价

随着智能教育的发展,学习轨迹成为研究热点,其研究旨在理解学习者发展路径,探索影响因素,为教育决策提供依据。近年来,学习轨迹研究在多方面取得显著成果,如轨迹构建方式的创新、分析方法的优化以及应用范围的逐步拓展。但不可忽视的是,该领域仍面临一系列严峻挑战,如理论体系尚未达成统一标准、分析方法之间的融合度不高以及实证分析相对匮乏等。与此同时,目前还缺少对学习轨迹全面、系统的综述研究。为此,基于当前学习轨迹研究的发展现状,从理论基础与技术实践两个方面出发,梳理了当前研究中面临的主要挑战,并以学习轨迹的构建流程、分析方法与典型应用场景为线索,系统总结了相关研究成果。在此基础上,从理论深化和技术创新、应用拓展两方面对未来学习轨迹研究的发展方向进行了分析与展望,提出未来可行的优化方向,有望推动学习轨迹分析在智能教育领域的深入融合与落地应用。

教师教学情感智能分析技术研究综述

刘一璞, 马苗, 胡曦明

计算机科学. 2026, 53 (5): 22-29. doi:10.11896/jsjkx.250600163

摘要 ( 192 )

PDF(2178KB) ( 322 )

参考文献 | 相关文章 | 多维度评价

教师积极的教学情感能够显著提升教学效果,激发学生学习兴趣和参与度,营造良好的课堂氛围,促进学生对知识的理解和掌握;反之,不当的教学情感会影响学生的学习热情,降低教学效率,甚至导致学生厌学。在我国教育数字化转型背景下,利用海量的文本、语音、视频等课堂教学数据进行教师教学情感的智能检测与分析,对于提高教学质量、提升教师教学反思效果、完善教师数字画像具有重要的现实意义和实用价值。在传统情感分析的基础上,综述基于人工智能的教师教学情感智能分析技术,包括梳理国内外教师情感研究方法,从文本、语音、视觉及多模态等角度分析智能情感分析技术的研究现状,归纳总结多模态智能情感分析技术的关键技术,最后剖析教师教学情感智能分析技术面临的机遇、挑战及发展趋势。

多模态技术在教育领域的应用优势、案例与实践挑战

李梦阁, 王刚, 白文昊, 雷雪

计算机科学. 2026, 53 (5): 30-40. doi:10.11896/jsjkx.250600132

摘要 ( 510 )

PDF(3611KB) ( 388 )

参考文献 | 相关文章 | 多维度评价

教育是国家发展和民族振兴的基石,然而传统教育模式在教学手段、资源分配和评估体系等方面存在诸多局限性,如教学方式单一、教育资源不均衡以及评估方法片面等。随着人工智能技术的飞速发展,多模态技术作为一种融合多种数据形式(如图像、声音、文本)的新兴技术手段,为解决这些问题提供了新的可能性。多模态技术通过智能课堂、个性化学习系统等应用,能够全面感知和理解学习环境,从而打破传统教育模式的局限,提升学习体验、促进教育公平并实现个性化学习评估。对此,首先概述多模态技术的定义、内涵及其核心算法,探讨其在人工智能领域的发展脉络与重要地位;其次,从多个维度详细分析多模态技术在教育领域中的应用优势,并结合具体案例进行深入探讨;最后,讨论多模态技术在教育应用中面临的数据隐私、技术成本和伦理问题等挑战。通过对多模态技术在教育领域的应用和挑战的深入研究,旨在为教育创新提供理论依据和实践指导,推动教育向更加智能化、个性化和公平化的方向发展。

教师课堂行为智能分析与理解研究进展

潘玮莹, 李雨桐, 马苗

计算机科学. 2026, 53 (5): 41-49. doi:10.11896/jsjkx.250600186

摘要 ( 432 )

PDF(2317KB) ( 284 )

参考文献 | 相关文章 | 多维度评价

在我国数字化转型背景下,以人工智能、大数据、物联网、云计算为代表的智能技术为教育改革注入了新动能。教师课堂行为是教师专业素养与教学能力的重要外在表征之一。借助视频分析、语音处理和文本分析等智能技术,可以对教学行为的特征与规律进行自动化表征,从而为构建教师数字画像提供关键指标。对此,综述了教师课堂行为的智能分析与理解研究进展。首先从教师言语行为、非言语行为以及言语和非言语行为结合3个维度构建智能分析指标体系;然后从单模态和跨模态角度分别梳理总结教师课堂言语行为和非言语行为识别与理解中的智能技术、代表方法和应用实践;最后讨论当前研究在教师言语行为事件检测、言语行为和非言语行为的语义对齐和跨模态信息协同等方面的挑战,以及在教师言语行为事件建模、跨模态语义融合及多模态大模型应用等方面的未来趋势,这对于教师数字画像构建中的教育教学能力评价、职业发展规划等有着重要的研究意义和实用价值。

构建3L-S³智能生态:人工智能时代研究生教育模式与组织形态的系统革新

邓晓衡, 余湛, 许雪梅, 李恒, 张昊, 胡超

计算机科学. 2026, 53 (5): 50-58. doi:10.11896/jsjkx.250600135

摘要 ( 486 )

PDF(2039KB) ( 273 )

参考文献 | 相关文章 | 多维度评价

在新一代人工智能深度渗透高等教育的背景下,研究生教育正从“规模扩张”迈向“智能生态”。对此,基于全国教育科学规划课题“人工智能时代研究生教育模式与组织形态研究”的阶段成果,提出“学习-实验-孵化(Learning-Lab-Launch)+智慧校园+智慧治理+智慧伦理”三位一体的3L-S³智能化教育模型,探索AI 技术对课程体系、科研训练、组织结构与数字治理的重塑机制。采用“扎根理论+中南大学研究生院1 862 份大规模问卷+ 8国对比+典型案例深描”混合方法,并以3年追踪数据验证其有效性。结果表明:1)AI 驱动的能力画像将个性化学习收益提升 23.6%;2)数字孪生 Meta-Lab 将科研周期压缩 31.4%;3)扁平化、网络化的教育组织形态成为人才-技术-治理协同的关键载体;4)区块链-AI 协同治理使学术不端预警准确率达到 92%。鉴于此,提出建立“国家 AI 研究与教育中心”、试行“跨学科转换硕士”和组建“可信 AI 课程共同体”的3项政策路径,为我国研究生教育高质量跃迁与教育治理现代化提供可复制、可评估的新范式。

基于XTTS模型的声音克隆系统研究

王陈偲, 杨思燕, 苗启广

计算机科学. 2026, 53 (5): 59-67. doi:10.11896/jsjkx.250600187

摘要 ( 218 )

PDF(4218KB) ( 321 )

参考文献 | 相关文章 | 多维度评价

随着深度学习和语音合成技术的不断发展,语音克隆在智能语音助手、虚拟主播和无障碍通信等领域展现出广阔的应用前景。然而,现有语音克隆系统在音色相似度、交互便捷性和大规模数据处理能力等方面仍存在不足,难以满足用户对高质量、个性化语音合成的实际需求。为此,基于XTTS模型设计并实现了一个支持多语种语音克隆与批量文本转语音的Web平台,针对语言覆盖数量有限、低资源条件下音色迁移受限以及批量处理效率低的问题进行了改进。系统采用前后端分离架构,后端基于 Flask 搭建 API 接口,前端结合主流 Web 技术与 AJAX 实现异步交互,数据库采用 MySQL 管理用户与音频数据。平台集成语音克隆、文本转语音与批量处理等功能模块,具备良好的灵活性与扩展性。测试结果表明,该系统在语音自然度与音色相似度方面表现良好,具有较高的应用价值与推广潜力。

基于超图神经网络与动态知识追踪融合的学习路径推荐

刘美麟, 马乐

计算机科学. 2026, 53 (5): 68-78. doi:10.11896/jsjkx.250600157

摘要 ( 250 )

PDF(2116KB) ( 321 )

参考文献 | 相关文章 | 多维度评价

针对现有学习路径推荐方法在个性化适配性、动态适应性以及多目标优化方面的不足,提出一种基于超图神经网络与知识追踪的协同推荐模型。通过构建学习资源无向图编码资源关联关系,生成学习资源嵌入向量,并结合超图神经网络聚合学习者历史行为数据,捕获学习者-学习资源交互特征。设计多目标优化策略,利用非支配排序遗传算法(NSGA-II)生成帕累托前沿解集,同步优化学习路径推荐精准性、难度适配性、有效性与学习资源多样性,并结合权重分配与综合效用函数提升学习路径的质量。在MOOCCube与MOOPer数据集上对所提方法进行实验,其在MOOPer数据集上的HR@5与MRR@5分别达93.9%与90.7%,实现了学习路径的精准推荐。实验结果验证了所提模型在学习者历史交互建模与课程结构约束融合方面的有效性。

面向学习者画像的时序动态标签构建及预测方法

白菁昊, 庄俊玺, 赖英旭

计算机科学. 2026, 53 (5): 79-89. doi:10.11896/jsjkx.250400012

摘要 ( 209 )

PDF(4145KB) ( 334 )

参考文献 | 相关文章 | 多维度评价

随着教育信息化的发展和个性化教育的深入推进,如何从海量的教育大数据中构建准确、动态的学习者画像,已经成为教育领域的重要研究课题。现有方法在构建学习者画像时存在特征表征不充分、时序动态变化考虑不足,以及标签依赖关系不一致等问题。针对上述关键问题,提出了一种时序动态标签构建及预测方法。该方法基于多源学习者特征扩展方法增强原始数据特征标签,结合教育学理论在不同观察周期下进行时序标签建模,利用NLP中的Teacher Forcing和Scheduled Sampling技术训练多路Transformer模型,深度挖掘不同时序下的学习者特征,最终基于这些特征实现学习者画像标签预测。在校园卡刷卡数据和在线课程记录数据两个公开数据集上评估了所提方法,证明了其在构建学习者时序动态标签和画像方面的有效性。

基于大语言模型的创新性自动评分

王胜辉, 李腾

计算机科学. 2026, 53 (5): 90-98. doi:10.11896/jsjkx.250600183

摘要 ( 309 )

PDF(2416KB) ( 327 )

参考文献 | 相关文章 | 多维度评价

创新性自动评分(IAS)在教育领域具有重要的意义,传统评分方式存在主观性强、效率低和标准不一等问题,而大语言模型的快速发展为解决这些问题提供了新的可能。为此,构建了高质量数据集WAIS,并提出语义驱动的层次化主题提取算法,该算法通过语义分块、基础主题提取、优化分析和主题融合4个阶段,有效提高了模型对学生回答主题的提取效果,实现了自动主题提取,为自动评分提供了更准确的依据,同时为后续评分建立了一个可解释的认知框架。通过对比Zero-shot,Few-shot和Chain-of-Thought(CoT)3种提示策略,并使用多个预训练模型进行评估,结果表明:CoT方法显著优于其他方法,DeepSeek-R1模型的准确率为68%;而经过微调的小参数模型Qwen1.5-7B的准确率达到了83%,其在创新性评分任务中的表现甚至略优于大参数模型仅使用提示词的效果。研究表明,利用大语言模型进行创新性自动评分是可行的,并具有广阔的发展前景。

面向英语口语情感评价的多模态连续情感识别

王丽燕, 张倩, 郭圆圆, 陈海丰, 李健

计算机科学. 2026, 53 (5): 99-108. doi:10.11896/jsjkx.250600162

摘要 ( 172 )

PDF(3426KB) ( 268 )

参考文献 | 相关文章 | 多维度评价

英语口语在英语学习中占据重要地位。针对现有的英语口语情感表达评价数据集稀缺及模态信息利用不足的问题,构建了一个名为英语口语多模态情感数据集(English Spoken Multimodal Emotion Dataset,ESMED)的新型数据集,并对其进行连续情感(唤醒度、愉悦度)标注和情感质量评分。此外,提出了一个面向英语口语情感评价的创新网络模型,该模型首先通过感知重采样和多模态融合模块对连续情感信息进行压缩与融合,用于预测唤醒度和愉悦度。随后通过可学习的瓶颈层与联合解码层对特征进行特定变换,并通过情感质量评价模块将唤醒度、愉悦度与变换后的特征联合解码,得到最终量化后的情感质量分值。实验结果表明,在ESMED数据集上的一致性相关系数(CCC)达到0.500 3,平均绝对误差(MAE)为0.635 4,证明了该方法的有效性和准确性。

一致流形逼近与投影算法综述

张润, 李晓斌, 徐亚敏

计算机科学. 2026, 53 (5): 109-118. doi:10.11896/jsjkx.250400084

摘要 ( 270 )

PDF(3019KB) ( 275 )

参考文献 | 相关文章 | 多维度评价

文中系统介绍了一致流形逼近与投影算法(Uniform Manifold Approximation and Projection,UMAP)的理论基础、算法实现及发展动态。UMAP是一种基于代数拓扑和范畴论的非线性降维方法,旨在保持高维数据局部结构的同时尽可能还原其整体分布结构。该算法分为两个阶段:第一阶段,构建一个反映局部几何关系的加权近邻图,并根据数据密度自适应地设定邻域大小;第二阶段,通过最小化高维近邻图与低维近邻图之间的交叉熵损失函数,优化得到低维嵌入表示,从而实现拓扑结构保留与可视化。在方法拓展方面,UMAP已衍生出多种变体:1)通过引入标签信息增强类别分离的监督与半监督UMAP;2)结合神经网络实现可泛化的非线性映射的参数化UMAP;3)通过密度相关性优化保留数据分布特征的DensMAP;4)支持跨数据集或时序数据的对齐嵌入的AlignedUMAP;5)解决了流数据与样本外数据的动态嵌入问题的渐进式UMAP;6)与图神经网络结合的GNUMAP;7)应用于多模态数据融合的MultiMAP。

基于企业数据空间的数据资源组织方法与数据资产管理

李敏波, 王少华, 吴大臻

计算机科学. 2026, 53 (5): 119-128. doi:10.11896/jsjkx.250600019

摘要 ( 231 )

PDF(2868KB) ( 290 )

参考文献 | 相关文章 | 多维度评价

针对军工科研单位因保密分级分块管理导致的数据资源孤岛问题,以及数据资源智能检索与知识复用困难,提出了多源异构企业数据资源与数据资产的治理方案。通过企业数据空间属性图模型实现数据资源之间的图节点关联映射,构建融合BOM树型结构的数据资源知识图谱,涵盖研发工艺、生产制造与质检数据的层级关系、属性信息及关联关系。具体地,提出了一个新颖的RAG框架HireRAG,建立了基于C-HNSW的知识图谱社群化分层索引,低层保留细粒度的知识单元,高层社群提供全局摘要,以处理不同层次的检索;提出了一种图增强聚类算法,使得C-HNSW更好地捕捉知识图谱中的语义信息。实验表明,HireRAG相比现有的一些先进RAG框架更适合处理企业数据空间BOM关联数据,可以在实现最高准确率的同时保证检索效率优势。数据资产管理系统确保数据资产全过程合规入表。

融合多维算子特征的深度学习训练时间预测算法

陈远生, 陈顺珏, 莫萱, 吴维刚, 李嘉伦

计算机科学. 2026, 53 (5): 129-136. doi:10.11896/jsjkx.250900001

摘要 ( 200 )

PDF(2215KB) ( 298 )

参考文献 | 相关文章 | 多维度评价

离线任务是可延迟处理的任务,对完成时间没有严格的要求,通常包括数据批处理或机器学习训练任务。随着深度学习技术的发展,深度学习训练任务已经成为云数据中心的核心负载之一,通过准确预测离线训练任务的运行时间,可以合理地利用在线任务空闲时的资源。然而,深度学习模型结构各异,模型规模跨度巨大,训练过程中的数据批量大小、超参数、执行算子的特性等因素也会影响到训练时间。现有方法无法兼顾所有因素:基于配置的方法忽视模型的内部执行机制;基于算子的方法忽视计算图结构对训练的影响;基于计算图的方法,若使用图神经网络模型则复杂度高,若简化为拓扑序列则会丢失部分依赖关系。针对拓扑序列方法的不足,提出了MDOT算法,将计算图按照拓扑排序转换成一个算子序列。基于此算子序列,MDOT首先利用Transformer融合算子的3个维度信息,即算子类型、算子配置和计算负载,执行多维度算子编码,更全面地建模算子的执行特性;其次,为了捕捉计算图的依赖关系,MDOT设计了图位置编码机制,通过Transformer的自注意力捕捉算子序列间的关系,建模算子之间在运行时间上的相互影响。实验结果表明,MDOT在深度学习任务训练时间预测上优于现有方法,平均绝对误差和均方根误差比次优模型低25%和45%。

一种高效的时态图中最短环计数算法

李天琪, 杜明, 周军锋

计算机科学. 2026, 53 (5): 137-148. doi:10.11896/jsjkx.250400006

摘要 ( 345 )

PDF(3472KB) ( 283 )

参考文献 | 相关文章 | 多维度评价

最短环计数是对数据图进行分析的重要途径之一,在关键节点识别、周期结构分析和异常检测等领域具有重要应用。然而,在时态图分析中,受边的时效性和查询时间窗口变化的影响,现有方法难以高效支持不同时间窗口下的最短环计数。对此,首先提出基于索引的方案来提升最短环计数的效率,然后提出优化的索引构建策略来降低索引规模,提升索引构建效率,从而在保证索引规模和构建时间的前提下,支持高效的查询处理。最后,在真实世界的时态图上进行了实验,实验结果表明,所提出的方法能够高效构建索引并快速回答给定查询顶点在查询窗口内的最短环数量和长度。

优化的彩色h星核分解算法

梁玥, 周军锋, 杜明

计算机科学. 2026, 53 (5): 149-156. doi:10.11896/jsjkx.250300166

摘要 ( 291 )

PDF(3074KB) ( 218 )

参考文献 | 相关文章 | 多维度评价

彩色h星核是基于彩色h星定义的内聚子图模型,该模型在理解网络复杂关系、分析社区高阶结构等方面具有广泛的应用价值。然而,现有的彩色h星核分解算法存在显著局限性:随着h值的增大,h星度呈指数级增长,易造成数据溢出,导致计算结果出现错误。针对这一问题,提出一种剪枝方法来识别对h星核值无影响的顶点,并进一步通过数学推导得出h星核值的紧致上界,该上界在核分解过程中可替代h星度,解决因h星度过大而导致的计算错误问题。实验结果表明,所提出的方法可以正确计算h星核分解,计算效率提升10倍以上。

融合AEMD与趋势交叉注意力的多尺度Transformer油价预测框架

李滕佳, 马春爱

计算机科学. 2026, 53 (5): 157-163. doi:10.11896/jsjkx.250900086

摘要 ( 201 )

PDF(3119KB) ( 300 )

参考文献 | 相关文章 | 多维度评价

在全球低碳转型和能源结构调整的背景下,原油价格预测不仅是能源市场分析的重要课题,也是政策制定与投资决策的核心参考。然而,原油价格序列往往表现出高度非线性和显著的非平稳性。现有方法在特征提取与时序建模方面仍存在不足:一方面,多时间尺度特征的挖掘不充分,导致对短期剧烈波动与长期趋势演化的刻画存在偏差;另一方面,短期与长期信息在融合过程中常出现耦合不当,难以兼顾预测精度与趋势稳定性。针对上述问题,提出了一种自适应频率解耦的双分支Transformer模型(Multi-frequency Decoupled Dual-Branch Variant Transformer,MFD-DBV-Transformer),用于布伦特原油价格预测。首先,引入自适应经验模态分解(Adaptive Empirical Mode Decomposition,AEMD)方法,将原油价格序列自适应分解为多个本征模态函数(Intrinsic Mode Functions,IMF),并区分高频短期成分与低频长期趋势成分。在此基础上,设计自适应频率解耦模块(Adaptive Frequency Decoupling Module,AFDM),构建双分支特征表示网络,以分别捕获短期波动模式和长期趋势特征。为了突破现有方法中短期与长期特征融合不合理的局限性,进一步提出趋势融合模块,利用交叉注意力机制实现长期趋势信息对短期预测的自适应调节。为防止模型在长期趋势建模中过度拟合,引入带温度调节的自适应掩码机制,以提升模型在复杂市场环境下的泛化能力。实验结果表明,MFD-DBV-Transformer在时频特征捕获与预测性能方面均表现优异,显著优于传统LSTM及部分主流深度学习模型,不仅在预测精度上取得提升,也在趋势跟踪能力上展现出更强的稳定性与适应性。该成果为政策制定者和能源投资者在应对原油市场剧烈波动时提供了一种高效、可靠的预测与决策支持工具,同时也为复杂非平稳时间序列的建模研究提供了新的思路与方法。

基于流程编辑距离的结构感知轨迹聚类方法

叶剑虹, 吴永进, 黄鸿楷

计算机科学. 2026, 53 (5): 164-173. doi:10.11896/jsjkx.260100070

摘要 ( 186 )

PDF(2846KB) ( 284 )

参考文献 | 相关文章 | 多维度评价

在模型检测与流程挖掘中,轨迹聚类通过对相似执行轨迹进行分组,为构建准确的行为模型、验证模型正确性以及基于实际数据的模型改进提供重要支撑。然而,现有基于序列模式的轨迹聚类方法通常将轨迹视为一般字符串进行处理,忽略了活动之间固有的并发与循环执行关系,容易导致结构信息丢失,从而影响聚类效果。针对上述问题,提出一种新的轨迹相似度度量方法——流程编辑距离。该方法首先将轨迹中活动的并发执行关系规范化为一致的顺序执行表示;随后,通过压缩化简机制对轨迹中的循环序列进行抽象处理,以减少冗余重复行为的干扰;最后,综合考虑活动本身及活动之间的直接跟随关系,对轨迹间的相似度进行度量。进一步地,为在聚类结果中获得更符合实际业务行为的流程模型,在凝聚层次聚类框架下引入一种后处理策略——合并噪音簇,以缓解由噪声或小规模簇引起的结构碎片化问题。实验结果表明,基于流程编辑距离的轨迹聚类算法在聚类质量上优于现有同类型方法,并表现出良好的稳定性与鲁棒性;同时,合并噪音簇策略能够持续有效地降低聚类结果的整体结构复杂性,从而生成更加清晰、可解释的流程模型。

视频虚假新闻检测:方法、挑战与可解释性研究

李彝利, 姚洁彤, 郎健, 朱国斌, 陈雷霆, 周帆

计算机科学. 2026, 53 (5): 174-192. doi:10.11896/jsjkx.250900048

摘要 ( 172 )

PDF(3302KB) ( 268 )

参考文献 | 相关文章 | 多维度评价

随着视频平台成为新闻传播的重要载体,其独特的技术特性推动了虚假新闻的广泛传播与快速扩散。视频虚假新闻的泛滥,已在政治、公共卫生及经济等领域造成了不容忽视的危害。既有综述多集中于文本或静态图像虚假新闻检测,缺少专门面向视频虚假新闻检测的系统性概述。为弥补这一空白,首次对视频虚假新闻的检测方法与数据集进行了全面整合与归纳,并在此基础上率先将可解释性作为独立维度纳入综述,以满足审计与溯源的实际需求。具体而言,首先定义了视频虚假新闻,其次分别对基于内在特征的检测方法、基于外部线索的检测方法和可解释的检测方法进行综述。基于内在特征的方法聚焦视频内容本身;基于外部线索的方法则利用用户行为、传播结构和平台元数据提供辅助判定;可解释的检测方法旨在为原本二分类的判别结果提供明确的决策依据。随后,总结了现有视频虚假新闻数据集,包括用户生成内容、媒体发布以及面向可解释性的增强型数据集。最后,讨论了视频虚假新闻检测所面临的挑战与局限,并展望了未来的研究方向。

基于预训练网络的重力波光谱图像异常检测及定位技术

黄思扬, 姚烨, 朱怡安, 海铎, 熊志海

计算机科学. 2026, 53 (5): 193-206. doi:10.11896/jsjkx.250400117

摘要 ( 190 )

PDF(4568KB) ( 271 )

参考文献 | 相关文章 | 多维度评价

针对重力波光谱图像数据特征不明显、分布不均,容易导致异常检测误差高等问题,提出一种基于预训练网络的重力波光谱图像异常检测方法。首先,通过对重力波光谱图像特征进行分析,利用预处理方法增强图像的关键特征,来更准确地获得光谱图像中的有用特征信息;然后,采用ImageNet预训练网络的中间层进行特征提取,通过核心集子采样机制压缩特征内存库,以缩短推理分析时间;最后,采用最近邻机制计算光谱图像像素点的异常分值,并据此实现对重力波光谱图像整体异常程度的评估以及异常区域的标定。实验结果表明,所提方法能够细粒度地进行重力波光谱图像特征分析,有效利用图像特征进行异常检测,并对重力波光谱图像异常区域进行精确标定,异常判别和定位AUROC指标分别达到98.73%和95.19%。

uHairDet:面向雄激素性脱发诊断的仿真毛发图像生成与检测方法

陈琦, 陈星凯, 张辉煌, 苏一平, 胡海根

计算机科学. 2026, 53 (5): 207-217. doi:10.11896/jsjkx.251100057

摘要 ( 279 )

PDF(4795KB) ( 295 )

参考文献 | 相关文章 | 多维度评价

雄激素性脱发的临床诊断主要依赖于人工毛发计数,该方法不仅繁琐耗时,且主观性强,其严重制约了临床诊断的效率与一致性。因此,开发能够实现毛发自动识别与计数的智能辅助诊断技术具有重要的临床意义。然而,由于毛发结构纤细,且缺乏像素级标注的高质量训练数据,现有的监督检测方法仍面临巨大挑战。为应对该挑战,提出了一种名为 uHairDet 的毛发检测新方法,其核心思路是通过合成具有标注信息的毛发图像来降低对手工标注数据的依赖。该方法包含3个部分:1)提出了自标注毛发数据生成器(HBDG),用于合成具有像素级标注信息、结构合理的毛发图像;2)提出了结合语义感知自适应纠错损失(HEE Loss) 的结构稳定风格迁移模型(BS-GAN),以提升在风格迁移过程中图像结构的稳定性;3)引入了基于Mean-Teacher的框架的FCOS+PSC检测模型,配合提出的适用于毛发的OBB标注范式对模型进行训练,解决了传统毛发标注范式丢失大量毛发有效信息的问题。结果表明,在完全无须手工标注数据的情况下,该方法取得了 56.9% 的平均精度,显著优于多种基线模型,有望为皮肤科毛发疾病的智能辅助诊断建立一种新范式。

基于频率驱动的多尺度图像超分辨率方法

杨红菊, 张子扬, 李尧

计算机科学. 2026, 53 (5): 218-227. doi:10.11896/jsjkx.250700046

摘要 ( 167 )

PDF(5339KB) ( 283 )

参考文献 | 相关文章 | 多维度评价

单图像超分辨率是一种旨在从单张低分辨率图像重建高分辨率图像的关键技术,被广泛应用于医学影像增强、卫星遥感、安防监控及数字媒体内容优化等领域。其核心在于恢复图像丢失的高频细节,以提升视觉质量。然而,该任务因其病态逆问题的本质而面临诸多挑战:传统插值方法难以重建复杂细节;基于卷积神经网络的方法虽能提取局部特征,但在全局建模上不足;而Transformer虽擅长长程依赖捕捉,却对高频信息细化能力有限,导致重建图像边缘模糊,纹理失真。为此,提出了一种创新的模型,通过引入小波变换实现多尺度图像分解,优化高频信息提取,并设计三大核心模块:小波细化模块,增强高频细节处理;移位矩形特征增强模块,捕获全局上下文;多尺度小波融合模块,整合高频先验与全局特征。该方法显著提升了纹理和边缘清晰度,兼顾了局部细节与整体一致性。实验结果表明,该模型在 Set5,Set14和BSD100 等基准数据集上超越了现有技术,平均峰值信噪比提升约 0.3 dB,主观视觉质量亦更优。该研究不仅有效解决了高频信息恢复难题,还为单图像超分辨率领域提供了新思路,具有重要的学术与应用价值。

联合小波分析与频域注意力的高精度人体姿态估计

李宗民, 王立, 李亚传, 刘玉杰, 戎光彩, 刘为韩, 马文康

计算机科学. 2026, 53 (5): 228-236. doi:10.11896/jsjkx.250800025

摘要 ( 361 )

PDF(4120KB) ( 259 )

参考文献 | 相关文章 | 多维度评价

人体姿态估计(HPE) 是计算机视觉领域的基础任务之一,旨在准确定位人体关键点并理解人体结构,这对行为识别与检测等下游任务有指导性作用。当前人体姿态估计方法在深度学习的加持下取得了突破性进展,然而在人群密集和人体姿态变化大的复杂运动场景中,现有方法难以应对目标尺度变化大、遮挡及细节丢失等新的挑战。针对这些问题,提出了一种融合离散小波变换(DWT) 与高分辨率网络(HRNet) 的改进架构EFW-HRNet。引入基于 DWT 的下采样与特征融合模块,以捕捉和保留多尺度细节;设计频带间交叉注意力模块(CBA),实现 DWT 子带特征的自适应交互,提升对遮挡的鲁棒性;应用频带通道压缩(FBCC) 策略来压缩高频通道,显著降低计算冗余提升模型效率。在 COCO 数据集上的实验结果表明,EFW-HRNet 相较于强基线 UDP HRNet-W32 在AP上获得了4.0个百分点的大幅提升。消融实验验证了 DWT 模块、CBA 及 FBCC 策略的有效性,其中 FBCC 在精度与效率间实现了良好平衡,仅牺牲约0.8个百分点的AP,就换来了参数量约66%和计算量约51%的大幅削减。

基于自注意力隐式特征编解码的图像连续超分辨率算法

陈柏颖, 石颉

计算机科学. 2026, 53 (5): 237-246. doi:10.11896/jsjkx.250400097

摘要 ( 200 )

PDF(3470KB) ( 283 )

参考文献 | 相关文章 | 多维度评价

针对卷积神经网络在图像超分辨率重建中只能处理固定分辨率,难以实现任意分辨率大小的连续超分辨率重建的问题,提出了一种基于自注意力隐式特征编解码的连续倍率图像超分辨重建算法。首先,通过基于局部-全局自注意力联合建模的特征编码网络,实现对低分辨率图像到高维特征的特征映射;其次,利用局部隐式特征强化编码器来有效聚合局部邻域特征,通过自注意力机制来增强特征邻域数据之间的关联性;最后,采用粗粒度与细粒度像素特征协同关联的多粒度隐式特征解码器,将图像坐标和坐标邻域的深度特征输入多层感知机来预测高分辨率坐标的像素值。实验结果表明,与目前较好的图像重建算法模型相比,所提方法取得了较好的超分辨率重建效果,具有优越性和有效性。

基于动态分布式有向图的记忆建模

危辉, 冯辰越

计算机科学. 2026, 53 (5): 247-256. doi:10.11896/jsjkx.250400093

摘要 ( 234 )

PDF(4964KB) ( 278 )

参考文献 | 相关文章 | 多维度评价

记忆机制研究是计算神经科学中的核心课题。虽然已有研究揭示了神经元网络中的突触可塑性和信号传递等对记忆形成的重要性,但在计算模型中精准再现这些复杂的生物学机制依然面临巨大挑战。现有的传统图论模型能够描述神经网络的拓扑结构,但其静态特性和集中化的信息处理方式无法充分模拟生物神经网络的动态性、分布式和去中心化特征。因此,亟需提出更符合生物神经系统特征的基于动态有向图的记忆模型。该模型基于记忆印迹理论,采用稀疏连接的有向图网络结构,通过局部信息进行自主决策,实现去中心化的并行处理,创新性地引入了可变电阻结构,动态调整电阻值以模拟神经元突触的可塑性,并通过资源竞争的路径强化机制模仿生物神经网络的记忆过程。实验结果表明,该模型在不同规模和拓扑结构下均能稳定实现记忆功能,且记忆容量随网络宽度的增加呈近似线性增长,表现出与生物神经网络相似的特征。与现有主流模型相比,所提模型在资源利用效率、记忆容量及网络扩展性等方面具有显著优势,为类脑计算系统的设计与智能系统的研发提供了坚实的理论基础。

基于三支决策的鲁棒增量模糊概念认知情感识别方法

徐伟华, 胡开平

计算机科学. 2026, 53 (5): 257-267. doi:10.11896/jsjkx.260300053

摘要 ( 197 )

PDF(2850KB) ( 299 )

参考文献 | 相关文章 | 多维度评价

语音情感识别(Speech Emotion Recognition,SER)在人机交互系统中具有重要作用。为了解决现有深度学习模型在SER任务中决策过程不透明,以及传统概念认知学习(Concept-Cognitive Learning,CCL)在处理增量数据时易受噪声干扰而产生概念漂移的问题,构建了一种融合极端随机树权重机制的三支模糊概念认知分类框架(3WERT-WFCCL)。在特征处理上,模型采用Whisper提取高维语音特征,并经由多层感知机进行分层抽象表示;在认知学习阶段,引入极端随机树算法计算特征重要性以实现属性权重的自动量化分配,并在认知算子中嵌入三支决策的容错阈值参数,构建正负双向认知机制。面对增量数据时,模型依据特征辨识距离将新样本划分为正域、边界域和负域,并采用仅利用正域样本更新概念的鲁棒策略,有效抵御了噪声干扰。在特征边界较为复杂的SAVEE数据集上,鲁棒更新策略相比全局更新策略的准确率提升了0.16个百分点。在EmoDB 和SAVEE两个公开数据集上进行相关实验,3WERT-WFCCL在多个关键评价指标上均优于现有基线方法。相比各数据集上表现最优的逻辑回归(Logistic Regression,LR)算法,所提出方法的准确率分别提升了1.53个百分点和0.62个百分点,F1分数分别提升了1.28个百分点和0.40个百分点。实验结果验证了引入三支决策机制的有效性,为构建兼顾高分类精度、强抗噪能力与逻辑可解释性的SER模型提供了新的方法。

基于枢轴优化自训练的汉缅机器翻译语料构建

赖华, 郭子瑞, 李英, 余正涛

计算机科学. 2026, 53 (5): 268-275. doi:10.11896/jsjkx.250300142

摘要 ( 227 )

PDF(2599KB) ( 248 )

参考文献 | 相关文章 | 多维度评价

近年来,语言模型的迅速发展极大地促进了有监督机器翻译的模型效果。然而,有监督机器翻译的性能高度依赖于平行语料库的质量。针对汉-缅高质量平行语料库资源匮乏的问题,提出了一种基于枢轴优化自训练的语料构建方法。首先,利用小规模高质量的汉-缅平行语料训练初始机器翻译模型。然后,基于该模型生成缅甸语到汉语的伪平行语料。同时,引入以英语为枢轴语言的英-缅平行语料,利用现有高质量的英-汉翻译工具将枢轴英语翻译为中文,构建第二组汉-缅伪平行语料。为进一步提高伪平行语料的质量,设计了一种跨语言表征的打分机制,基于语义相似度从两组伪平行语料中筛选出质量更高的句对。最终,利用筛选出的高质量伪平行语料对初始翻译模型进行迭代优化训练。实验结果表明,所提出的方法在汉-缅机器翻译任务中实现了平均8.32 BLEU值的提升。详细的分析实验证明,枢轴语言优化方法在初始模型性能较弱时,能够有效增强模型自训练效果,逐步提高伪平行语料质量。此外,还构建了70万条高质量汉-缅平行语料¹⁾,用于进一步促进汉-缅机器翻译的发展。

负例感知的生成式规则抽取提升方法

纪文迪, 王永全, 沈奕程

计算机科学. 2026, 53 (5): 276-285. doi:10.11896/jsjkx.250400141

摘要 ( 228 )

PDF(4331KB) ( 246 )

参考文献 | 相关文章 | 多维度评价

法律规则是由主管机关制定,具有法律约束力和效力的行为规则,与社会的正常运行密切相关。作为实现法律人工智能的基础,目前已有许多研究试图将自然语言法律文本转换为对应的机器可读的规则集合,但其成果仍不尽如人意。为解决法律规则形式化表示与规则抽取问题,提出一套系统化的法律规则抽取范式,并构建基于大语言模型的生成式法律规则抽取提升方法。该法律规则抽取范式定义了法律规则模式(Legal Rule Schema),将一项法规规则解析为由主体、客体、条件及后果构成的四元组,明确法律规则的适用场景、对象和作用。在此基础上,提出基于大语言模型的生成式法律规则抽取提升方法,引入“从错误中学习”的思想,构建负例感知规则抽取训练框架,提升大语言模型对难负例的识别能力,缓解生成式规则抽取中的幻觉问题。实验结果表明,基于中型模型Mistral-Small-24B的规则抽取模型比通用大模型(Deepseek-r1)的规则抽取性能提高了18.23%,甚至高于人类标注得分1.5%,验证了负例感知训练有效提升了模型的规则抽取能力。

基于量刑规则知识图谱驱动的可解释刑期预测方法

韩林睿, 郑日, 丛颖男

计算机科学. 2026, 53 (5): 286-298. doi:10.11896/jsjkx.251000076

摘要 ( 323 )

PDF(5088KB) ( 276 )

参考文献 | 相关文章 | 多维度评价

刑期预测是法律人工智能赋能刑事司法的核心任务之一,对克服量刑偏见、提升司法质效与保障公平正义具有重要意义。针对传统机器学习模型预测准确率低、可解释性不足的瓶颈问题,提出一种基于量刑规则知识图谱驱动的可解释刑期预测方法。该方法创新性地设计了知识图谱与大语言模型融合架构,其技术路线为:首先,采用BERT-BiLSTM-CRF模型自顶向下构建结构化量刑规则知识图谱;其次,基于《量刑指导意见》提炼量刑思维链,利用图谱结构化数据设计提示工程,对LLaMA-3-8B-Chinese-Chat,Qwen-2-7B,Baichuan2-7B-Chat,GLM-4-9B-Chat大语言模型进行监督式指令微调,引导其学习规范化量刑推理过程;最后,在预测阶段,通过图谱实体识别与检索机制对微调后模型实现检索增强生成,输出刑期预测结果及符合量刑规则的步骤化分析。实验表明:1)BERT-BiLSTM-CRF模型在实体关系抽取任务上F1值达0.953 8,优于传统模型;2)GLM-4-9B-Chat模型在测试集生成质量与下游任务综合表现上最优;3)最终刑期预测模型的F1值达0.627 6,显著优于MTL-Fusion,Lawformer及BERT等基线模型,同时,生成遵循“确定量刑起点-确定基准刑-调节基准刑-确定宣告刑”规范化量刑逻辑的说明文本,显著提升了用户对结果的理解与接受度;4)消融实验与人工评测共同验证模型在量刑准确性、规则援引精准度、说理逻辑性与流畅性及量刑步骤规范性方面均显著优于基线。该研究为法律人工智能提供了知识驱动与数据驱动深度融合的新范式。

EC-MIIP:基于高效微调的知识产权小参数大语言模型

刘旭凯, 刘洋, 黄浩桢

计算机科学. 2026, 53 (5): 299-308. doi:10.11896/jsjkx.250600023

摘要 ( 191 )

PDF(3012KB) ( 274 )

参考文献 | 相关文章 | 多维度评价

近年来,大语言模型发展迅速,在多个自然语言处理任务上展现了出色的能力,也为智慧司法领域提供了强大的技术支持。对此,结合模型预训练和微调技术,构建了MIPLD(Micro-model Intellectual Property Learning Direction)知识产权数据库,并根据法学学科特性和知识产权门类特性,搭建分布预训练的算法框架。随后基于MIPLD数据库,构建了知识产权领域多方向的高质量微调问答对,实现了在小参数下拥有高能力密度的知识产权问题分析大语言模型EC-MIIP,该模型适用于知识产权的学理问答、行为性质分析、司法案例解析以及法律文书撰写等任务。实验结果表明,与Qwen3-4B、Qwen3全参和Deepseek-R1全参模型相比,EC-MIIP的性能更优。该研究不仅探索了大语言模型在知识产权领域中的应用,还为实现小参数模型在司法领域的适用提供了参考。

基于自适应注意力与边界增强的中文命名实体识别方法

唐瑞雪, 吴利琴, 钱清

计算机科学. 2026, 53 (5): 309-318. doi:10.11896/jsjkx.250900076

摘要 ( 168 )

PDF(3617KB) ( 308 )

参考文献 | 相关文章 | 多维度评价

命名实体识别(NER)是自然语言处理中的核心任务之一,被广泛应用于信息抽取、问答系统、知识图谱构建等领域。然而,现有方法在处理中文文本中的嵌套实体和边界模糊问题时,仍面临多尺度特征利用不足、实体边界识别不准确等问题。为此,提出了一种面向中文命名实体识别的模型。该模型基于自适应注意力(AAM)与边界增强(BEM)机制,专门针对中文词汇无显式分隔、语义结构复杂等语言特性设计。模型通过自适应注意力机制动态融合局部与全局上下文特征,增强对中文复杂语义结构的建模能力;同时引入边界增强模块,利用深度卷积强化实体边界感知,有效缓解中文文本中嵌套实体与歧义边界带来的识别误差。实验结果表明,模型在 ACE2005-Chinese 和 Cnerta 两个中文嵌套数据集上的 F1 值分别达到 94.39% 和 83.72%,在 Weibo,Ontonotes和 Resume 这3个中文非嵌套数据集上的F1 值分别为 77.75%,84.88% 和 96.36%,均优于现有主流中文命名实体识别方法,验证了其在复杂中文文本场景下的有效性与泛化能力。

基于多视角图神经网络的跨度级方面情感三元组抽取

申奥, 周青凯, 夏天, 高瑞玲

计算机科学. 2026, 53 (5): 319-327. doi:10.11896/jsjkx.250200126

摘要 ( 149 )

PDF(2516KB) ( 266 )

参考文献 | 相关文章 | 多维度评价

方面情感分析三元组抽取(Aspect Sentiment Triplet Extraction,ASTE)是细粒度情感分析中的一个新兴任务。传统跨度级别情感三元组抽取方法近期在ASTE任务上取得了显著的效果,但这些方法并未充分挖掘句法和语义依赖关系的潜力。为此,提出一种基于多视角边缘增强编码器的方法。该方法深度挖掘并全面整合词际间的句法与语义关联,以此实现方面与观点的精准甄别,并高效获取多元且深邃的深层信息。具体而言,首先基于RoBERTa提取句子基础语义信息,同时运用集双向长短期记忆网络和边增强的图神经网络为一体的边缘增强型编码器,全面捕获高阶语义及句法信息,通过多层次信息融合,有效增强跨度表征。此外,鉴于传统跨度级模型对跨度边界不敏感,引入多层图卷积网络以捕捉跨度之间的交叉关系,从而有效识别跨度边界,并采用互异消除策略来消除冲突三元组。在多个公共基准数据集上进行了大量实验,结果表明,该方法优于其他基线模型,验证了该方法在情感三元组抽取任务中的有效性。

复杂环境下的无人车时空联合轨迹规划

郑雅羽, 饶品阳, 穆建彬, 朱威

计算机科学. 2026, 53 (5): 328-336. doi:10.11896/jsjkx.250300043

摘要 ( 156 )

PDF(4697KB) ( 282 )

参考文献 | 相关文章 | 多维度评价

针对复杂环境下阿克曼转向无人车轨迹规划处理环境约束和运动学约束低效的问题,提出一种前后端耦合的高效时空联合轨迹规划算法。在前端路径规划中,通过融合拓扑地图引导的滑动窗口剪枝策略和动态启发式函数优化方法来提升搜索效率。在后端轨迹优化中,先以安全通行走廊对偶表示环境约束,根据阿克曼模型无人车微分平坦特性,以无人车微分平坦变量及其高阶导表示运动学约束并作为优化变量;再使用光滑映射和微分同胚变换,解析式地将优化变量转换至无约束空间;最后在无约束空间进行梯度优化,以解决处理约束低效的问题。实验场景为实际停车场环境,结果表明,在路径搜索质量无显著下降的前提下,所提模型所用时间较现有方法减少47%,轨迹优化结果表明,所提算法能够实时地规划出高质量时空轨迹,验证了其有效性。

基于多视图对比与同源特征的药物靶标亲和力预测研究

田鑫, 朱国胜, 熊玉然, 吴悠

计算机科学. 2026, 53 (5): 337-345. doi:10.11896/jsjkx.250300168

摘要 ( 167 )

PDF(3158KB) ( 279 )

参考文献 | 相关文章 | 多维度评价

现有基于图神经网络的药物-靶标结合亲和力(DTA)预测方法在特征利用与视图融合对齐方面存在不足,主要表现为:1)未能充分建模药物和蛋白质在各自视图中的特征表达方式,导致视图内部特征学习不完整,限制了特征信息的有效利用;2)未能有效对齐不同视图之间的内在关联,限制了跨视图信息的协同作用。为此,提出了基于多视图对比与同源特征的图神经网络模型(MVHGNN)。MVHGNN构建了多视图对比学习框架,分别在药物分子视图与蛋白质视图中采用增强子图拓扑图卷积网络(ESTGCN)和图同构网络(GIN)作为编码器,以学习药物的拓扑结构特征和蛋白质的层次结构特征。同时,利用同源特征整合药物间及蛋白质间的多层次特征,从而增强同一视图内的特征表达能力,提高特征利用率。此外,在药物-靶标亲和力视图中,使用图卷积网络(GCN)提取全局拓扑信息,构建药物-蛋白质的交互表征。进一步地,采用交叉对比学习策略,最大化药物和蛋白质在各自的不同视图下的互信息,提升同类实体的表征一致性,强化跨视图的信息协同。实验结果表明,MVHGNN在两个基准数据集上均表现优越,尤其在Davis数据集上,均方误差(MSE)和修正判定系数(r²_m)分别为0.166和0.794,优于现有先进方法。

严格d-正则(3,s)-SAT问题的计算复杂性

王永平, 符祖峰

计算机科学. 2026, 53 (5): 346-353. doi:10.11896/jsjkx.250800047

摘要 ( 136 )

PDF(1567KB) ( 218 )

参考文献 | 相关文章 | 多维度评价

严格d-正则(3,s)-SAT问题是指:给定一个严格d-正则(3,s)-CNF公式,判定是否存在对其变量的一个真值指派,使公式的真值为真。此处,严格d-正则(3,s)-CNF公式是指:每个子句的长度为3,每个变量的出现次数为s,每个变量的正、负出现次数之差的绝对值为d 的CNF公式。研究表明,一定条件下,严格d-正则(3,s)-SAT问题存在难解实例聚集现象。因此,讨论了严格d-正则(3,s)-SAT问题的计算复杂性,证明了:当 s≥4 时,存在不可满足的严格(s－2)-正则(3,s)-CNF公式和不可满足的严格(s－4)-正则(3,s)-CNF公式。由此,已有的系列结论中的假设条件成为现实。于是,严格d-正则(3,s)-SAT问题的计算复杂性得以解决:当 s≤3 时,严格d-正则(3,s)-CNF公式均可满足;当s≥4 且d<s时,严格d-正则(3,s)-SAT问题是NP-完全问题;当 s≥4 且d=s时,严格d-正则(3,s)-CNF公式均可满足。需指出,所得结论意味着,严格0-正则(3,4)-SAT问题和严格2-正则(3,4)-SAT问题均是NP-完全问题,即严格0-正则(3,4)-SAT问题和严格2-正则(3,4)-SAT问题保留了正则(3,4)-SAT问题的NP-完全性,也保留了3-SAT问题的NP-完全性。因此,继续研究严格d-正则(3,s)-SAT问题,尤其是严格0-正则(3,4)-SAT问题和严格2-正则(3,4)-SAT问题应该是必要的。

基于浮点向量压缩的分布式GMRES算法优化

陈疏桐, 高建花, 计卫星, 李春峰

计算机科学. 2026, 53 (5): 354-366. doi:10.11896/jsjkx.250500033

摘要 ( 154 )

PDF(4844KB) ( 297 )

参考文献 | 相关文章 | 多维度评价

广义最小残差法(GMRES)是稀疏线性方程组迭代求解的主流算法之一,广泛应用于电路仿真、计算流体力学、自动驾驶等领域。为了高效求解大规模稀疏线性方程组,研究人员设计了分布式GMRES算法,通过节点间通信和分布式计算实现大规模问题的并行求解。然而,分布式GMRES算法中的稀疏矩阵向量乘(SpMV)计算引入了显著的浮点向量通信需求,导致浮点向量的通信开销成为主要性能瓶颈。基于重启动GMRES,提出了面向CPU-GPU异构系统的分布式重启动GMRES(DR-GMRES)算法,并针对算法和异构系统的特性设计了协作计算模式。在此基础上,针对SpMV计算对浮点向量的通信需求和GMRES算法内外迭代的数值特性,提出了双层混合压缩策略,包括有损与无损的混合压缩和内外迭代混合压缩,以保持一定求解精度的同时最小化DR-GMRES的通信开销。此外,设计了面向双层混合压缩策略的多缓冲区压缩通信架构,以实现高效的异步数据压缩。在16个大规模稀疏线性方程组求解问题上的实验结果表明,相比于原始分布式GMRES算法,基于混合数据压缩方法的DR-GMRES算法实现了平均3.37倍的加速比,最高实现了8.02倍的加速比,并且几乎不影响最终结果的计算精度。实际仿真验证表明,基于混合数据压缩方法的DR-GMRES算法相比原始算法在OSQP求解时间上实现了3.09倍的加速。

高可靠嵌入式软件的运行时验证方法

刘嘉乐, 何冬梅, 刘洪标, 潘广宇, 关永, 王瑞, 刘波

计算机科学. 2026, 53 (5): 367-375. doi:10.11896/jsjkx.251200184

摘要 ( 148 )

PDF(3473KB) ( 255 )

参考文献 | 相关文章 | 多维度评价

高可靠嵌入式软件广泛部署于航空航天、工业控制、车载系统等安全攸关领域,其运行环境往往伴随极端温度波动、电磁干扰、高能粒子辐射等严苛条件,易引发数据位翻转、数据位错等硬件级异常,导致系统功能失效甚至引发重大安全事故。为提升高可靠嵌入式软件的运行时安全性与可靠性,提出一种面向高可靠嵌入式软件的运行时验证方法。首先,对目标程序开展静态分析,提取指令间的跳转依赖关系并构建指令控制流先验信息表;其次,设计轻量级监控模块,实时捕获程序运行时总线的指令流数据,同时通过验证单元结合先验信息表完成运行时指令序列的正确性校验;最后,基于 FPGA 平台实现该验证框架,并开展实验验证。实验结果表明,所提方法能够有效保障高可靠嵌入式软件的运行正确性,且在资源开销与验证延迟方面满足嵌入式场景的约束要求。

面向异构智能储算能效优化的改进河马算法

王恩良, 夏郡, 孙知信

计算机科学. 2026, 53 (5): 376-387. doi:10.11896/jsjkx.250300140

摘要 ( 190 )

PDF(3844KB) ( 267 )

参考文献 | 相关文章 | 多维度评价

数据中心的高能耗问题在数字化转型与"双碳"战略背景下日益凸显,其根源在于传统分布式架构中频繁的数据传输引发的能效瓶颈。现有优化方法局限于单一维度(如任务调度或存储层级优化),难以协同适配动态负载与异构资源环境。对此,提出一种基于改进河马优化算法(IHOA)的智能储算系统能效优化框架,通过构建计算、存储与通信能耗的多维度统一模型,将任务分配与数据放置联合优化。该框架创新性地引入储算协同感知机制,量化任务与数据的关联性,并结合能效敏感的适应性搜索策略,动态调整局部与全局搜索强度,以适配异构设备的能效特性。实验结果表明,相较于主流优化算法,IHOA在中等至大规模系统中显著降低了总能耗,能效提升幅度为8.1%~25.6%,其优势源于对远程数据传输能耗的高效抑制与异构资源的动态适配。能耗构成分析进一步验证了IHOA在全局协同优化中的有效性,其通过减少跨节点数据迁移,使数据传输能耗降低17%~32%。这为智能储算系统的绿色化设计提供了理论支持与技术路径,推动数据中心向高效、低碳方向演进,并为边缘计算等新兴场景的能效优化提供了方法论参考。

基于多任务联邦学习的微服务架构系统异常检测与诊断

陈鹏, 郝俊峰, 夏云霓, 李曦

计算机科学. 2026, 53 (5): 388-403. doi:10.11896/jsjkx.250300131

摘要 ( 146 )

PDF(4650KB) ( 283 )

参考文献 | 相关文章 | 多维度评价

微服务架构广泛应用于云环境中的应用开发,其本质是通过一系列功能独立的小型自治服务构建应用,具有高内聚、高可用、低耦合和良好的可扩展性。然而,由于微服务架构是一种分布式计算架构,具有高动态性,因此对分布式部署且相互独立的各个微服务进行实时系统异常检测是一项非常具有挑战性的工作,更进一步地,确定检测到异常的类别在实际应用中则更为关键。为解决上述问题,提出了基于多任务联邦学习的系统异常检测与诊断方法MT-FL-SADD(Multi-Task Federated Learning based System Anomaly Detection and Diagnosis)。首先,提出了一种基于多任务联邦学习(Multi-Task Federated Learning,MT-FL)的分布式学习框架,该框架用来构建各个微服务的异常检测与诊断模型;其次,为了识别微服务运行时复杂的系统异常模式与特征,构建了一种基于压缩激活(Squeeze Excitetion,SE)和外部注意力(External Attention,EA)的双网络特征提取器(SE and EA based Enhance Dual Network,SE-EA-EDN),以高效提取运行时微服务系统监控实时数据特征;最后,设计了一种基于本地-全局特征的并行知识迁移框架(Local-Global Feature-based Parallel Knowledge Transfer,LGF-PKT),并行化实现本地和全局特征的权重更新。为了验证所提方法的有效性,在微服务基准测试平台Sock Shop和Train Ticket上进行了对比实验,MT-FL-SADD相比其他联邦学习方法平均Macro F1提高了33.9%,平均Micro F1提高了33.4%;同时,该方法在SWaT,SMD和SKAB上相比其他联邦学习方法的平均F1提升了2.2%。

面向视觉Transformer的对抗样本攻击综述

郭靖臣, 杨奎武, 丁梦迪, 魏江宏

计算机科学. 2026, 53 (5): 404-418. doi:10.11896/jsjkx.250600065

摘要 ( 176 )

PDF(4019KB) ( 279 )

参考文献 | 相关文章 | 多维度评价

视觉Transformer(ViT)是一种突破传统卷积神经网络(CNN)局部感受野限制的新型架构,凭借其全局建模能力在计算机视觉领域取得了突破性进展。随着ViT在安全领域的应用激增,其与CNN的结构性差异使传统对抗攻击效能骤减,导致ViT真实脆弱性被掩盖、防御机制开发滞后,对抗攻击引发的模型安全风险正推动该领域研究成为热点。首先系统梳理了ViT对抗攻击方法的核心进展,分析了图像分块、位置编码、注意力机制等ViT特有结构对对抗样本攻击的影响;其次对面向ViT的对抗攻击方法进行分类,将现有关键的攻击方法划分为白盒攻击、基于迁移的黑盒攻击以及基于决策的黑盒攻击,并重点介绍针对模型结构的优化攻击、基于输入转换的攻击、基于积分梯度的攻击、针对下游任务的攻击以及针对模型对齐的5类黑盒迁移攻击研究进展;然后深入探讨了不同方法在扰动效率、跨模型迁移性方面的逐步演进,系统总结了各类攻击方法的核心优势与缺陷,揭示了攻击技术演进逻辑和模型缺陷为攻防技术的创新提供参考;最后,对未来的研究方向进行了分析和展望。

基于语义共现网络的攻击能力特征学习与聚合方法

李婧雯, 张茹, 刘功申, 张童

计算机科学. 2026, 53 (5): 419-425. doi:10.11896/jsjkx.250400070

摘要 ( 148 )

PDF(1796KB) ( 227 )

参考文献 | 相关文章 | 多维度评价

恶意样本的攻击能力特征能够反映攻击者的技术水平,是高级持续性威胁(APT)归因分析的重要线索。然而,APT攻击手段的持续演化容易引发特征漂移,导致传统基于固定特征工程的方法难以适应新的特征分布,削弱模型的泛化能力。为缓解该问题,提出一种面向攻击能力特征的鲁棒归因框架。首先,构建攻击能力特征语义共现网络,引入归纳式图神经网络联合学习特征的语义与共现关系,利用语义聚类压缩特征空间,生成更具稳定性的聚合特征表示;其次,设计特征归纳方法,实现对未知特征的语义泛化,并采用软投票机制集成多模型预测结果,提升归因分析的鲁棒性与泛化能力。在涵盖91个APT组织的样本集上的实验结果显示,模型的宏平均F1值和微平均F1值分别达到71.46%和81.15%,验证了所提方法的有效性。

坐标步长单调的动量对抗攻击方法

陈军, 陶蔚, 鲍蕾, 陶卿

计算机科学. 2026, 53 (5): 426-434. doi:10.11896/jsjkx.250600185

摘要 ( 152 )

PDF(3100KB) ( 273 )

参考文献 | 相关文章 | 多维度评价

对抗样本生成可以归结为最大化模型目标函数的优化问题,目前的求解策略主要采用符号梯度或者符号动量方法。然而这种方法牺牲了关键的梯度和动量方向信息,常常导致收敛性问题,从而造成了对抗攻击的不稳定性。受AMSGrad收敛性分析方法的启发,通过限定各坐标维度的步长单调递减,在MI-FGSM基础上提出了一种坐标步长单调的动量对抗攻击算法MCS-MI。在一般凸条件下,证明了MCS-MI可以获得最优收敛速率O(1/T),其中T是迭代步数;并且,限定坐标步长单调作为一种通用且高效的策略,可以与现有的动量攻击算法相结合。在标准数据集上与近年来表现优异的8种对抗攻击算法进行了实验比较,其不仅具有很好的稳定性,还明显提升了攻击成功率,其中在CNN模型与ViT模型上的攻击成功率最高分别提升了12.3%与5.9%。

基于攻击图的内生安全信息系统防御效果评估技术

崔涛, 沈俊霞, 陈琳, 张云涛, 陈墨楠

计算机科学. 2026, 53 (5): 435-445. doi:10.11896/jsjkx.250300130

摘要 ( 142 )

PDF(3825KB) ( 270 )

参考文献 | 相关文章 | 多维度评价

随着网络安全威胁的日益复杂化和多样化,传统防御技术已难以应对不断变化的攻击手段。内生安全技术作为一种新兴的防御理念,具有动态适应性和自我修复能力,特别是基于拟态防御机制的内生安全技术,凭借其动态性、异构性和冗余性,展现出较强的防御效果。对此,提出了一种基于攻击图的内生安全防御效果评估方法,通过构建网络攻击路径模型,量化分析内生安全信息系统在不同攻击场景下的防御效果。首先,利用攻击图建模技术描述网络中的节点脆弱性、攻击路径及其演化,量化攻击者行为特征。其次,结合内生安全技术的实施,分析其对攻击路径的影响,通过前后对比评估防御效果:构建了“点-线-面”层次化的安全度量框架,从节点的静态防御能力、攻击路径的动态防御能力到系统的弹性恢复能力,对内生安全中冗余特性的防御效果进行了评估。最后,通过仿真实验验证了该方法的有效性,为内生安全技术的防御效果量化评估提供了科学依据。

基于PU分割模式和运动向量的HEVC信息隐藏算法

殷和民, 张英男, 李军, 张严哲

计算机科学. 2026, 53 (5): 446-452. doi:10.11896/jsjkx.251100040

摘要 ( 157 )

PDF(2998KB) ( 283 )

参考文献 | 相关文章 | 多维度评价

互联网平台上视频用户日益增多,高效视频编码(High Efficiency Video Coding,HEVC)标准广泛应用,结合HEVC标准的隐写术和隐写分析不断发展。为提高嵌入的安全性,提出了一种利用预测单元(Prediction Unit,PU)分割模式和运动向量(Motion Vector,MV)嵌入信息的算法,多种载体元素有助于分散嵌入扰动,拓展嵌入空间。PU分割模式域按照PU分割模式数量结构定义二进制映射规则,隐写视频能够保持固有的PU分割模式分布规律;运动向量域预选修改后仍具备MV局部最优性的运动向量差(Motion Vector Difference,MVD)作载体。两个域都使用校验网格码(Syndrome Trellis Codes,STC)自适应寻找嵌入扰动最小的路径。实验结果表明,所提算法能保持良好的视频质量,隐写分析抵抗能力强,嵌入容量理想。