
主管/主办:重庆西南信息有限公司
CODEN JKIEBK


-
基于预训练语言模型的知识图谱研究综述
曾泽凡, 胡星辰, 成清, 司悦航, 刘忠. 基于预训练语言模型的知识图谱研究综述[J]. 计算机科学, 2025, 52(1): 1-33.
ZENG Zefan, HU Xingchen, CHENG Qing, SI Yuehang, LIU Zhong. Survey of Research on Knowledge Graph Based on Pre-trained Language Models[J]. Computer Science, 2025, 52(1): 1-33. - 曾泽凡, 胡星辰, 成清, 司悦航, 刘忠
- 计算机科学. 2025, 52 (1): 1-33. doi:10.11896/jsjkx.240100109
-
摘要 ( 350 )
PDF(4162KB) ( 488 )
- 参考文献 | 相关文章 | 多维度评价
-
大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已经成为了知识图谱研究的主要手段。系统梳理了基于预训练语言模型的知识图谱研究的相关工作,包括知识图谱构建、表示学习、推理、问答等,介绍了相关模型和方法的核心思路,并依据技术路径建立了分类体系,对不同类型方法的优缺点进行了对比分析。此外,对预训练语言模型在事件知识图谱和多模态知识图谱这两种新型知识图谱中的应用现状进行了综述。最后,总结了当前基于预训练语言模型的知识图谱研究面临的挑战,展望了未来的研究方向。
-
大模型红队测试研究综述
包泽芃, 钱铁云. 大模型红队测试研究综述[J]. 计算机科学, 2025, 52(1): 34-41.
BAO Zepeng, QIAN Tieyun. Survey on Large Model Red Teaming[J]. Computer Science, 2025, 52(1): 34-41. - 包泽芃, 钱铁云
- 计算机科学. 2025, 52 (1): 34-41. doi:10.11896/jsjkx.240400190
-
摘要 ( 209 )
PDF(1675KB) ( 274 )
- 参考文献 | 相关文章 | 多维度评价
-
大模型红队测试(Large Model Red Teaming)旨在让大语言模型(Large Language Model,LLM)接收对抗测试,从而诱使模型输出有害的测试用例,进而发现模型中的漏洞并提高其鲁棒性。大模型红队测试是大模型领域的前沿课题,近年来受到学术界和工业界的广泛关注。研究者们针对大模型红队测试提出了众多解决方案,并在模型对齐上取得了一定进展。然而,受限于大模型红队数据的短缺和评价标准的模糊,现有研究大多局限于针对特定的场景进行评估。文中首先从与大模型安全相关的定义出发,对其所涉及的各种风险进行阐述;其次,针对大模型红队测试的重要性及其主要类别进行了阐述,综述和分析了相关红队技术的发展历程,并介绍了已有的数据集和评价指标;最后,对大模型红队测试的未来发展趋势进行了展望和总结。
-
面向联邦大语言模型训练的传输优化技术综述
顿婧博, 李卓. 面向联邦大语言模型训练的传输优化技术综述[J]. 计算机科学, 2025, 52(1): 42-55.
DUN Jingbo, LI Zhuo. Survey on Transmission Optimization Technologies for Federated Large Language Model Training[J]. Computer Science, 2025, 52(1): 42-55. - 顿婧博, 李卓
- 计算机科学. 2025, 52 (1): 42-55. doi:10.11896/jsjkx.240500095
-
摘要 ( 163 )
PDF(1768KB) ( 479 )
- 参考文献 | 相关文章 | 多维度评价
-
随着人工智能技术的快速发展,各类大型语言模型不断涌现。但是专用大语言模型的用户及数据集大多具有隐私性和安全性要求,数据安全隐私问题亟待解决。在此背景下,联邦大语言模型应运而生并得到越来越多的关注。由于大型语言模型庞大的数据量以及联邦学习的分布式架构,海量的参与节点与云服务器间进行大量的模型交换会产生较高的通信成本。为提升模型收敛速率,研究人员对面向联邦大语言模型训练的传输优化技术展开了研究。文章分析了联邦大语言模型所面临的挑战;综述了基于模型微调的传输优化方法、基于模型压缩的传输优化方法以及基于分布式并行处理的传输优化的优化问题;介绍了已有的开源联邦大语言模型以及所用到的传输优化技术,并对未来研究方向进行了展望。
-
提示学习中思维链生成和增强方法综述
郑明琪, 陈晓慧, 刘冰, 张兵, 张然. 提示学习中思维链生成和增强方法综述[J]. 计算机科学, 2025, 52(1): 56-64.
ZHENG Mingqi, CHEN Xiaohui, LIU Bing, ZHANG Bing, ZHANG Ran. Survey of Chain-of-Thought Generation and Enhancement Methods in Prompt Learning[J]. Computer Science, 2025, 52(1): 56-64. - 郑明琪, 陈晓慧, 刘冰, 张兵, 张然
- 计算机科学. 2025, 52 (1): 56-64. doi:10.11896/jsjkx.240700172
-
摘要 ( 206 )
PDF(1968KB) ( 263 )
- 参考文献 | 相关文章 | 多维度评价
-
大语言模型凭借其卓越的语言理解和文本生成能力,在多个领域取得了突破性进展。尽管如此,其在处理复杂推理任务时的表现往往不尽如人意,准确率的提升空间依然巨大。针对这一挑战,学术界提出了思维链策略,这是一种创新的方法,通过让模型生成推理过程来增强模型的推理性能。文中通过全面梳理和深入分析现有的思维链研究,不仅总结了其核心概念和结构框架,还详细探讨了推理生成方法和增强方法。进一步对思维链在不同任务场景中的应用进行了广泛探讨,展示了思维链在提升模型性能方面的潜力。同时,也对思维链的局限性进行了批判性分析,指出了思维链方法存在的不足。最后,对思维链的未来发展进行了前瞻性展望,旨在为思维链未来的研究方向提供指导,并为该领域的研究者提供有价值的参考和启示。
-
大模型驱动多智能体的军事需求生成框架
李嘉晖, 张萌萌, 陈洪辉. 大模型驱动多智能体的军事需求生成框架[J]. 计算机科学, 2025, 52(1): 65-71.
LI Jiahui, ZHANG Mengmeng, CHEN Honghui. Large Language Models Driven Framework for Multi-agent Military Requirement Generation[J]. Computer Science, 2025, 52(1): 65-71. - 李嘉晖, 张萌萌, 陈洪辉
- 计算机科学. 2025, 52 (1): 65-71. doi:10.11896/jsjkx.240800022
-
摘要 ( 175 )
PDF(2543KB) ( 248 )
- 参考文献 | 相关文章 | 多维度评价
-
联合作战军事需求生成涉及的参与人员多、工作量庞大,生成过程大多依赖个体经验与多来源文档,存在需求生成效率较低等问题,难以有效支撑联合作战体系设计。随着大模型技术的发展,大模型驱动的智能体在诸多领域展现出卓越的性能,多智能体系统通过分布式决策实现群体智能,能够高效处理复杂任务。针对军事需求生成过程中存在的效率低下的问题,提出大模型驱动多智能体的军事需求生成框架。该框架整合了多模态信息获取智能体、军事专家智能体、会议主持人等要素。多模态信息获取智能体集成多模态信息处理工具,能够快速获取军事需求,并与用户进行问答交互;军事专家智能体以自然语言对话的形式模拟人类专家讨论生成需求的场景,大模型驱动军事专家智能体理解环境,并能自主调用开源论文库、搜索引擎等工具以支持对话;会议主持人接收人类用户的指令,利用大模型细化指令内容,生成对话提示词和问题背景描述。以俄乌冲突为实验背景,对相关多模态信息进行军事需求生成。实验结果表明,当多模态信息量在大模型最大处理容量以内时,该框架显著降低了军事需求生成的时间消耗,视频资源节省时间占比达到80%~85%,音频资源节省时间占比为90%~95%。
-
SWARM-LLM:基于大语言模型的无人集群任务规划系统
李婷婷, 王琪, 王嘉康, 徐勇军. SWARM-LLM:基于大语言模型的无人集群任务规划系统[J]. 计算机科学, 2025, 52(1): 72-79.
LI Tingting, WANG Qi, WANG Jiakang, XU Yongjun. SWARM-LLM:An Unmanned Swarm Task Planning System Based on Large Language Models[J]. Computer Science, 2025, 52(1): 72-79. - 李婷婷, 王琪, 王嘉康, 徐勇军
- 计算机科学. 2025, 52 (1): 72-79. doi:10.11896/jsjkx.241000038
-
摘要 ( 234 )
PDF(4114KB) ( 273 )
- 参考文献 | 相关文章 | 多维度评价
-
针对无人集群系统自主智能性不足、异构无人集群协同效率低、任务分配不均衡等问题,文中面向无人集群自主规划、高效协作、智能决策的需求,首先提出了一种新的基于大语言模型的无人集群任务规划系统框架(SWARM-LLM)。该框架利用大语言模型将高层次的任务指令转化为具体的智能无人集群任务规划方案,通过任务分解、任务分配、任务执行等多个阶段来实现无人集群协同任务。进一步地,设计了一套适用于无人集群规划的提示工程方法-规划链(Planning Chain,PC),用来指导和优化上述各阶段的实施。最终,在无人集群仿真环境(AirSim)中构建了不同类别和复杂度的任务,并进行了评估实验。与其他基于优化算法和机器学习的算法相比,实验结果证明了SWARM-LLM框架的有效性,并在任务成功率上展现出了显著的优势,平均性能提升了47.8%。
-
基于预训练大模型的行动方案生成方法
颜玉松, 周圆, 王琮, 孔圣麒, 王权, 黎敏讷, 王之元. 基于预训练大模型的行动方案生成方法[J]. 计算机科学, 2025, 52(1): 80-86.
YAN Yusong, ZHOU Yuan, WANG Cong, KONG Shengqi, WANG Quan, LI Minne, WANG Zhiyuan. COA Generation Based on Pre-trained Large Language Models[J]. Computer Science, 2025, 52(1): 80-86. - 颜玉松, 周圆, 王琮, 孔圣麒, 王权, 黎敏讷, 王之元
- 计算机科学. 2025, 52 (1): 80-86. doi:10.11896/jsjkx.240900075
-
摘要 ( 193 )
PDF(3048KB) ( 269 )
- 参考文献 | 相关文章 | 多维度评价
-
围绕生成式人工智能赋能指挥决策需求,分析了指挥决策中方案生成问题的难点挑战和新兴预训练大语言模型技术的应用前景,提出了一种基于预训练大模型的作战行动方案生成方法——COA-Gen。首先,为了使生成的行动方案符合目标,设计了多轮方案生成框架;其次,构建了多要素中文提示词模板用于整合海量多源信息;最后,针对特定小领域的数据缺乏问题,引入知识增强技术以提升大模型规划效能。为了验证所提行动方案的效果,制定了基于《星际争霸II》游戏引擎和“虎爪”想定的方案验证环境。实验结果表明,该方法具有较好的鲁棒性,可以较好地依从指挥员意图,验证了大模型用于作战行动方案生成的可行性。此外,不同预训练大模型在相同任务中展现出不同的效果,表明在实际应用中选择不同的预训练大模型可能会生成具有不同风格的行动方案,从而影响最终的行动结果。
-
一种基于知识图谱的检索增强生成情报问答技术
成志宇, 陈星霖, 王菁, 周中元, 张志政. 一种基于知识图谱的检索增强生成情报问答技术[J]. 计算机科学, 2025, 52(1): 87-93.
CHENG Zhiyu, CHEN Xinglin, WANG Jing, ZHOU Zhongyuan, ZHANG Zhizheng. Retrieval-augmented Generative Intelligence Question Answering Technology Based on Knowledge Graph[J]. Computer Science, 2025, 52(1): 87-93. - 成志宇, 陈星霖, 王菁, 周中元, 张志政
- 计算机科学. 2025, 52 (1): 87-93. doi:10.11896/jsjkx.240900064
-
摘要 ( 128 )
PDF(2296KB) ( 217 )
- 参考文献 | 相关文章 | 多维度评价
-
为实现军事情报问答,提出了一种基于知识图谱的检索增强生成框架。该框架通过问题分类、实体识别、实体链接、知识检索有效地获取了背景知识。同时考虑到情报问题多约束的特点,使用回答集编程在知识上通过约束限制减少知识数量或者直接获得答案。最后,使用大语言模型在精炼后的知识上对问题进行求解,以减少问题理解过程中的属性识别与链接。在MilRE数据集上的实验表明,所提框架能够提供基于知识图谱的增强知识检索功能,并具有较好的军事情报问题解答能力。
-
大语言模型驱动的多元关系知识图谱补全方法
刘畅成, 桑磊, 李炜, 张以文. 大语言模型驱动的多元关系知识图谱补全方法[J]. 计算机科学, 2025, 52(1): 94-101.
LIU Changcheng, SANG Lei, LI Wei, ZHANG Yiwen. Large Language Model Driven Multi-relational Knowledge Graph Completion Method[J]. Computer Science, 2025, 52(1): 94-101. - 刘畅成, 桑磊, 李炜, 张以文
- 计算机科学. 2025, 52 (1): 94-101. doi:10.11896/jsjkx.240600170
-
摘要 ( 152 )
PDF(2370KB) ( 242 )
- 参考文献 | 相关文章 | 多维度评价
-
知识图谱通过将复杂的互联网信息转化为易于理解的结构化形式,极大地提高了信息的可访问性。知识图谱补全技术进一步增强了知识图谱的信息完整性,显著提升了智能问答和推荐系统等通用领域应用的性能与用户体验。然而,现有的知识图谱补全方法大多专注于关系类型较少和简单语义情景下的三元组实例,未能充分利用知识图谱在处理多元关系和复杂语义方面的潜力。针对此问题,提出了一种由大语言模型(LLM)驱动的多元关系知识图谱补全方法。将 LLM 的深层语言理解能力与知识图谱的结构特性相结合,有效捕捉多元关系,理解复杂语义情景。此外,还引入了一种基于思维链的提示工程策略,旨在提高补全任务的准确性。该方法在两个公开知识图谱数据集上的实验结果都取得了显著的提升。
-
跨城市人类移动行为预测研究综述
张雨松, 胥帅, 严兴宇, 关东海, 许建秋. 跨城市人类移动行为预测研究综述[J]. 计算机科学, 2025, 52(1): 102-119.
ZHANG Yusong, XU Shuai, YAN Xingyu, GUAN Donghai, XU Jianqiu. Survey on Cross-city Human Mobility Prediction[J]. Computer Science, 2025, 52(1): 102-119. - 张雨松, 胥帅, 严兴宇, 关东海, 许建秋
- 计算机科学. 2025, 52 (1): 102-119. doi:10.11896/jsjkx.240100032
-
摘要 ( 130 )
PDF(2907KB) ( 158 )
- 参考文献 | 相关文章 | 多维度评价
-
城市化进程积累了大量记录人类移动行为的时空数据,为研究人类移动行为建模及预测提供了良好的数据基础。在智慧城市建设背景下,跨城市人类移动预测是实现城市协同管理与治理的必然要求,时常面临数据匮乏以及数据分布不平衡等问题,传统机器学习方法难以取得理想的性能。因此,将人类移动相关知识从数据丰富的源城市迁移到数据稀疏乃至稀缺的目标城市至关重要。首先概述了现有跨城市人类移动行为预测研究所使用的数据集和评价指标,随后循序渐进地讨论人类个体和群体层面的跨城市移动预测问题并分类综述各自适用的研究方法。针对人类个体跨城市移动预测,主要分析协同过滤、矩阵分解、统计学习以及深度学习这4类模型方法的应用。针对人类群体跨城市移动预测,则聚焦知识迁移和元学习这两种面向少样本机器学习方法的应用。最后,展望了跨城市人类移动行为预测领域亟需解决的重要问题。
-
基于重复数据删除的分层存储优化技术研究进展
姚子路, 付印金, 肖侬. 基于重复数据删除的分层存储优化技术研究进展[J]. 计算机科学, 2025, 52(1): 120-130.
YAO Zilu, FU Yinjin, XIAO Nong. Research Progress on Optimization Techniques of Tiered Storage Based on Deduplication[J]. Computer Science, 2025, 52(1): 120-130. - 姚子路, 付印金, 肖侬
- 计算机科学. 2025, 52 (1): 120-130. doi:10.11896/jsjkx.231200011
-
摘要 ( 152 )
PDF(1778KB) ( 192 )
- 参考文献 | 相关文章 | 多维度评价
-
随着全球数据量的爆炸式增长以及数据多样性的日益丰富,单一介质层的存储系统逐渐不能满足用户多样化的应用需求。分层存储技术可依据数据的重要性、访问频率、安全性需求等特征将数据分类存放到具有不同访问延迟、存储容量、容错能力的存储层中,已经在各个领域得到广泛应用。重复数据删除是一种面向大数据的缩减技术,可高效去除存储系统中的重复数据,最大化存储空间利用率。不同于单存储层场景,将重复数据删除技术运用于分层存储中,不仅能减少跨层数据冗余,进一步节省存储空间、降低存储成本,还能更好地提升数据I/O性能和存储设备的耐久性。在简要分析基于重复数据删除的分层存储技术的原理、流程和分类之后,从存储位置选择、重复内容识别和数据迁移操作3个关键步骤入手,深入总结了诸多优化方法的研究进展,并针对基于重复数据删除的分层存储技术潜在的技术挑战进行了深入探讨。最后展望了基于重复数据删除的分层存储技术的未来发展趋势。
-
面向NewSQL数据库数据协同持久化的研究
左顺, 李永坤, 许胤龙. 面向NewSQL数据库数据协同持久化的研究[J]. 计算机科学, 2025, 52(1): 131-141.
ZUO Shun, LI Yongkun, XU Yinlong. Study on Collaborative Data Persistence in NewSQL Databases[J]. Computer Science, 2025, 52(1): 131-141. - 左顺, 李永坤, 许胤龙
- 计算机科学. 2025, 52 (1): 131-141. doi:10.11896/jsjkx.231200079
-
摘要 ( 80 )
PDF(2337KB) ( 121 )
- 参考文献 | 相关文章 | 多维度评价
-
现代NewSQL数据库为了提供数据的高可用性,通常会为数据提供多个副本,以便在某个副本不可用时,可以从其他的副本中获取数据。而在数据多副本的情况下,又需要考虑副本间的数据一致性问题,即在某一时刻不同客户端读取某个数据时得到的结果应该是相同的,因此引入了事务处理机制。在一个包含多个写操作的交互式事务处理过程中,由于数据存在多个副本,因此每个写入操作需要对所有的主备副本进行写入操作。然而主备副本通常分散在不同的机器上,因此会引入写远端副本的时延,其最终将会增大整个事务的处理时延。针对该问题,提出了数据协同持久化的方案,其主要思想是让客户端在本地缓存事务的写操作日志,在最终提交事务时,客户端首先将事务中的写操作日志进行持久化,并将该日志发送给事务的协调者节点,让协调者进行日志数据的分发处理,从而达到两者协同持久化事务数据的目的。实验结果表明,相较于同步持久化方案,协同持久化方案不仅能降低交互式事务处理的时延,还能提高约38%左右的系统极限吞吐率。
-
序列标签推荐
刘冰, 徐鹏宇, 陆思进, 王诗菁, 孙宏健, 景丽萍, 于剑. 序列标签推荐[J]. 计算机科学, 2025, 52(1): 142-150.
LIU Bing, XU Pengyu, LU Sijin, WANG Shijing, SUN Hongjian, JING Liping, YU Jian. Sequential Tag Recommendation[J]. Computer Science, 2025, 52(1): 142-150. - 刘冰, 徐鹏宇, 陆思进, 王诗菁, 孙宏健, 景丽萍, 于剑
- 计算机科学. 2025, 52 (1): 142-150. doi:10.11896/jsjkx.240700186
-
摘要 ( 73 )
PDF(2367KB) ( 143 )
- 参考文献 | 相关文章 | 多维度评价
-
随着互联网技术的发展以及社交网络的扩大,网络平台已经成为人们获取信息的一个重要途径。标签的引入提升了信息分类及检索效率。同时,标签推荐系统的出现不仅方便了用户输入标签,还提高了标签的质量。传统的标签推荐算法通常只考虑标签和项目两个主体,而忽略了用户在选择标签时个人意图所起到的重要作用。由于在标签推荐系统中标签最终由用户确定,因此用户的偏好在标签推荐中起着关键作用。为此,引入用户作为主体,并结合用户发布的历史帖子的先后顺序,将标签推荐任务建模为更加符合真实场景的序列标签推荐任务。提出了一种基于MLP的序列标签推荐方法(MLP for Sequential Tag Recommendation,MLP4STR),该方法显式地建模用户偏好用于引导整体标签推荐。MLP4STR采用一种跨特征对齐的MLP序列特征提取框架,将文本和标签的特征对齐,获取用户的历史帖子信息和历史标签信息中隐含的用户动态兴趣。最后,结合帖子内容和用户偏好进行标签推荐。在4个真实世界的数据集上得到的实验结果表明,MLP4STR能够有效地学习序列标签推荐中的用户历史行为序列的信息,其中,评价指标F1@5较最优的对比算法有显著提升。
-
面向远程内存图数据库的应用感知分离式存储设计
李纯羽, 邓龙, 李永坤, 许胤龙. 面向远程内存图数据库的应用感知分离式存储设计[J]. 计算机科学, 2025, 52(1): 151-159.
LI Chunyu, DENG Long, LI Yongkun, XU Yinlong. Application-aware Disaggregated Storage Design for Remote Memory Graph Database[J]. Computer Science, 2025, 52(1): 151-159. - 李纯羽, 邓龙, 李永坤, 许胤龙
- 计算机科学. 2025, 52 (1): 151-159. doi:10.11896/jsjkx.231200073
-
摘要 ( 67 )
PDF(2552KB) ( 149 )
- 参考文献 | 相关文章 | 多维度评价
-
图数据在各种应用中日益普及,其因涵盖多种实体类型和存在丰富的关联关系而备受关注。对于图数据库用户而言,高效的图查询服务是保障系统性能的关键因素。随着数据量增加,单机图数据库很难满足将所有数据存储在内存中的需求,而分布式图数据库在拓展性和资源利用率方面受到挑战。基于RDMA的远程内存系统的引入为克服这些挑战提供了一种新的选择,通过分离计算和存储资源,实现了更为灵活的内存使用方式。然而,在使用远程内存的情况下如何最大程度地优化图查询性能成为了当前研究的重点问题。文中首先分析了利用操作系统分页机制透明使用远程内存构建图数据库存在的问题,并在应用层次上设计了远程内存图数据库的存储模型。根据不同数据的特点和访问模式,设计了属性图在远程内存中的存储结构,优化了数据布局和访问路径。实验结果表明,在本地内存受限的情况下,与透明使用远程内存相比,应用感知的设计方式的端到端性能最高提升了12倍。
-
路径掩码自编码器引导无监督属性图节点聚类
丁新宇, 孔兵, 陈红梅, 包崇明, 周丽华. 路径掩码自编码器引导无监督属性图节点聚类[J]. 计算机科学, 2025, 52(1): 160-169.
DING Xinyu, KONG Bing, CHEN Hongmei, BAO Chongming, ZHOU Lihua. Path-masked Autoencoder Guiding Unsupervised Attribute Graph Node Clustering[J]. Computer Science, 2025, 52(1): 160-169. - 丁新宇, 孔兵, 陈红梅, 包崇明, 周丽华
- 计算机科学. 2025, 52 (1): 160-169. doi:10.11896/jsjkx.231100117
-
摘要 ( 90 )
PDF(2977KB) ( 167 )
- 参考文献 | 相关文章 | 多维度评价
-
图聚类的目的在于发现网络的社区结构。针对目前聚类方法无法很好地获取网络深层潜在社区信息,且不能对特征进行合适的信息整合导致节点社区语义不清晰的问题,提出了一种路径掩码自编码器引导无监督属性图节点聚类模型(Path-Masked Autoencoder Guiding Unsupervised Attribute Graph Node Clustering,PAUGC)。该模型通过对网络进行随机路径掩码后使用自编码器来深度挖掘网络拓扑结构,从而获得良好的全局结构语义信息,利用规范性方法来对特征进行信息整合,使节点特征能够更好地表征特征的类别信息。此外,模型结合模块最大化来抓取整个图中的底层社区群落信息,目的在于更合理地将其融合到低维度节点特征中。最后通过自训练聚类来不断迭代优化更新聚类表示以获得最终的节点特征。通过在8个基准数据集上与11种经典方法进行大量实验对比,证明了PAUGC的有效性。
-
融合时频特征的多粒度时间序列对比学习方法
叶力硕, 何志学. 融合时频特征的多粒度时间序列对比学习方法[J]. 计算机科学, 2025, 52(1): 170-182.
YE Lishuo, HE Zhixue. Multi-granularity Time Series Contrastive Learning Method Incorporating Time-Frequency Features[J]. Computer Science, 2025, 52(1): 170-182. - 叶力硕, 何志学
- 计算机科学. 2025, 52 (1): 170-182. doi:10.11896/jsjkx.231100171
-
摘要 ( 134 )
PDF(6159KB) ( 162 )
- 参考文献 | 相关文章 | 多维度评价
-
现有的时间序列对比学习方法存在增强样本构造方式过于依赖人工经验、泛化能力不足、正样本的定义方式不够通用、对比度量方式存在粗粒度表征等问题,使得整体的时序表示效果较差。为此,提出了一种融合时频特征的多粒度时间序列对比学习方法(Temporal-Spectral Deep Contrastive Network,TSDC)。该方法通过季节-趋势生成网络在时域内产生具有稳定变化的时序增强样本,通过多频带融合扰动操作在频域内产生非稳定变化的时序增强样本,两种增强样本通过实例级别的粗粒度对比以及维度级别的细粒度对比方式进行对比学习,使得模型在获得较好表征的同时能够较好地适应于下游不同类型的时序任务。在多个时间序列公开数据集上进行的分类、预测以及异常检测实验表明,由TSDC方法所得的表征用于下游任务的结果优于典型基线模型。
-
联邦学习在医学图像处理任务中的研究综述
刘育铭, 代煜, 陈公平. 联邦学习在医学图像处理任务中的研究综述[J]. 计算机科学, 2025, 52(1): 183-193.
LIU Yuming, DAI Yu, CHEN Gongping. Review of Federated Learning in Medical Image Processing[J]. Computer Science, 2025, 52(1): 183-193. - 刘育铭, 代煜, 陈公平
- 计算机科学. 2025, 52 (1): 183-193. doi:10.11896/jsjkx.231200057
-
摘要 ( 180 )
PDF(1850KB) ( 146 )
- 参考文献 | 相关文章 | 多维度评价
-
在医学领域,由于患者隐私问题,图像很难集中收集和标注,这给深度学习模型的训练和部署带来了较大困难。联邦学习作为一种能有效保护数据隐私的分布式学习框架,能够在参与方不共享数据的基础上进行联合建模,从技术上打破数据孤岛,其凭借这些优势在许多行业已经得到广泛应用。由于与医学图像处理的需求高度契合,近年来也涌现出许多应用于医学图像处理的联邦学习研究,然而大部分新的方法仍未被归纳分析,不利于后续的进一步探索。文中对联邦学习进行了简单的介绍,列举了其在医学图像处理方面的部分应用,并根据改进的方向对目前已有的研究进行了分类总结。最后,讨论了目前医学图像方向联邦学习所面临的问题和挑战,并对未来的研究方向进行了展望,希望给后续研究提供一定的帮助。
-
视觉Transformer(ViT)发展综述
李玉洁, 马子航, 王艺甫, 王星河, 谭本英. 视觉Transformer(ViT)发展综述[J]. 计算机科学, 2025, 52(1): 194-209.
LI Yujie, MA Zihang, WANG Yifu, WANG Xinghe, TAN Benying. Survey of Vision Transformers(ViT)[J]. Computer Science, 2025, 52(1): 194-209. - 李玉洁, 马子航, 王艺甫, 王星河, 谭本英
- 计算机科学. 2025, 52 (1): 194-209. doi:10.11896/jsjkx.240600135
-
摘要 ( 440 )
PDF(3037KB) ( 291 )
- 参考文献 | 相关文章 | 多维度评价
-
视觉Transformer(Vision Transformer,ViT)是基于编码器-解码器结构的Transformer改进模型,已经被成功应用于计算机视觉领域。近几年基于ViT的研究层出不穷且效果显著,基于该模型的工作已经成为计算机视觉任务的重要研究方向,因此针对近年来ViT的发展进行概述。首先,简要回顾了ViT的基本原理及迁移过程,并分析了ViT模型的结构特点和优势;然后,根据各ViT变体模型的改进特点,归纳和梳理了基于ViT的主要骨干网络变体改进方向及其代表性改进模型,包括局部性改进、结构改进、自监督、轻量化及效率改进等改进方向,并对其进行分析比较;最后,讨论了当前ViT及其改进模型仍存在的不足,对ViT未来的研究方向进行了展望。可以作为研究人员进行基于ViT骨干网络的研究时选择深度学习相关方法的一个权衡和参考。
-
面向工业品缺陷检测的对比表示学习
罗航宇, 王小平, 梅萌, 赵文豪, 刘思纯. 面向工业品缺陷检测的对比表示学习[J]. 计算机科学, 2025, 52(1): 210-220.
LUO Hangyu, WANG Xiaoping, MEI Meng, ZHAO Wenhao, LIU Sichun. Contrastive Representation Learning for Industrial Defect Detection[J]. Computer Science, 2025, 52(1): 210-220. - 罗航宇, 王小平, 梅萌, 赵文豪, 刘思纯
- 计算机科学. 2025, 52 (1): 210-220. doi:10.11896/jsjkx.240100202
-
摘要 ( 113 )
PDF(3186KB) ( 144 )
- 参考文献 | 相关文章 | 多维度评价
-
在大规模制造业中,缺陷检测旨在发现有缺陷的零部件,如损坏、错位的和存在印刷错误的部件等。由于缺陷类型未知以及缺陷样本短缺,工业品缺陷检测面临着极大的挑战。为克服上述困难,一些方法利用来自自然图像数据集的通用视觉表示,提取广义特征来进行缺陷检测。然而,提取到的预训练特征与目标数据之间存在分布差异,直接使用该特征会导致检测性能不佳。因此,提出了一种基于对比表示学习的方法ConPatch。该方法采用对比表示学习来收集相似特征或者分离不相似特征,从而学习面向目标的特征表示。为了解决缺乏缺陷标注的问题,将数据表示之间的两种相似性度量即成对相似度和全局相似度作为伪标签。此外,采用了轻量化的内存库,仅将全部正常样本即全部无缺陷样本的特征中心存储到内存库中,从而减小了空间复杂度和内存库的尺寸。最后,将正常特征拉近至一个超球面内,而缺陷特征则分布在超球面外,以此来聚集正常特征。实验结果显示,在工业品缺陷检测数据集MVTec AD中,基于Wide-ResNet50的ConPatch模型的I-AUROC和P-AUROC分别达到99.35%和98.26%。在VisA数据集中,ConPatch模型的I-AUROC和P-AUROC分别达到95.50%和98.21%。上述结果验证了模型的有效性。
-
基于双流融合网络的非接触式IR-UWB人体动作识别方法
张传宗, 王冬子, 郭政鑫, 桂林卿, 肖甫. 基于双流融合网络的非接触式IR-UWB人体动作识别方法[J]. 计算机科学, 2025, 52(1): 221-231.
ZHANG Chuanzong, WANG Dongzi, GUO Zhengxin, GUI Linqing, XIAO Fu. Contact-free IR-UWB Human Motion Recognition Based on Dual-stream Fusion Network[J]. Computer Science, 2025, 52(1): 221-231. - 张传宗, 王冬子, 郭政鑫, 桂林卿, 肖甫
- 计算机科学. 2025, 52 (1): 221-231. doi:10.11896/jsjkx.240400108
-
摘要 ( 115 )
PDF(4935KB) ( 165 )
- 参考文献 | 相关文章 | 多维度评价
-
随着智能感知技术的飞速发展,人机交互(Human Computer Interaction,HCI)领域迎来了全新的发展态势。传统的人机交互方法主要依赖可穿戴设备或者摄像头采集用户的行为数据,虽然识别精准,却存在不小的局限性。具体而言,可穿戴设备会给用户带来额外的使用负担,而基于摄像头的方案不仅会受到环境光线的影响,还会涉及用户隐私的泄露,这些因素均限制了其在日常生活中的广泛应用。为了突破这些限制,实现精确的、非接触式人机交互应用,利用无线射频(Radio Frequency,RF)领域中脉冲超宽带(Impulse Radio Ultra-Wideband,IR-UWB)所具有的高灵敏度和精细空间分辨率等优势,提出了一种基于双流融合网络的非接触式人体动作识别方法。该方法捕获目标运动所导致的时域信号变化,并通过对时域特征进行多普勒频移变化,提取到对应的频域特征。在此基础上,构建了一个融合多维卷积神经网络(Convolutional Neural Networks,CNNs)和GoogLeNet模块的双流网络模型,以实现高精度的动作识别。通过广泛的实验测试,结果表明所提方法对8种常见人体动作的平均识别准确率达到94.89%,并且在不同的测试条件下均能保持超过90%的识别准确率,进一步验证了所提方法的鲁棒性。
-
基于多目标优化的工作量感知即时软件缺陷预测特征构建方法
赵晨阳, 刘磊, 江贺. 基于多目标优化的工作量感知即时软件缺陷预测特征构建方法[J]. 计算机科学, 2025, 52(1): 232-241.
ZHAO Chenyang, LIU Lei, JIANG He. Feature Construction for Effort-aware Just-In-Time Software Defect Prediction Based on Multi-objective Optimization[J]. Computer Science, 2025, 52(1): 232-241. - 赵晨阳, 刘磊, 江贺
- 计算机科学. 2025, 52 (1): 232-241. doi:10.11896/jsjkx.240100198
-
摘要 ( 77 )
PDF(1966KB) ( 156 )
- 参考文献 | 相关文章 | 多维度评价
-
即时软件缺陷预测(JIT-SDP)是一种针对代码变更的软件缺陷预测技术,具有细粒度、即时性和可追溯性的优点。工作量感知JIT-SDP进一步考虑代码检查工作量,旨在以有限的工作量识别更多的缺陷变更。尽管目前已有不少工作量感知JIT-SDP,但这些方法大多只针对分类模型算法进行优化。为提升工作量感知JIT-SDP的性能表现与泛用性,首次从特征工程方面入手,提出了一种工作量感知场景下的进化特征构建方法EEF。首先,EEF方法通过遗传编程树来表示特征,从分类性能与工作量感知性能两个角度出发,通过基于多目标优化的进化特征构建方法来获取新的特征转换方法;之后,通过得到的特征转换方法来构建新的特征集,并基于新的特征集训练与测试分类模型。为了验证EEF方法的有效性,在6个开源项目上,通过3个不同评估方案进行了实验研究,结果证明EEF方法可以提升分类模型在工作量感知场景下的性能,并优于其他特征工程方法,而且在保证特征选取多样性的前提下,基于单一模型的EEF方法同样可以提升其他模型的性能。
-
基于细粒度代码表示和特征融合的即时软件缺陷预测方法
朱晓燕, 王文格, 王嘉寅, 张选平. 基于细粒度代码表示和特征融合的即时软件缺陷预测方法[J]. 计算机科学, 2025, 52(1): 242-249.
ZHU Xiaoyan, WANG Wenge, WANG Jiayin, ZHANG Xuanping. Just-In-Time Software Defect Prediction Approach Based on Fine-grained Code Representationand Feature Fusion[J]. Computer Science, 2025, 52(1): 242-249. - 朱晓燕, 王文格, 王嘉寅, 张选平
- 计算机科学. 2025, 52 (1): 242-249. doi:10.11896/jsjkx.240200046
-
摘要 ( 91 )
PDF(2019KB) ( 144 )
- 参考文献 | 相关文章 | 多维度评价
-
即时软件缺陷预测指在软件更改初次提交之际预测该更改引入缺陷的倾向。此类预测针对单一程序变更,而非在粗粒度上进行。由于其即时性和可追溯性,该技术已在持续测试等领域得到广泛应用。目前的研究中,提取变更代码表示的方法粒度较粗,仅标出了变更行,而没有进行细粒度的标记。此外,现有的使用提交内容进行缺陷预测的方法,仅仅是把提交消息与变更代码的特征进行简单拼接,缺失了在特征空间上的深度对齐,这使得在提交消息质量参差不齐的情况下,会出现预测结果易受噪声干扰的情形,并且现有方法也未将领域专家设计的人工特征以及变更内容中的语义语法信息综合起来进行预测。为了解决上述问题,提出了一种基于细粒度代码表征和特征融合的即时软件缺陷预测方法。通过引入新的变更嵌入计算方法来在细粒度上表示变更代码。同时,引入特征对齐模块,降低提交消息中噪声对方法性能的影响。此外,使用神经网络从人工设计的特征中学习专业知识,充分利用现有特征进行预测。实验结果表明,相较于现有方法,该方法在3个性能指标上均有显著提升。
-
基于CodeBERT和Stacking集成学习的补丁正确性验证方法
韩威, 姜淑娟, 周伟. 基于CodeBERT和Stacking集成学习的补丁正确性验证方法[J]. 计算机科学, 2025, 52(1): 250-258.
HAN Wei, JIANG Shujuan, ZHOU Wei. Patch Correctness Verification Method Based on CodeBERT and Stacking Ensemble Learning[J]. Computer Science, 2025, 52(1): 250-258. - 韩威, 姜淑娟, 周伟
- 计算机科学. 2025, 52 (1): 250-258. doi:10.11896/jsjkx.240100019
-
摘要 ( 80 )
PDF(2540KB) ( 191 )
- 参考文献 | 相关文章 | 多维度评价
-
近年来,自动程序修复已成为软件工程领域的重要研究课题。然而,现有的自动修复技术大多是基于补丁生成和测试的,在补丁验证环节时间成本很高。此外,由于测试套件的不完备,许多候选补丁虽然能通过测试,但实际上并不正确,从而导致补丁过拟合。为提高补丁验证的效率并缓解补丁过拟合的问题,提出了一种静态的补丁验证方法。该方法首先使用大型预训练模型CodeBERT自动提取缺陷代码片段和补丁代码片段的语义特征,然后使用历史缺陷修复补丁数据训练Stacking集成学习模型,训练之后的模型可以对新的缺陷修复补丁进行有效验证。在Defects4J缺陷数据集相关的1 000个补丁数据上对所提方法的验证能力进行评估。实验结果表明,该方法可以有效地验证补丁的正确性,从而提高补丁验证的效率。
-
视觉富文档理解预训练综述
张剑, 李晖, 张晟铭, 吴杰, 彭滢. 视觉富文档理解预训练综述[J]. 计算机科学, 2025, 52(1): 259-276.
ZHANG Jian, LI Hui, ZHANG Shengming, WU Jie, PENG Ying. Review of Pre-training Methods for Visually-rich Document Understanding[J]. Computer Science, 2025, 52(1): 259-276. - 张剑, 李晖, 张晟铭, 吴杰, 彭滢
- 计算机科学. 2025, 52 (1): 259-276. doi:10.11896/jsjkx.240300028
-
摘要 ( 107 )
PDF(4850KB) ( 134 )
- 参考文献 | 相关文章 | 多维度评价
-
视觉富文档指语义结构不仅由文本内容决定,还与排版格式和表格结构等视觉元素相关的文档。现实生活中的票据理解和证件识别等应用场景,都需要对视觉富文档进行自动化的阅读、分析和处理。这一过程即为视觉富文档理解,属于自然语言处理和计算机视觉的交叉领域。近年来,视觉富文档理解领域的预训练技术在打破下游任务的训练壁垒和提升模型表现上取得了重大的进展。然而,目前对现有的预训练模型的归纳总结和深入分析仍然有所欠缺。为此,对视觉富文档理解领域预训练技术的相关研究进行了全面总结。首先,介绍了预训练技术的数据预处理阶段,包括预训练数据集和光学字符识别引擎。然后,对预训练技术的模型预训练阶段进行了阐述,提炼出单模态表示学习、多模态特征融合和预训练任务3个关键的技术模块,并基于上述模块归纳了预训练模型之间的共性和差异。此外,简要介绍了多模态大模型在视觉富文档理解领域的应用。接着,对预训练模型在下游任务上的表现进行了对比分析。最后,探讨了预训练技术面临的挑战和未来的研究方向。
-
基于符号知识的选项发现方法
王麒迪, 沈立炜, 吴天一. 基于符号知识的选项发现方法[J]. 计算机科学, 2025, 52(1): 277-288.
WANG Qidi, SHEN Liwei, WU Tianyi. Option Discovery Method Based on Symbolic Knowledge[J]. Computer Science, 2025, 52(1): 277-288. - 王麒迪, 沈立炜, 吴天一
- 计算机科学. 2025, 52 (1): 277-288. doi:10.11896/jsjkx.240100221
-
摘要 ( 66 )
PDF(2547KB) ( 112 )
- 参考文献 | 相关文章 | 多维度评价
-
基于选项(Option)的层次化策略学习是分层强化学习领域的一种主要实现方式。其中,选项表示特定动作的时序抽象,一组选项以多层次组合的方式可解决复杂的强化学习任务。针对选项发现这一目标,已有的研究工作使用监督或无监督方式从非结构化演示轨迹中自动发现有意义的选项。然而,基于监督的选项发现过程需要人为分解任务问题并定义选项策略,带来了大量的额外负担;无监督方式发现的选项则难以包含丰富语义,限制了后续选项的重用。为此,提出一种基于符号知识的选项发现方法,只需对环境符号建模,所得知识可指导环境中多种任务的选项发现,并为发现的选项赋予符号语义,从而在新任务执行时被重复使用。将选项发现过程分解为轨迹切割和行为克隆两阶段步骤:轨迹切割旨在从演示轨迹提取具备语义的轨迹片段,为此训练一个面向演示轨迹的切割模型,引入符号知识定义强化学习奖励评价切割的准确性;行为克隆根据切割得到的数据监督训练选项,旨在使选项模仿轨迹行为。使用所提方法在多个包括离散和连续空间的领域环境中分别进行了选项发现和选项重用实验。选项发现中轨迹切割部分的实验结果显示,所提方法在离散和连续空间环境中的切割准确率均高出基线方法数个百分点,并在复杂环境任务的切割中提高到20%。另外,选项重用实验的结果证明,相较于基线方法,赋予符号语义增强的选项在新任务重用上拥有更快的训练速度,并在基线方法无法完成的复杂任务中仍然得到良好收敛。
-
基于最大影响力集合的主动学习方法
李雅和, 谢志鹏. 基于最大影响力集合的主动学习方法[J]. 计算机科学, 2025, 52(1): 289-297.
LI Yahe, XIE Zhipeng. Active Learning Based on Maximum Influence Set[J]. Computer Science, 2025, 52(1): 289-297. - 李雅和, 谢志鹏
- 计算机科学. 2025, 52 (1): 289-297. doi:10.11896/jsjkx.231100075
-
摘要 ( 68 )
PDF(2868KB) ( 132 )
- 参考文献 | 相关文章 | 多维度评价
-
随着深度学习技术的不断进步,其已经在许多领域广泛应用。但深度模型的训练需要消耗大量标注数据,时间与资源成本高,如何利用尽可能少的标注数据达到最佳模型效果成为一个重要的研究课题。主动学习的提出正是为了解决这一问题,其旨在选择最有价值的样本进行标注并用于模型训练。传统的主动学习策略通常关注不确定性或多样性,旨在查询最困难或最具代表性的样本。然而,在主动学习问题中,这些方法通常没有考虑标注样本和无标注样本之间的交互作用。另一类主动学习方法则使用辅助网络进行样本选择,但这些方法通常会增加计算复杂度。在上述背景下,提出一种新的主动学习算法,旨在通过考虑不同样本之间的相互作用,综合衡量候选样本对其他样本的影响力与不确定性,来最大限度地提高模型的整体性能增益。所提算法首先根据样本隐含层表征之间的距离估计样本相互之间的影响力,进一步根据候选样本的影响力与无标注样本的不确定性估计该样本能够带来的潜在增益,并迭代地选择全局增益最大的样本进行标注。进一步在一系列不同领域的多种任务上将该方法与其他主动学习策略进行了比较,实验结果表明,该方法在所有任务中的表现均显著优于所有基线方法。进一步的量化分析实验也证明该方法在不确定性和多样性之间取得了良好的权衡,并探究了主动学习不同阶段应该注重的因素。
-
基于多关系图注意力网络的社交机器人检测
孟令君, 陈鸿昶, 王庚润. 基于多关系图注意力网络的社交机器人检测[J]. 计算机科学, 2025, 52(1): 298-306.
MENG Lingjun, CHEN Hongchang, WANG Gengrun. Social Bots Detection Based on Multi-relationship Graph Attention Network[J]. Computer Science, 2025, 52(1): 298-306. - 孟令君, 陈鸿昶, 王庚润
- 计算机科学. 2025, 52 (1): 298-306. doi:10.11896/jsjkx.231100161
-
摘要 ( 100 )
PDF(3244KB) ( 175 )
- 参考文献 | 相关文章 | 多维度评价
-
现阶段社交机器人已经广泛存在于社交平台,社交机器人的存在使得网络上的舆论环境可以被人为操纵,这样不仅损害了绿色和谐的网络环境,同时也导致人们正常的网络生活受到极大影响。现有的检测方法可以分为基于特征、基于文本和基于图的方法,其中基于图数据的检测方法大多忽略了图中关系的异质性,并且由于图神经网络存在过渡平滑现象而不能进行深度检测。针对这一问题,提出基于多关系图注意力网络的社交机器人检测方法,在训练时首先将不同关系下的子图抽取出来,然后对子图中的节点采用注意力机制进行聚合,在不同关系下进行节点表示学习并得到节点表示,最后利用通道注意力融合不同关系下的同一节点得到节点表示;同时采用基于LSTM注意力的后连接操作让节点可以自适应地选择邻域进行聚合,以此来缓解过度平滑现象。在Cresci15,Twibot20和MGTAB这3个数据集上的实验结果表明,与11个模型中评价指标的最优值相比,该模型的准确率分别提升了0.47%,1.19%和0.38%,验证了多关系图注意力网络进行社交机器人检测的有效性。
-
融合情感和常识知识的对话生成模型
程金凤, 蒋宗礼. 融合情感和常识知识的对话生成模型[J]. 计算机科学, 2025, 52(1): 307-314.
CHENG Jinfeng, JIANG Zongli. Dialogue Generation Model Integrating Emotional and Commonsense Knowledge[J]. Computer Science, 2025, 52(1): 307-314. - 程金凤, 蒋宗礼
- 计算机科学. 2025, 52 (1): 307-314. doi:10.11896/jsjkx.231100130
-
摘要 ( 69 )
PDF(1899KB) ( 137 )
- 参考文献 | 相关文章 | 多维度评价
-
随着深度学习技术的发展,开放域对话系统作为人机对话系统的重要分支也得到了快速发展。但目前开放域对话模型生成的回复语句依然存在同理心较差、多样性较低等问题。对此,提出一种融合情感和常识知识的对话生成模型。首先依据情感词典和常识知识图谱获取每个单词对应的常识知识向量,然后将该向量和单词本身的词嵌入向量一同输入编码器中进行编码,接着通过两阶段解码来生成回复语句:第一个解码阶段预测要生成单词的情感强度,并据此获得该单词对应的情感向量,第二阶段解码结合第一阶段编码的结果和已生成单词的词嵌入向量及其对应的常识知识向量作为输入,预测要生成的单词。实验结果表明,该模型生成的回复语句更具同理心和多样性,并且在PPL,BLEU,ACC和DISTINCT等指标上相比基线模型都有一定提升。
-
基于层次化视觉注意力的富语义视频对话生成
赵倩, 郭斌, 刘宇博, 孙卓, 王豪, 陈梦琦. 基于层次化视觉注意力的富语义视频对话生成[J]. 计算机科学, 2025, 52(1): 315-322.
ZHAO Qian, GUO Bin, LIU Yubo, SUN Zhuo, WANG Hao, CHEN Mengqi. Generation of Enrich Semantic Video Dialogue Based on Hierarchical Visual Attention[J]. Computer Science, 2025, 52(1): 315-322. - 赵倩, 郭斌, 刘宇博, 孙卓, 王豪, 陈梦琦
- 计算机科学. 2025, 52 (1): 315-322. doi:10.11896/jsjkx.231100107
-
摘要 ( 76 )
PDF(2442KB) ( 122 )
- 参考文献 | 相关文章 | 多维度评价
-
视频对话是多模态人机交互领域中的重要内容。视频对话中包含大量时空视觉信息和复杂的多模态关系,这给相关研究带来了巨大的挑战。现有的视频对话模型利用跨模态注意力机制或图结构捕捉视频语义和对话上下文之间的相关性,然而,所有视觉信息均是在单一粗粒度下处理的,这导致模型容易忽略一些细粒度时空信息,如同一物体在时间上的持续运动或图像不显著位置的物体信息,从而降低了视频对话性能。同时,细粒度处理全部视觉信息又将增加处理时延,降低视频对话的流畅性。因此,提出了一种层次化视觉注意力的富语义视频对话生成方法。首先根据对话上下文,利用全局视觉注意力捕捉全局视觉语义信息,并定位到对话输入关注的视频时间序列/空间范围,其次利用局部注意力机制进一步捕捉细粒度视觉信息,结合多任务学习方法,生成对话回复。在DSTC7 AVSD数据集上的实验结果表明,相比现有基准方法,所提方法生成的对话具备更高的准确性和多样性,其中METEOR指标提高了23.24%。
-
基于混合模仿学习的多智能体追捕决策方法
王焱宁, 张锋镝, 肖登敏, 孙中奇. 基于混合模仿学习的多智能体追捕决策方法[J]. 计算机科学, 2025, 52(1): 323-330.
WANG Yanning, ZHANG Fengdi, XIAO Dengmin, SUN Zhongqi. Multi-agent Pursuit Decision-making Method Based on Hybrid Imitation Learning[J]. Computer Science, 2025, 52(1): 323-330. - 王焱宁, 张锋镝, 肖登敏, 孙中奇
- 计算机科学. 2025, 52 (1): 323-330. doi:10.11896/jsjkx.240800072
-
摘要 ( 90 )
PDF(4135KB) ( 134 )
- 参考文献 | 相关文章 | 多维度评价
-
针对传统模仿学习方法在处理多样化专家轨迹时的局限性,尤其是难以有效整合质量参差不齐的固定模态专家数据的问题,创新性地融合了多专家轨迹生成对抗模仿学习(Multiple Trajectories Generative Adversarial Imitation Learning,MT-GAIL)方法与时序差分误差行为克隆(Temporal-Difference Error Behavioral Cloning,TD-BC)技术,构建了一种混合模仿学习框架。该框架不仅可以增强模型对复杂多变的专家策略的适应能力,还能够提升模型从低质量数据中提炼有用信息的鲁棒性。框架得到的模型具备直接应用于强化学习的能力,仅需经过细微的调整与优化,即可训练出一个直接可用的、基于专家经验的强化学习模型。在二维动静结合的目标追捕场景中进行了实验验证,该方法展现出良好的性能。结果表明,所提方法可以吸取专家经验,为后续的强化学习训练阶段提供一个起点高、效果佳的初始模型。
-
面向工业动态取送货问题的分解多目标进化算法
蔡俊创, 朱庆灵, 林秋镇, 李坚强, 明仲. 面向工业动态取送货问题的分解多目标进化算法[J]. 计算机科学, 2025, 52(1): 331-344.
CAI Junchuang, ZHU Qingling, LIN Qiuzhen, LI Jianqiang, MING Zhong. Decomposition-based Multi-objective Evolutionary Algorithm for Industrial Dynamic Pickup andDelivery Problems[J]. Computer Science, 2025, 52(1): 331-344. - 蔡俊创, 朱庆灵, 林秋镇, 李坚强, 明仲
- 计算机科学. 2025, 52 (1): 331-344. doi:10.11896/jsjkx.231200132
-
摘要 ( 94 )
PDF(2916KB) ( 136 )
- 参考文献 | 相关文章 | 多维度评价
-
由于工业动态取送货问题具有垛口、时间窗、容量、后进先出装载等多种约束,现有的车辆路径算法大多只优化一个加权目标函数,在求解过程中难以保持解的多样性,所以容易陷入局部最优区域而停止收敛。针对上述问题,提出了一种融合高效局部搜索策略的分解多目标进化算法。首先,该算法将工业动态取送货问题建模成多目标优化问题,进一步将其分解为多个子问题并同时进行求解。然后,利用交叉操作增强解的多样性,再使用局部搜索加快收敛速度。因此,该算法在求解该多目标优化问题时能够更好地平衡解的多样性和收敛性。最后,从种群中选择一个最好的解来完成当前时段的取送货任务。基于64个华为公司实际测试问题的仿真结果表明,该算法在求解工业动态取送货问题上的性能表现最优;同时,在20个京东物流大规模配送问题上的实验也验证了该算法良好的泛化性。
-
计算机视觉领域对抗样本检测综述
张鑫, 张晗, 牛曼宇, 姬莉霞. 计算机视觉领域对抗样本检测综述[J]. 计算机科学, 2025, 52(1): 345-361.
ZHANG Xin, ZHANG Han, NIU Manyu, JI Lixia. Adversarial Sample Detection in Computer Vision:A Survey[J]. Computer Science, 2025, 52(1): 345-361. - 张鑫, 张晗, 牛曼宇, 姬莉霞
- 计算机科学. 2025, 52 (1): 345-361. doi:10.11896/jsjkx.240300080
-
摘要 ( 112 )
PDF(3366KB) ( 133 )
- 参考文献 | 相关文章 | 多维度评价
-
随着数据量的增加和硬件性能的提升,深度学习在计算机视觉领域取得了显著进展。然而,深度学习模型容易受到对抗样本的攻击,导致输出发生显著变化。对抗样本检测作为一种有效的防御手段,可以在不改变模型结构的前提下防止对抗样本对深度学习模型造成影响。首先,对近年来的对抗样本检测研究工作进行了整理,分析了对抗样本检测与训练数据的关系,根据检测方法所使用特征进行分类,系统全面地介绍了计算机视觉领域的对抗样本检测方法;然后,对一些结合跨领域技术的检测方法进行了详细介绍,统计了训练和评估检测方法的实验配置;最后,汇总了一些有望应用于对抗样本检测的技术,并对未来的研究挑战进行展望。
-
图联邦学习:问题、方法与挑战
王鑫, 熊书博, 孙凌云. 图联邦学习:问题、方法与挑战[J]. 计算机科学, 2025, 52(1): 362-373.
WANG Xin, XIONG Shubo, SUN Lingyun. Federated Graph Learning:Problems,Methods and Challenges[J]. Computer Science, 2025, 52(1): 362-373. - 王鑫, 熊书博, 孙凌云
- 计算机科学. 2025, 52 (1): 362-373. doi:10.11896/jsjkx.240500118
-
摘要 ( 99 )
PDF(1667KB) ( 166 )
- 参考文献 | 相关文章 | 多维度评价
-
图作为一种高效、灵活、通用的数据结构,在多个学科领域得到了广泛应用。近年来,基于图的深度学习算法不断涌现,并在社交网络、生物信息学、推荐系统等领域取得显著成效。尽管公开的图数据量在增加,但高质量的数据往往分散在不同的数据所有者手中。随着社会对数据隐私保护要求的提高,现有的图学习算法面临着许多挑战。图联邦学习作为一种有效的解决方案应运而生。文中系统回顾了图联邦学习领域近五年的研究进展,将该领域的核心问题划分为3个部分,并在结构上进行了垂直整合,在关系上进行了递进阐述,包括:1)原始图数据差异导致的结构异构性;2)图联邦特性导致的模型聚合问题;3)模型整体调优方面的挑战。针对每个问题,详细分析了代表性工作及其优缺点,并总结了图联邦学习领域的典型应用和未来挑战。
-
基于概要数据结构的网络微突发流量检测方法
王佳宇, 于俊清, 李冬, 赵君杨. 基于概要数据结构的网络微突发流量检测方法[J]. 计算机科学, 2025, 52(1): 374-382.
WANG Jiayu, YU Junqing, LI Dong, ZHAO Junyang. Network Microburst Traffic Measurement Method Based on Sketch Data Structure[J]. Computer Science, 2025, 52(1): 374-382. - 王佳宇, 于俊清, 李冬, 赵君杨
- 计算机科学. 2025, 52 (1): 374-382. doi:10.11896/jsjkx.231200080
-
摘要 ( 81 )
PDF(2592KB) ( 136 )
- 参考文献 | 相关文章 | 多维度评价
-
网络微突发流量是数据中心网络中常见的流量类型,其在极短的时间内迅速增长,对网络性能造成严重影响,且难以检测。目前的测量方法无法兼顾细粒度检测和低资源开销传输,文中基于概要数据结构(sketch)设计了一种轻量级细粒度的网络微突发流量测量方法。首先基于可编程交换机的架构特性,实时测量数据报文的排队时延,设计检测算法,监测微突发流量,实现基于数据报文的细粒度检测;然后根据检测结果采集微突发流,采用sketch存储微突发流信息,利用镜像传输方式在时间片或微突发流结束后向控制器传送,实现轻量级传输。测量方法基于可编程协议无关报文处理语言,在P4可编程交换机上进行了相应的系统实现,能够实时检测和展示网络微突发流量。实验结果表明该方法能够实时细粒度检测网络微突发流量,显著降低传输微突发信息的带宽开销。
-
基于动态贝叶斯博弈的工业控制网络恶意接入检测研究
刘浩含, 陈泽茂. 基于动态贝叶斯博弈的工业控制网络恶意接入检测研究[J]. 计算机科学, 2025, 52(1): 383-392.
LIU Haohan, CHEN Zemao. Study on Malicious Access Detection in Industrial Control Networks Based on Dynamic BayesianGames[J]. Computer Science, 2025, 52(1): 383-392. - 刘浩含, 陈泽茂
- 计算机科学. 2025, 52 (1): 383-392. doi:10.11896/jsjkx.231200083
-
摘要 ( 84 )
PDF(3017KB) ( 127 )
- 参考文献 | 相关文章 | 多维度评价
-
针对工业控制网络(Industrial Control Network,ICN)远程接入场景下未经授权访问、拒绝服务攻击、欺骗攻击以及信息披露等安全问题,通过STRIDE威胁建模方法对该场景下的潜在威胁进行分析,提出一种基于动态贝叶斯博弈的接入检测框架。该方法能够将试图接入ICN的非法、恶意请求筛选出来并阻断,同时利用持续进行的多轮博弈迭代以及SDN灵活动态的特性对策略参数进行实时调整,以防止相同恶意接入源的再次访问。仿真实验结果表明,随着博弈轮数的增加,相比于现有的两类恶意接入防御方法,该框架的检测准确性提升了3%以上,假阳性比例下降了1.2%以上,检测效率提升了14.7%以上,且具有较好的鲁棒性。
-
抗语义分析的脚本融合技术
田博文, 杨巨, 熊小兵, 段爽, 魏然. 抗语义分析的脚本融合技术[J]. 计算机科学, 2025, 52(1): 393-400.
TIAN Bowen, YANG Ju, XIONG Xiaobing, DUAN Shuang, WEI Ran. Anti-semantic Analysis Script Fusion Technology[J]. Computer Science, 2025, 52(1): 393-400. - 田博文, 杨巨, 熊小兵, 段爽, 魏然
- 计算机科学. 2025, 52 (1): 393-400. doi:10.11896/jsjkx.231100181
-
摘要 ( 71 )
PDF(1988KB) ( 122 )
- 参考文献 | 相关文章 | 多维度评价
-
近年来,脚本程序被广泛应用于计算机领域。脚本程序因其功能强大,执行效率高,相比二进制程序编写更为简单,体积更小,所以在当前网络环境中的使用愈加频繁。目前脚本的混淆技术主要包括编码混淆、结构混淆和加密混淆3种主要类型。然而,现有的脚本混淆方式特征较为明显,存在被反混淆风险,一旦脚本被反混淆,其功能很容易被分析和理解。因此,提出了一种抗语义分析的脚本融合技术,通过将具有普通功能的掩体代码与需要保护的目标代码分块后进行深度融合,融合后的代码同时包含两个脚本的代码,不同脚本之间的语义和逻辑相互交错、相互依赖,使语义分析变得更加困难。对融合后代码的理解和分析需要更加强大的语义推理和上下文理解能力。针对PowerShell脚本的实验表明,融合后脚本程序的控制流循环复杂度平均提升了81.51%,极大提高了代码的混淆强度。该技术能够有效地模糊脚本语义,改变控制流特征,在面对ChatGPT的语义分析中表现出良好的效果,目标代码的核心功能难以被分析理解,从而提高了脚本程序的存活性和持久性。
-
基于身份的密钥隔离的多云多副本可证数据持有方案
周杰, 王化群. 基于身份的密钥隔离的多云多副本可证数据持有方案[J]. 计算机科学, 2025, 52(1): 401-411.
ZHOU Jie, WANG Huaqun. Identity-based Key-insulated Provable Multi-copy Data Possession in Multi-cloud Storage[J]. Computer Science, 2025, 52(1): 401-411. - 周杰, 王化群
- 计算机科学. 2025, 52 (1): 401-411. doi:10.11896/jsjkx.231200081
-
摘要 ( 80 )
PDF(1943KB) ( 118 )
- 参考文献 | 相关文章 | 多维度评价
-
可证数据持有方案(Provable Data Possession,PDP)可以让用户在不下载全部数据的情况下验证其外包数据是否完好无损。为了提高外包数据的可用性和安全性,许多用户将数据的多个副本存储在单云服务器上,但是单云服务器在发生故障或者其他意外情况时,用户存储的数据副本也会遭到破坏因而无法恢复原始数据。同时,许多可证数据持有方案依赖于公钥基础设施(Public Key Infrastructure,PKI)技术,存在密钥管理问题。此外,现有的可证数据持有方案大多是在用户端使用密钥对数据进行处理。由于用户端的安全意识较弱或者安全设置较低,密钥可能会有泄露的风险。恶意云一旦获得了用户端的密钥,就可以通过伪造虚假的数据持有证明来隐藏数据丢失的事件。基于上述问题,提出了一种基于身份的密钥隔离的多云多副本可证数据持有方案(Identity-Based Key-Insulated Provable Multi-Copy Data Possession in Multi-Cloud Storage,IDKIMC-PDP)。基于身份的可证数据持有方案消除了公钥基础设施技术中复杂的证书管理。多云多副本确保了即使在某个云服务器上的副本被篡改或者被破坏的情况下,用户仍然可以从其他云服务器上获取副本并恢复数据。同时,方案中使用了密钥隔离技术实现了前向和后向安全。即使某一时间段内的密钥泄露,其他时间段内云存储审计的安全性也不会受到影响。给出了该方案的正式定义、系统模型和安全模型;在标准困难问题下,给出了该方案的安全性证明。安全性分析表明,IDKIMC-PDP方案具有强抗密钥泄露性、可检测性以及数据块标签和证明的不可伪造性。实验结果表明,与现有的多云多副本相关方案相比,IDKIMC-PDP方案具有相对较高的效率。
-
基于SE注意力多源域对抗网络的射频指纹识别
苏超然, 张大龙, 黄勇, 董安. 基于SE注意力多源域对抗网络的射频指纹识别[J]. 计算机科学, 2025, 52(1): 412-419.
SU Chaoran, ZHANG Dalong, HUANG Yong, DONG An. RF Fingerprint Recognition Based on SE Attention Multi-source Domain Adversarial Network[J]. Computer Science, 2025, 52(1): 412-419. - 苏超然, 张大龙, 黄勇, 董安
- 计算机科学. 2025, 52 (1): 412-419. doi:10.11896/jsjkx.231100076
-
摘要 ( 96 )
PDF(2228KB) ( 155 )
- 参考文献 | 相关文章 | 多维度评价
-
射频指纹利用射频前端的硬件特征作为标识符对设备进行识别。针对现有射频指纹识别研究忽略接收机硬件特性的干扰,导致模型在不同接收机设备上泛化性较差的问题,提出一种基于SE(Squeeze-and-Excitation)注意力多源域对抗网络的射频指纹识别方法。该方法采用多个源域有标签数据和少量目标域无标签数据进行对抗训练以提取与接收机域无关的特征;融合SE注意力机制增强模型对发送机射频指纹特征的学习能力;结合极少量目标域有标签数据对模型参数进行微调,进一步提高发送机识别性能。在Wisig公开数据集上的实验结果表明:该方法在跨接收机场景下可有效识别发送机设备,平均准确率可达83.1%;加入少量有标签数据微调后平均准确率可进一步提高至93.1%。