栏目文章

Select

1. 基于预训练语言模型的知识图谱研究综述

曾泽凡, 胡星辰, 成清, 司悦航, 刘忠

计算机科学 2025, 52 (1): 1-33. DOI: 10.11896/jsjkx.240100109

摘要（368）

PDF（pc）（4162KB）（539）

大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已经成为了知识图谱研究的主要手段。系统梳理了基于预训练语言模型的知识图谱研究的相关工作,包括知识图谱构建、表示学习、推理、问答等,介绍了相关模型和方法的核心思路,并依据技术路径建立了分类体系,对不同类型方法的优缺点进行了对比分析。此外,对预训练语言模型在事件知识图谱和多模态知识图谱这两种新型知识图谱中的应用现状进行了综述。最后,总结了当前基于预训练语言模型的知识图谱研究面临的挑战,展望了未来的研究方向。

参考文献 | 相关文章 | 多维度评价

Select

2. 大模型红队测试研究综述

包泽芃, 钱铁云

计算机科学 2025, 52 (1): 34-41. DOI: 10.11896/jsjkx.240400190

摘要（236）

PDF（pc）（1675KB）（357）

大模型红队测试(Large Model Red Teaming)旨在让大语言模型(Large Language Model,LLM)接收对抗测试,从而诱使模型输出有害的测试用例,进而发现模型中的漏洞并提高其鲁棒性。大模型红队测试是大模型领域的前沿课题,近年来受到学术界和工业界的广泛关注。研究者们针对大模型红队测试提出了众多解决方案,并在模型对齐上取得了一定进展。然而,受限于大模型红队数据的短缺和评价标准的模糊,现有研究大多局限于针对特定的场景进行评估。文中首先从与大模型安全相关的定义出发,对其所涉及的各种风险进行阐述;其次,针对大模型红队测试的重要性及其主要类别进行了阐述,综述和分析了相关红队技术的发展历程,并介绍了已有的数据集和评价指标;最后,对大模型红队测试的未来发展趋势进行了展望和总结。

参考文献 | 相关文章 | 多维度评价

Select

3. 面向联邦大语言模型训练的传输优化技术综述

顿婧博, 李卓

计算机科学 2025, 52 (1): 42-55. DOI: 10.11896/jsjkx.240500095

摘要（176）

PDF（pc）（1768KB）（872）

随着人工智能技术的快速发展,各类大型语言模型不断涌现。但是专用大语言模型的用户及数据集大多具有隐私性和安全性要求,数据安全隐私问题亟待解决。在此背景下,联邦大语言模型应运而生并得到越来越多的关注。由于大型语言模型庞大的数据量以及联邦学习的分布式架构,海量的参与节点与云服务器间进行大量的模型交换会产生较高的通信成本。为提升模型收敛速率,研究人员对面向联邦大语言模型训练的传输优化技术展开了研究。文章分析了联邦大语言模型所面临的挑战;综述了基于模型微调的传输优化方法、基于模型压缩的传输优化方法以及基于分布式并行处理的传输优化的优化问题;介绍了已有的开源联邦大语言模型以及所用到的传输优化技术,并对未来研究方向进行了展望。

参考文献 | 相关文章 | 多维度评价

Select

4. 提示学习中思维链生成和增强方法综述

郑明琪, 陈晓慧, 刘冰, 张兵, 张然

计算机科学 2025, 52 (1): 56-64. DOI: 10.11896/jsjkx.240700172

摘要（222）

PDF（pc）（1968KB）（296）

大语言模型凭借其卓越的语言理解和文本生成能力,在多个领域取得了突破性进展。尽管如此,其在处理复杂推理任务时的表现往往不尽如人意,准确率的提升空间依然巨大。针对这一挑战,学术界提出了思维链策略,这是一种创新的方法,通过让模型生成推理过程来增强模型的推理性能。文中通过全面梳理和深入分析现有的思维链研究,不仅总结了其核心概念和结构框架,还详细探讨了推理生成方法和增强方法。进一步对思维链在不同任务场景中的应用进行了广泛探讨,展示了思维链在提升模型性能方面的潜力。同时,也对思维链的局限性进行了批判性分析,指出了思维链方法存在的不足。最后,对思维链的未来发展进行了前瞻性展望,旨在为思维链未来的研究方向提供指导,并为该领域的研究者提供有价值的参考和启示。

参考文献 | 相关文章 | 多维度评价

Select

5. 大模型驱动多智能体的军事需求生成框架

李嘉晖, 张萌萌, 陈洪辉

计算机科学 2025, 52 (1): 65-71. DOI: 10.11896/jsjkx.240800022

摘要（198）

PDF（pc）（2543KB）（300）

联合作战军事需求生成涉及的参与人员多、工作量庞大,生成过程大多依赖个体经验与多来源文档,存在需求生成效率较低等问题,难以有效支撑联合作战体系设计。随着大模型技术的发展,大模型驱动的智能体在诸多领域展现出卓越的性能,多智能体系统通过分布式决策实现群体智能,能够高效处理复杂任务。针对军事需求生成过程中存在的效率低下的问题,提出大模型驱动多智能体的军事需求生成框架。该框架整合了多模态信息获取智能体、军事专家智能体、会议主持人等要素。多模态信息获取智能体集成多模态信息处理工具,能够快速获取军事需求,并与用户进行问答交互;军事专家智能体以自然语言对话的形式模拟人类专家讨论生成需求的场景,大模型驱动军事专家智能体理解环境,并能自主调用开源论文库、搜索引擎等工具以支持对话;会议主持人接收人类用户的指令,利用大模型细化指令内容,生成对话提示词和问题背景描述。以俄乌冲突为实验背景,对相关多模态信息进行军事需求生成。实验结果表明,当多模态信息量在大模型最大处理容量以内时,该框架显著降低了军事需求生成的时间消耗,视频资源节省时间占比达到80%～85%,音频资源节省时间占比为90%～95%。

参考文献 | 相关文章 | 多维度评价

Select

6. SWARM-LLM:基于大语言模型的无人集群任务规划系统

李婷婷, 王琪, 王嘉康, 徐勇军

计算机科学 2025, 52 (1): 72-79. DOI: 10.11896/jsjkx.241000038

摘要（270）

PDF（pc）（4114KB）（351）

针对无人集群系统自主智能性不足、异构无人集群协同效率低、任务分配不均衡等问题,文中面向无人集群自主规划、高效协作、智能决策的需求,首先提出了一种新的基于大语言模型的无人集群任务规划系统框架(SWARM-LLM)。该框架利用大语言模型将高层次的任务指令转化为具体的智能无人集群任务规划方案,通过任务分解、任务分配、任务执行等多个阶段来实现无人集群协同任务。进一步地,设计了一套适用于无人集群规划的提示工程方法-规划链(Planning Chain,PC),用来指导和优化上述各阶段的实施。最终,在无人集群仿真环境(AirSim)中构建了不同类别和复杂度的任务,并进行了评估实验。与其他基于优化算法和机器学习的算法相比,实验结果证明了SWARM-LLM框架的有效性,并在任务成功率上展现出了显著的优势,平均性能提升了47.8%。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于预训练大模型的行动方案生成方法

颜玉松, 周圆, 王琮, 孔圣麒, 王权, 黎敏讷, 王之元

计算机科学 2025, 52 (1): 80-86. DOI: 10.11896/jsjkx.240900075

摘要（208）

PDF（pc）（3048KB）（309）

围绕生成式人工智能赋能指挥决策需求,分析了指挥决策中方案生成问题的难点挑战和新兴预训练大语言模型技术的应用前景,提出了一种基于预训练大模型的作战行动方案生成方法——COA-Gen。首先,为了使生成的行动方案符合目标,设计了多轮方案生成框架;其次,构建了多要素中文提示词模板用于整合海量多源信息;最后,针对特定小领域的数据缺乏问题,引入知识增强技术以提升大模型规划效能。为了验证所提行动方案的效果,制定了基于《星际争霸II》游戏引擎和“虎爪”想定的方案验证环境。实验结果表明,该方法具有较好的鲁棒性,可以较好地依从指挥员意图,验证了大模型用于作战行动方案生成的可行性。此外,不同预训练大模型在相同任务中展现出不同的效果,表明在实际应用中选择不同的预训练大模型可能会生成具有不同风格的行动方案,从而影响最终的行动结果。

参考文献 | 相关文章 | 多维度评价

Select

8. 一种基于知识图谱的检索增强生成情报问答技术

成志宇, 陈星霖, 王菁, 周中元, 张志政

计算机科学 2025, 52 (1): 87-93. DOI: 10.11896/jsjkx.240900064

摘要（142）

PDF（pc）（2296KB）（254）

为实现军事情报问答,提出了一种基于知识图谱的检索增强生成框架。该框架通过问题分类、实体识别、实体链接、知识检索有效地获取了背景知识。同时考虑到情报问题多约束的特点,使用回答集编程在知识上通过约束限制减少知识数量或者直接获得答案。最后,使用大语言模型在精炼后的知识上对问题进行求解,以减少问题理解过程中的属性识别与链接。在MilRE数据集上的实验表明,所提框架能够提供基于知识图谱的增强知识检索功能,并具有较好的军事情报问题解答能力。

参考文献 | 相关文章 | 多维度评价

Select

9. 大语言模型驱动的多元关系知识图谱补全方法

刘畅成, 桑磊, 李炜, 张以文

计算机科学 2025, 52 (1): 94-101. DOI: 10.11896/jsjkx.240600170

摘要（169）

PDF（pc）（2370KB）（294）

知识图谱通过将复杂的互联网信息转化为易于理解的结构化形式,极大地提高了信息的可访问性。知识图谱补全技术进一步增强了知识图谱的信息完整性,显著提升了智能问答和推荐系统等通用领域应用的性能与用户体验。然而,现有的知识图谱补全方法大多专注于关系类型较少和简单语义情景下的三元组实例,未能充分利用知识图谱在处理多元关系和复杂语义方面的潜力。针对此问题,提出了一种由大语言模型(LLM)驱动的多元关系知识图谱补全方法。将 LLM 的深层语言理解能力与知识图谱的结构特性相结合,有效捕捉多元关系,理解复杂语义情景。此外,还引入了一种基于思维链的提示工程策略,旨在提高补全任务的准确性。该方法在两个公开知识图谱数据集上的实验结果都取得了显著的提升。

参考文献 | 相关文章 | 多维度评价