栏目文章

Select

1. 图扩散模型方法与应用研究综述

赵海华, 唐瑞, 莫先

计算机科学 2026, 53 (3): 115-128. DOI: 10.11896/jsjkx.250200118

摘要（259）

PDF（pc）（3305KB）（214）

图扩散模型作为新兴的深度生成范式,凭借其渐进式生成机制和结构灵活等优势,在复杂图结构数据建模领域展现出了显著优势。为此,系统综述了图扩散模型的方法演进及其应用进展。首先,从生成机理层面解析了去噪扩散概率模型、基于分数的扩散生成模型和基于随机微分方程的扩散模型三大核心范式。其次,针对图数据的高维离散与非欧特性,对3种基本扩散模型在图数据上的创新性技术突破进行分类总结及深入分析。在此基础上,系统性总结和分析了图扩散模型的评价体系。在应用研究层面,重点探讨了图扩散模型在推荐系统和分子建模领域的应用研究。最后,基于以上论述,分别从图数据的离散性、图扩散模型的条件生成、应用的扩展以及评价体系4个方面对图扩散模型的未来发展的挑战和潜在研究方向进行展望。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于二次学习的行为克隆优化方法

范文殊, 万盛华, 李新春, 孙海航, 黄楷宸, 甘乐, 詹德川

计算机科学 2026, 53 (3): 129-135. DOI: 10.11896/jsjkx.250600131

摘要（60）

PDF（pc）（3076KB）（184）

在行为克隆这一模仿学习方法中,智能体遇到专家数据中不包含的状态会随机采取行动,导致与专家策略产生偏移。这种现象被称为复合误差,是影响行为克隆性能的重要因素。为解决这一问题,首先说明行为克隆本质是二次学习的简易形式,接着指出在离散动作环境下,行为克隆只关注对齐专家策略采取的动作,忽视其他动作概率信息,对专家信息的提取不够完全。通过类比二次学习,提出能够提取专家数据中更多信息的完全行为克隆方法,并设计了多组对比实验,说明完全行为克隆不仅能缓解行为克隆的复合误差,还具备设备可迁移性高、抗噪能力强、专家数据依赖少等优点。实验结果表明,行为克隆仅需少量改进即可极具实用性,并且保持运行简便。此外,结果也进一步验证了二次学习在强化学习问题中的指导作用和有效性。

参考文献 | 相关文章 | 多维度评价

Select

3. 大模型指令微调的数据压缩:基于推理贡献度的精化

李昊, 丁立中, 傅稼润, 令狐赵桓

计算机科学 2026, 53 (3): 136-142. DOI: 10.11896/jsjkx.250600087

摘要（61）

PDF（pc）（2335KB）（169）

基于推理数据的大模型指令微调,通过显式建模复杂任务的多步逻辑关联,显著提升模型的推理准确性,然而微调过程依赖海量高质量数据,导致算力开销急剧攀升。已有数据压缩技术主要聚焦于原始规模缩减,普遍缺乏针对推理数据的压缩方法设计,忽视了推理数据中的多步逻辑关联、语义依存关系等,致使关键推理链完整性受损,进而降低了推理性能。为此,提出基于推理贡献度的精化(Refinement Based on Inference Contribution,RBIC)。通过分析推理数据的语义相似性构建知识领域图谱,精准定位核心信息。将数据样本的语义与大模型的推理准确率相结合,划分难度梯度,覆盖全场景推理需求。通过多步推理数据的逻辑复杂度量化推理贡献度,精化对模型推理贡献度最高的数据样本。实验结果表明,基于RBIC精化的推理数据进行微调后,模型平均推理性能仅下降1.13%,而训练时间缩短为原耗时的 16%,验证了RBIC在模型效能与资源消耗间实现了最优平衡,有望推动多领域大模型在资源受限环境下的高效部署与微调优化。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于贝叶斯网的故障根因分析

刘华帅, 陶厚国, 岳昆, 段亮

计算机科学 2026, 53 (3): 143-150. DOI: 10.11896/jsjkx.241200100

摘要（64）

PDF（pc）（2134KB）（171）

故障根因分析旨在找到导致特定问题、故障或事件发生的原因,是多个领域中追踪溯源的重要支撑技术,但现有方法在效率、准确性和稳定性等方面仍不能满足故障根因分析任务的实际需求。对此,将贝叶斯网作为相关属性之间依赖关系表示和推理的知识框架,提出基于贝叶斯网的故障根因分析方法。首先,针对高维数据和稀疏样本带来的挑战,提出基于向量量化自编码器的高维属性约简算法,并给出α-BIC评分准则,高效地学习根因贝叶斯网(Root Cause Bayesian Network,RCBN)。随后,基于贝叶斯网嵌入技术实现RCBN的高效推理,高效计算各原因条件下故障产生的可能性,进而使用因果模型中的Blame机制度量各原因对给定故障的贡献度,从而实现故障根因分析。在3个公共数据集和3个合成数据集上的实验结果表明,所提方法的平均检测准确性和效率明显优于对比方法,在CHILD数据集上精度提升了7%,运行时间快了60%。

参考文献 | 相关文章 | 多维度评价

Select

5. 针对多标记表格数据的半监督学习方法

葛泽庆, 黄圣君

计算机科学 2026, 53 (3): 151-157. DOI: 10.11896/jsjkx.250600149

摘要（54）

PDF（pc）（2060KB）（168）

表格数据在医学、金融和制造业等领域具有广泛应用,其多标记分类任务对揭示现实世界中复杂的关联特性至关重要。然而,获取大规模标记数据集往往成本高昂,这给研究带来了挑战。虽然半监督学习利用未标记样本在图像和文本数据中取得了成功,但由于表格数据缺乏固有的空间或语义结构,使得传统方法效率较低。为了应对这些挑战,提出了一种针对多标记表格数据的半监督学习框架。该方法引入了一种结构保留的数据增强方法,在特征表示空间内添加高斯噪声保留原始数据结构,与基于一致性的正则化技术,在样本及其扰动版本之间进行正则化,以增强泛化能力。此外,还开发了一种基于注意力机制的机制,有选择地从标记数据中聚合邻域信息,从而使模型能够有效地利用局部特征相关性。在10个公共多标记表格数据集上进行了广泛的实验,结果证明了该方法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于指示词表征学习的半监督聚类方法

王一鸣, 焦敏, 赵素云, 陈红, 李翠平

计算机科学 2026, 53 (3): 158-165. DOI: 10.11896/jsjkx.250600063

摘要（61）

PDF（pc）（2371KB）（190）

当前聚类方法通过联合学习聚类友好的表征空间和聚类分配来提高性能,局限于视觉编码器产生的固定表征空间,并基于特征空间内的欧氏距离或余弦相似度的度量体系进行聚类分配。受扩散模型在稳定训练特性与指示词表征的条件控制能力的启发,在方法上,通过将类簇中心编码为可学习的条件嵌入向量,构建噪声预测误差驱动的生成式度量函数,突破传统欧氏空间线性可分性限制,并设计监督预训练与无监督调整两阶段动态优化策略,利用语义锚定和匹配损失协同平衡类内紧致性与类间可分性;在理论上,基于拉德马赫复杂度与噪声预测有界性假设,推导出聚类期望风险上界为$\mathcal{O}$(k／n),证明方法在大规模数据下的渐进一致性,保证所提出方法的泛化能力,同时,揭示监督信息通过强凸性约束和去噪网络Lipschitz连续性可将误差主项衰减速率提升至$\mathcal{O}$(1＼/nm_c),阐明标注量对假设空间的压缩效应;在实验上,所提方法在ImageNet-10等基准数据集上表现出竞争性结果,消融实验为该方法提供了实证支撑。

参考文献 | 相关文章 | 多维度评价

Select

7. 面向有向图的k-plex稠密子图挖掘算法

侯景乐, 李振军, 代强强, 李荣华, 王国仁

计算机科学 2026, 53 (3): 166-172. DOI: 10.11896/jsjkx.250400086

摘要（64）

PDF（pc）（1795KB）（169）

有向图的有向边可以表示关系的指向或数据的传递,在稠密子图挖掘中引入并拓展一些无向图的经典稠密子图模型对图挖掘工作有着重要帮助。为此,结合有向图的特点与k-plex的定义,称有向图中任意一个顶点的非出边邻居和非入边邻居均不超过k的子图结构为有向k-plex。已有工作给出了在无向图中枚举极大k-plex的输出敏感算法,然而它们无法直接应用于有向图。为了解决这一问题,提出了一种基于图分解的递归枚举算法。为了更进一步优化运行效率,引入了基于支撑点的剪枝策略,还提供了基于有向k-plex上界的优化算法来终止一些无效的搜索分支。在真实图数据上进行实验,结果表明,图分解算法与剪枝优化均取得了良好的效果,所提算法在处理真实图数据时具有很强的实用性,能在2 h内完成对KONECT数据集中数百组真实世界有向图的处理。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于机械遗忘的部分域自适应

吴嘉豪, 彭力, 杨杰龙

计算机科学 2026, 53 (3): 173-180. DOI: 10.11896/jsjkx.250200111

摘要（64）

PDF（pc）（2467KB）（170）

域适应将知识从标签丰富的源领域转移到标签稀缺的目标领域,在减少目标领域数据标注需求的情况下,实现模型性能在目标领域的提升。作为一种更现实的扩展,部分域自适应放宽了源领域和目标领域完全共享标签空间的假设,并处理目标标签空间是源标签空间子集的情况。所提出的机械遗忘方法,通过遗忘异常权重类别来帮助解决具有挑战性的部分域自适应问题。具体而言,该方法首先采用传统部分域适应方法作为初始化模型,同时通过类别权重机制识别出异常权重类别;然后根据异常权重类别筛选源域数据集并生成噪声样本数据集,进而对模型进行遗忘操作,解决源域和目标域标签空间不匹配的问题;最后利用伪标签技术,让模型进一步对齐目标域的特征分布,从而促进正迁移。在Office-31和Office-Home这两个公开的基准数据集上进行的大量实验表明,所提出的机械遗忘方法在与最新的部分域自适应方法的性能相近的同时,显著超过了传统的部分域适应方法。

参考文献 | 相关文章 | 多维度评价

Select

9. 类型引导边匹配的异质图相似度学习方法

桑士龙, 陈可佳,

计算机科学 2026, 53 (3): 181-187. DOI: 10.11896/jsjkx.250300002

摘要（54）

PDF（pc）（2857KB）（172）

图相似度学习是通过学习图的结构特征来匹配图之间相似程度的方法。目前,基于图神经网络的图相似度学习方法仍局限于节点级或图级的匹配范式,忽视了边级表示及其对图结构匹配的贡献。此外,现实图中的边通常具有不同类型,代表节点间不同的语义关系,可用于引导跨图交互。因此,提出了一种类型引导边匹配的异质图相似度学习方法(TEM-HGSL),首先设计基于线图的异质图同构网络以更好地学习边的嵌入,然后通过类型对齐的边匹配机制以更好地利用边的语义信息,最终实现边-图双层级的图相似度计算。在4个异质图据集上的实验结果表明,TEM-HGSL方法计算的均方误差比最优基线平均降低了25.65%,能有效实现细粒度相似度计算。

参考文献 | 相关文章 | 多维度评价

Select

10. 基于KAN的双通道图神经网络

王静红, 李鹏超, 王熙照, 张自立

计算机科学 2026, 53 (3): 188-196. DOI: 10.11896/jsjkx.250600067

摘要（76）

PDF（pc）（4107KB）（208）

图神经网络(GNNs)是一种专门针对图数据的神经网络模型,近年来被成功应用在各种图学习任务上,如节点分类、链路预测等。然而,目前的图神经网络模型大多基于消息传递范式,无法充分捕捉节点的结构信息与特征信息之间的多维关联关系。此外,传统激活函数容易导致信息丢失和模型解释性不足的问题。为此,提出了一种基于Kolmogorov-Arnold网络(KAN)的双通道图神经网络(KDCGNN)。KDCGNN利用结构卷积和特征卷积,从两个通道分别提取图的结构信息和特征信息,生成节点的结构编码和特征编码,拼接融合后,进一步借助KAN对嵌入表示进行特征转换,提升分类性能和模型的可解释性。同时,引入一致性损失函数,鼓励结构编码和特征编码之间的分布一致性,从而增强模型的泛化能力。在3个经典引文网络数据集(Cora,Citeseer,Pubmed)上的实验表明,KDCGNN在节点分类任务中的表现优于现有基准方法。KDCGNN的提出为图神经网络的可解释性与性能优化提供了新思路。

参考文献 | 相关文章 | 多维度评价

Select

11. 基于多专家协同和信息交互的社会化学习

李林昊, 许亚楠, 董永峰, 王振

计算机科学 2026, 53 (3): 197-206. DOI: 10.11896/jsjkx.250100068

摘要（51）

PDF（pc）（3184KB）（179）

在分布式环境中,数据异质性表现为数据特征差异。专家模型协同存在知识孤立与任务分配不合理的问题,导致专家训练效果参差不齐,难以充分发挥各模型优势,使得整体性能受限。针对这些问题,提出了一种基于多专家协同和信息交互的社会化学习框架(Social Learning Based on Multi-expert Collaboration and Information Interaction,MECII)。该框架结合混合专家模型和社会化学习思想,通过多专家协同、门控网络、自适应信息交互和门控选择约束这四大模块,优化了专家间的知识共享与互补机制,有效解决了分布式学习中的数据异质性和专家协同问题。MECII通过精准的专家选择与任务分配,促进了专家之间的信息流动,使每个专家在处理特定数据时的准确率得到提升,增强了整体模型性能。实验结果表明,MECII在CIFAR-10和CIFAR-100数据集上相比传统的联邦学习基准方法有显著的性能提升,特别是在数据异质性场景下,与先进的FedL2P方法相比,MECII将分类准确率分别提高了6.69个百分点和5.13个百分点,且有效优化了每个专家的准确率。实验结果验证了MECII在促进专家协作和提升个体精度方面具有显著优势。

参考文献 | 相关文章 | 多维度评价

Select

12. 图正则化模糊自动编码器的重叠社区检测

邹晓阳, 鞠恒荣, 曹金鑫, 马星如, 黄嘉爽, 丁卫平

计算机科学 2026, 53 (3): 207-213. DOI: 10.11896/jsjkx.250100093

摘要（57）

PDF（pc）（3594KB）（184）

在复杂网络分析中,挖掘社区结构是一个重要且具有挑战性的研究方向。现有的基于深度学习方法在图相关任务中取得了不错的效果,但鲜有处理社区检测任务,尤其是重叠社区检测,并且也未能充分挖掘和利用网络的拓扑结构信息。为此,提出了一种图正则化模糊自动编码器的重叠社区检测方法(Overlapping Community Detection with Graph Regularized Fuzzy AutoEncoder,FAE)。首先,运用自动编码器将网络拓扑编码为低维表示,进一步通过模糊C均值聚类形成模糊隶属度矩阵,随后解码模糊隶属度矩阵以重构网络拓扑。然后,将用于刻画网络中结构信息的图正则融入上述自动编码器。再者,融合后的自动编码器构成堆叠自动编码器,以获取深度模糊隶属度矩阵。最后,基于模糊集理论,使用深度模糊隶属度矩阵划分重叠社区。在3组人工网络和6个真实网络上的实验结果表明,该方法基于重叠标准互信息熵(ONMI)、杰卡德指数(Jaccard)、F1分数(F1-Score)的评估性能优于7种经典算法的大部分算法,展示了其在处理复杂网络重叠社区检测问题上的潜力。

参考文献 | 相关文章 | 多维度评价