计算机科学

第50卷第3期目录

计算机科学. 2023, 50 (3): 0-0.

摘要 ( 329 )

PDF(271KB) ( 697 )

相关文章 | 多维度评价

SS-GCN:情感增强和句法增强的方面级情感分析模型

李帅, 徐彬, 韩祎珂, 廖同鑫

计算机科学. 2023, 50 (3): 3-11. doi:10.11896/jsjkx.220700238

摘要 ( 1503 )

PDF(3238KB) ( 1489 )

参考文献 | 相关文章 | 多维度评价

方面级情感分析(Aspect-Based Sentiment Analysis,ABSA)作为知识图谱下游应用,属于细粒度情感分析任务,旨在理解人们对评价目标在方面层次的情感极性。近年来,相关研究已经取得显著进步,但现有方法侧重于利用句子内的顺序性或句法依赖约束,而没有充分利用上下文词与方面词之间的依赖类型。此外,现有的基于图卷积神经网络模型对节点特征保留的能力不足。针对该问题,首先,在句法依赖树的基础上,充分挖掘上下文词与方面词之间的依赖类型,将其融入依赖图的构建;其次,定义了一个“敏感关系集合”,利用它来构建辅助句以增强特定上下文词与方面词之间的关联性,同时结合情感知识网络SenticNet以增强句子的依赖图,进而改进图神经网络的构建;最后,引入上下文保留机制,来减小节点特征在多层图卷积神经网络中的信息损失。提出的SS-GCN模型将并行学习到的句法表示和上下文表示进行融合以完成情感增强和句法增强。在3个公开数据集上进行了广泛的实验,证明了SS-GCN的有效性。

基于动态记忆和双层重构强化的知识图谱至文本转译模型

马廷淮, 孙圣杰, 荣欢, 钱敏峰

计算机科学. 2023, 50 (3): 12-22. doi:10.11896/jsjkx.220700111

摘要 ( 1116 )

PDF(4618KB) ( 1134 )

参考文献 | 相关文章 | 多维度评价

知识图谱转译文本(Graph-to-Text)是知识图谱领域中一个新的任务,旨在将知识图谱转化为描述该知识的可读性文本。随着近年来研究的不断深入,知识图谱转译文本的生成技术已经被应用于商品评论生成、推荐解释生成、论文摘要生成等领域。现有方法中的转译模型均采用先规划后实现的方式,未能根据已生成文本动态调整规划且未按静态内容规划对知识进行跟踪,导致文本前后语义不连贯。为了提高生成文本语义的连贯性,文中提出了基于动态记忆和双层重构强化的知识图谱至文本转译模型,通过静态内容规划、动态内容规划和双层重构机制这3个阶段,弥补了知识图谱与文本之间的结构化差异,在生成文本的同时侧重关注各三元组中的重要内容。与现有的生成模型相比,该模型不仅能缓解知识图谱与文本之间的结构化差异,还提高了定位关键实体的能力,从而使生成的文本具有更强的事实一致性和语义连贯性。在WebNLG数据集上进行了广泛实验,结果表明,在知识图谱转译文本的任务上,所提模型与现有模型相比,内容规划更加准确,生成文本语句间的逻辑合理且关联性更强,在BLEU,METEOR,ROUGE,CHRF++等指标上优于现有模型。

基于关系约束的上下文感知时态知识图谱补全

汪璟玢, 赖晓连, 林新宇, 杨心逸

计算机科学. 2023, 50 (3): 23-33. doi:10.11896/jsjkx.220400255

摘要 ( 911 )

PDF(3229KB) ( 1152 )

参考文献 | 相关文章 | 多维度评价

现有的时间知识图谱补全模型仅考虑四元组自身的结构信息,忽略了实体隐含的邻居信息和关系对实体的约束,导致模型在时态知识图谱补全任务上表现不佳。此外,一些数据集在时间上呈现不均衡的分布,导致模型训练难以达到一个较好的平衡点。针对这些问题,提出了一个基于关系约束的上下文感知模型(CARC)。CARC通过自适应时间粒度聚合模块来解决数据集在时间上分布不均衡的问题,并使用邻居聚合器将上下文信息集成到实体嵌入中,以增强实体的嵌入表示。此外,设计了四元组关系约束模块,使具有相同关系约束的实体嵌入彼此相近,不同关系约束的实体嵌入彼此远离,以进一步增强实体的嵌入表示。在多个公开的时间数据集上进行了大量实验,实验结果证明了所提模型的优越性。

基于图神经网络的多信息优化实体对齐模型

陈富强, 寇嘉敏, 苏利敏, 李克

计算机科学. 2023, 50 (3): 34-41. doi:10.11896/jsjkx.220700242

摘要 ( 1107 )

PDF(2351KB) ( 1076 )

参考文献 | 相关文章 | 多维度评价

实体对齐是知识融合中的一个关键步骤,旨在发现知识图谱间存在对应关系的实体对。知识图谱融合后可以为下游提供更加广泛而准确的服务。现有的实体对齐模型对实体名称和关系的利用往往不足,在得到实体的向量表示后通过单一的迭代策略或者直接计算得出实体的对齐关系,忽略了部分有用信息,导致实体对齐的结果欠佳。针对上述问题,提出了一种基于图神经网络的多信息优化实体对齐模型。首先,模型的输入融合了实体名称中的单词信息和字符信息,通过注意力机制学习关系的向量表示并利用关系传递信息。在利用实体和关系的预对齐结果修正实体对齐矩阵的基础上,使用延迟接受算法修正部分错误对齐的结果。所提模型在DBP15K的3个子数据集上进行了对比和消融实验。结果表明,相比基线模型,其Hits@1指标分别提高了4.47%,0.82%和0.46%,Hits@10和MRR指标也取得了良好的结果。通过消融实验进一步验证了所提模型的有效性,总体上可以获得更加准确的实体对齐结果。

BGPNRE:一种基于BERT的全局指针网络实体关系联合抽取方法

邓亮, 齐攀虎, 刘振龙, 李敬鑫, 唐积强

计算机科学. 2023, 50 (3): 42-48. doi:10.11896/jsjkx.220600239

摘要 ( 1107 )

PDF(2098KB) ( 1147 )

参考文献 | 相关文章 | 多维度评价

实体-关系联合抽取指从非结构化文本中联合抽取出实体-关系三元组,是信息抽取和知识图谱构建的一项关键任务。文中提出了一种新的基于全局指针网络实体关系联合抽取方法BGPNRE(BERT-based Global Pointer Network for Named Entity-Relation Joint Extraction),首先通过潜在关系预测模块预测文本中蕴含的关系,过滤掉不可能存在的关系,将实体抽取限制在预测的关系子集中;其次通过使用基于关系的全局指针网络,获取所有主客体实体的位置;最后通过全局指针网络通信模块,将主客体位置高效率地解码对齐成一个实体关系三元组。该方法避免了传统管道式方法存在的错误传播问题,同时也解决了关系冗余、实体重叠、Span提取泛化不足等问题。实验结果表明,所提方法在多关系和重叠实体抽取上表现卓越,并且在NYT和WebNLG公共数据集上达到了最先进的水平。

基于高阶和时序特征的图神经网络社会化推荐算法研究

于健, 赵满坤, 高洁, 王聪源, 李亚蓉, 张文彬

计算机科学. 2023, 50 (3): 49-64. doi:10.11896/jsjkx.220700108

摘要 ( 912 )

PDF(4274KB) ( 1015 )

参考文献 | 相关文章 | 多维度评价

跨项目社会推荐是一种将社交关系整合到推荐系统中的方法。社会化推荐中包含用户-项目交互图和社交网络图,用户是连接这两个图的桥梁,其表示学习对提升社会化推荐的性能至关重要。然而,现有方法主要使用用户或项目的静态属性和社交网络中的显式朋友关系来进行表示学习,用户和项目交互的时序信息及隐式朋友关系未得到充分利用。因此,在社会化推荐中,如何有效利用时序信息和社交信息成为重要的研究课题之一。文中通过建模用户的隐式朋友和项目的社交属性,提出了一种新颖的基于高阶和时序特征的图神经网络社会化推荐算法(Graph Neural Networks Social Recommendation Based on High-order and Temporal Features)模型,简称HTGSR。HTGSR首先利用门控递归单元对基于项目的用户表征进行建模,以反映用户的近期动态偏好,并定义一个高阶建模单元来提取用户的高阶连通特征,挖掘用户的隐式朋友信息;其次利用注意力机制获取基于社交关系的用户表征;然后提出不同的项目社交网络的构建方式,并利用注意力机制来获取项目表征;最后将用户和项目的潜在表征输入到多层感知机,完成用户对项目的评分预测。在两个数据集上进行详细的实验,并将实验结果与多种类型的推荐算法进行比较,结果表明HTGSR模型在两个数据集上的效果均较优。

一种静态分析与知识图谱结合的Java冗余代码检测方法

刘昕炜, 陶传奇

计算机科学. 2023, 50 (3): 65-71. doi:10.11896/jsjkx.220700240

摘要 ( 674 )

PDF(1429KB) ( 906 )

参考文献 | 相关文章 | 多维度评价

冗余代码普遍存在于商业和开源软件中,它的存在可能会增加内存占用,影响代码可维护性,增加维护成本。快速类型分析算法是当前Java冗余代码检测中常用的静态分析方法,该算法在虚方法分析方面还存在一些不足。XTA是一种调用图构造算法,在处理虚方法的调用方面具有较高的精度和效率。文中提出了一种基于XTA调用图构建算法的方法来检测Java代码中的冗余代码,在一个名为“RCD”(Redundant Code Detection)的工具原型中实现了这种方法,并通过构建知识图谱辅助人工审查,以提高人工审查的效率以及冗余代码检测的可信度。通过在4个开源Java应用程序上的实验对RCD与其他3个冗余代码检测工具进行了比较。实验结果表明,RCD在检测冗余代码的准确性方面相比其他工具提高了1%~30%,同时在检测冗余虚方法的完整性方面提升了4%左右。

细粒度语义知识图谱增强的中文OOV词嵌入学习

陈姝睿, 梁子然, 饶洋辉

计算机科学. 2023, 50 (3): 72-82. doi:10.11896/jsjkx.220700249

摘要 ( 812 )

PDF(2405KB) ( 1187 )

参考文献 | 相关文章 | 多维度评价

随着信息化领域的范围不断扩大,许多特定领域的文本语料开始涌现。这些特定领域,如医疗、通信等,由于受到安全性和敏感性的影响,其数据规模通常较小,传统的词嵌入学习模型难以获得有效的结果。另一方面,直接应用现有的预训练语言模型时会出现较多未登录词,这些词汇无法表示成向量,从而影响下游任务的性能表现。许多学者开始研究如何利用细粒度语义信息来得到较高质量的未登录词向量表示。然而,当前的未登录词嵌入学习模型大多针对英文语料,对中文词的细粒度语义信息只能进行简单的拼接或映射,难以在中文未登录词嵌入学习任务中得到有效的向量表示。针对上述问题,首先通过中文构字规则,即中文词所包含的汉字、汉字所包含的部件和拼音等,构建细粒度的知识图谱,使其不仅能涵盖汉字和单词之间的关联关系,还能对拼音和汉字、组件和汉字等细粒度语义信息之间的多元且复杂的关联关系进行表征。然后,在知识图谱上运行图卷积算法,从而对中文词的细粒度语义信息之间以及它们与词语义之间更深层次的关系进行建模。此外,文中通过在子图结构上构建图读出来进一步挖掘细粒度语义信息与词语义信息之间的组成关系,据此提升模型在未登录词嵌入推断中的精准度。实验结果表明,在面对未登录词占比较大的特定语料上的词配对、词相似任务,以及文本分类、命名实体识别等下游任务时,所提模型都取得了更好的性能。

医学知识图谱研究与应用综述

蒋川宇, 韩翔宇, 杨文蕊, 吕博涵, 黄小欧, 谢夏, 谷阳

计算机科学. 2023, 50 (3): 83-93. doi:10.11896/jsjkx.220700241

摘要 ( 1704 )

PDF(2148KB) ( 1772 )

参考文献 | 相关文章 | 多维度评价

医学数据数字化推进过程中,如何选择合适的技术来对医学数据进行高效处理和准确分析,是当今医学领域普遍面临的问题。利用具有优秀联想与推理能力的知识图谱技术来对医学数据进行处理与分析,能更好地实现智慧医疗、辅助诊断等应用。医学知识图谱的完整构建过程包括知识抽取、知识融合和知识推理。其中知识抽取可细分为实体抽取、关系抽取和属性抽取,知识融合则主要包括实体对齐和实体消歧。首先,对现今医学知识图谱的构建技术和实际应用进行归纳整理,针对每一具体构建过程阐明技术发展脉络。在此基础上,对相关技术进行介绍并说明其优点和局限性。其次,介绍几个已成熟运用的医学知识图谱。最后,根据知识图谱在医学领域的技术与应用现状,给出未来知识图谱可进行的技术兼应用性的研究方向。

基于表示学习的知识图谱推理研究综述

李志飞, 赵月, 张龑

计算机科学. 2023, 50 (3): 94-113. doi:10.11896/jsjkx.220900136

摘要 ( 1300 )

PDF(4422KB) ( 1323 )

参考文献 | 相关文章 | 多维度评价

知识图谱以结构化形式描述了现实世界中的客观知识,但面临着构建不完整或者无法处理新增知识等挑战。知识图谱推理方法成为了知识图谱补全和更新的重要手段,该方法旨在基于图谱中已有的事实推断出未知的事实。近年来,基于表示学习的知识图谱推理研究受到了广泛关注,其主要研究思路是将实体和关系嵌入到低维连续向量空间从而进行推理,具有计算效率快、推理性能高等优势。文中以基于表示学习的知识图谱推理方法为研究对象,首先对相关的符号表示、数据集、评价指标、训练方法以及评测任务进行了简要概述;其次介绍了基于平移距离和语义匹配的两种典型知识图谱推理方法;然后对融合多源信息的推理方法进行了分类和梳理,以及详细分析了近期流行的基于神经网络的推理研究进展;最后总结全文,同时对知识图谱推理的未来研究方向进行展望。

融合多类时空轨迹特征的跨网络用户身份识别

刘红, 朱焱, 李春平

计算机科学. 2023, 50 (3): 114-120. doi:10.11896/jsjkx.211200287

摘要 ( 476 )

PDF(2602KB) ( 3053 )

参考文献 | 相关文章 | 多维度评价

随着位置社交网络的蓬勃发展,用户移动行为数据得到极大丰富,推动了基于时空数据的身份识别问题的相关研究。跨位置社交网络的用户身份识别,强调学习不同平台时空序列间的相关性,旨在发现同一用户在不同平台的注册账号。为解决现有研究面临的数据稀疏、低质量和时空不匹配问题,提出了一种融合双向时空依赖和时空分布的识别算法UI-STDD。该算法主要包含3个模块:时空序列模块通过结合成对注意力的双向长短时记忆网络来刻画用户移动模式;时间偏好模块从粗、细两个粒度定义用户个性化模式;空间位置模块挖掘位置点的局部和全局信息,量化空间邻近性。基于上述模块得到的用户轨迹对特征,UI-STDD利用多层前馈网络判断跨网络的两个账户是否对应于现实中的同一个人。为验证UI-STDD的可行性和有效性,在3组公开的数据集上进行了实验。实验结果表明,所提算法能够提高基于时空数据的用户身份识别率,F1值平均高于最优对比方法10%以上。

基于深度聚类的航空交通流识别与异常检测研究

饶丹, 时宏伟

计算机科学. 2023, 50 (3): 121-128. doi:10.11896/jsjkx.220100086

摘要 ( 671 )

PDF(4271KB) ( 2938 )

参考文献 | 相关文章 | 多维度评价

针对传统的聚类算法无法捕获高维轨迹数据在低维空间中的隐含关系,且难以定义适当的相似性度量以同时考虑轨迹的局部和全局特征的问题,提出了一种基于深度神经网络的多变量轨迹深度聚类框架(MTDC)并将其用于航空交通流识别与异常检测。该框架主要包含一个非对称的自编码器和一个自定义的轨迹聚类层。自编码器由一维卷积神经网络和双向长短时记忆网络堆叠而成,用于学习原始输入在低维隐空间中的特征表示。轨迹聚类层则通过计算隐空间中样本的Q分布实现聚类。结合自编码器的重建损失和轨迹聚类Q分布定义了一个新的异常分数,用于检测异常轨迹。使用基于广播式自动相关监视(ADS-B)的真实轨迹数据进行实验,结果表明,所提框架能有效地进行航空交通流识别,并能检测出具有实际意义且可解释的异常轨迹。

异构信息网络的注意力感知多通道图卷积评分预测模型

周明强, 代开浪, 吴全旺, 朱庆生

计算机科学. 2023, 50 (3): 129-138. doi:10.11896/jsjkx.220300004

摘要 ( 816 )

PDF(4257KB) ( 2992 )

参考文献 | 相关文章 | 多维度评价

异构信息网络(Heterogeneous Information Network,HIN)包含了丰富的语义信息,利用其进行评分预测已成为缓解推荐系统数据稀疏性问题的一个重要途径。然而,传统采用元路径来提取HIN语义信息的方法忽略了元路径中的评分信息,从而导致元路径无法精确捕获用户和推荐项目之间的语义相似性,同时也未能良好区分不同元路径的重要性。为了解决这两个问题,首先提出了一种带有评分限制的元路径以获取更准确的HIN语义信息,利用这些信息构建用户和项目多层网络;然后结合图卷积网络和注意力机制设计了一个用于评分预测的神经网络,通过多通道图卷积有效地表示了HIN的多种语义信息,采用注意力机制区分不同元路径的重要性,弥补了传统方法的不足;最后融合了用户和项目的属性信息,进一步提高了评分预测的准确性。在Douban Book和Yelp数据集上的实验结果表明所提模型明显优于对比的基线模型,尤其在数据稀疏的情况下,均方根误差比基线模型最多减少了50%,从而验证了所提模型的优越性。

基于标签共现和特征局部相关的心电异常检测方法

韩京宇, 钱龙, 葛康, 毛毅

计算机科学. 2023, 50 (3): 139-146. doi:10.11896/jsjkx.220200004

摘要 ( 790 )

PDF(1927KB) ( 2839 )

参考文献 | 相关文章 | 多维度评价

自动的心电异常识别是一个多标签分类问题,多通过对每个标签训练一个二分类器来实现异常识别。由于异常数目多,特征和异常间以及不同异常间的相关性复杂,自动检测的效果并不理想。为了充分利用异常和特征间的依存关系,提出了一种基于异常标签共现和特征局部相关(Label Co-occurrence and Feature's local Pertinence,LCFP)的心电异常识别方法。首先,根据标签共现性和特征局部相关性,为标签构建包含宏特征和微特征的联合特征空间。宏特征采用狄利克雷过程混合模型聚类构建,以区分不同的共现标签集;微特征是原始特征空间的一个子集,用于区分共现标签集中的各个标签。进而,在联合特征空间为每个异常训练一个一对多(One-Versus-All)的概率分类器。其次,为充分利用异常的关联,提出在概率分类器排序基础上区分相关和非相关标签,采用Beta分布自适应地学习锚阈值和相关度阈值,以确定实例的相关标签集。LCFP是一种检测多种心电异常的通用方法,提高了心电异常识别的精度。在两个真实数据集上,F1指标分别提高了4%和22.4%,验证了所提方法的有效性。

具有周期间隙约束的负序列模式挖掘

王珠林, 武优西, 王月华, 刘靖宇

计算机科学. 2023, 50 (3): 147-154. doi:10.11896/jsjkx.211200248

摘要 ( 633 )

PDF(1980KB) ( 2860 )

参考文献 | 相关文章 | 多维度评价

间隙约束的序列模式挖掘是一种特殊形式的序列模式挖掘方法,该方法能够揭示一定间隔下的频繁出现(发生)的子序列。但当前间隙约束的序列模式挖掘方法只关注正序列模式的挖掘,忽略了事件中的缺失行为。为解决该问题,探索了周期间隙约束的负序列模式(Negative Sequential Pattern with Periodic Gap Constraints,NSPG)挖掘方法,该方法能够更灵活地反映元素与元素之间的关系。为高效求解NSPG挖掘问题,提出了NSPG-INtree(Incomplete Nettrees)算法,该算法主要包括两个步骤:候选模式生成和支持度计算。在候选模式生成方面,为了减少候选模式的数量,该算法采用模式连接策略;在支持度计算方面,为了提高模式支持度计算效率并减少空间消耗,该算法采用不完整网树结构计算模式支持度。实验结果表明,NSPG-INtree算法不仅具有较高的挖掘效率,而且能同时挖掘间隙约束的正序列模式和负序列模式。与其他间隙约束的序列模式挖掘算法相比,NSPG-INtree能够多发现209%~352%的模式;与不同策略的对比算法相比,NSPG-INtree能够缩短6%~38%的运行时间。

一种基于影响力预测的节点排序模型

段顺然, 尹美娟, 刘粉林, 焦隆隆, 于岚岚

计算机科学. 2023, 50 (3): 155-163. doi:10.11896/jsjkx.211200261

摘要 ( 826 )

PDF(3807KB) ( 2895 )

参考文献 | 相关文章 | 多维度评价

节点影响力排序一直是复杂网络研究的热点问题。Susceptible-Infected-Recovered(SIR)模型是一种较为理想的节点影响力排序方法,业内常将其用于评价其他的节点影响力排序方法,但该方法时间复杂度较高,难以实际应用。文中提出一个基于sir值学习的节点影响力排序模型,模型综合节点的局部和全局结构信息描述节点特征,利用机器学习方法构建sir值学习模型,以构建的同等规模网络的节点特征和sir值对模型进行训练,训练后的模型能够基于节点特征预测节点的sir值,进而实现节点影响力排序。文中基于该模型实现了一个具体的节点影响力排序方法,并在真实数据集上进行了实验,结果表明,基于该模型得到的影响力排序结果,其准确性和单调性相比度中心性、Kshell、Weighted Kshell degree neighborhood等基于结构特征的方法均有所提升。

基于迁移学习和多视图特征融合提高RNA碱基相互作用预测

王晓飞, 樊学强, 李章维

计算机科学. 2023, 50 (3): 164-172. doi:10.11896/jsjkx.211200186

摘要 ( 772 )

PDF(5749KB) ( 2873 )

参考文献 | 相关文章 | 多维度评价

RNA碱基相互作用对维持其三维结构的稳定具有重要作用,准确地预测碱基相互作用可以辅助RNA三维结构的预测。然而,用于预测RNA碱基相互作用的数据量少,导致模型未能充分地学习到数据的特征分布,以及数据存在的特性(对称特性和类别不平衡),都影响了模型的性能。针对模型不充分学习和数据特性问题,在深度学习的基础上,提出了一种高性能的RNA碱基相互作用预测方法tpRNA。tpRNA首次在RNA碱基相互作用预测任务中引入迁移学习以改善因数据量少而产生的模型不充分学习问题,并提出高效的损失函数和特征提取模块,充分发挥迁移学习和卷积神经网络在特征学习方面的优势,以缓解数据特性问题。结果表明,引入迁移学习能减小数据量少导致的模型偏差,提出的损失函数能优化模型的训练,特征提取模块能提取到更有效的特征。与最先进的方法相比,tpRNA在低质量输入特征的情形下具有显著的优势。

融合IRT的图注意力深度知识追踪模型

董永峰, 黄港, 薛婉若, 李林昊

计算机科学. 2023, 50 (3): 173-180. doi:10.11896/jsjkx.211200134

摘要 ( 1220 )

PDF(2077KB) ( 3702 )

参考文献 | 相关文章 | 多维度评价

知识追踪,旨在根据学生的历史答题表现实时追踪学生的知识状态(知识的掌握程度)并且预测学生未来的答题表现。目前的研究仅仅探索了问题或概念本身对学生答题表现的直接影响,而往往忽略了问题及包含的概念中存在的深层次信息对学生答题表现的间接影响。为了更好地利用这些深层次信息,一种融合项目反应理论的图注意力深度知识追踪模型GAKT-IRT被提出。模型将图注意力网络应用于知识追踪领域,取得了显著的提升效果,并使用IRT增加了模型的可解释性。首先,通过图注意力网络层获得问题的深层次特征表示;接着,根据结合了深层次信息的学生历史答题序列对学生的知识状态进行建模;然后,使用IRT对学生未来的答题表现进行预测。在6个公开真实在线教育数据集上的对比实验结果证明了,GAKT-IRT模型可以更好地完成知识追踪任务,在预测学生未来答题表现上具有明显的优势。

基于规则推理的足球视频任意球射门事件检测

华晓凤, 冯娜, 于俊清, 何云峰

计算机科学. 2023, 50 (3): 181-190. doi:10.11896/jsjkx.220300062

摘要 ( 899 )

PDF(2971KB) ( 719 )

参考文献 | 相关文章 | 多维度评价

足球视频事件检测对视频检索具有重要意义。然而,足球视频中事件较少,且主要发生在远镜头中,难以捕捉关键球员和关键动作,导致足球事件检测困难。近年来,基于深度学习的方法在足球视频事件检测上取得了一定的进展,但对事件的高层语义学习仍不够充分,检测结果有待进一步提高。如何提升足球视频事件检测的准确性是亟待解决的问题。以任意球射门事件为研究对象,提出了足球规则与深度学习相结合的事件检测模型。为了深入了解任意球射门事件的内在特性,人工总结了事件规则并在公共足球数据集上进行了验证,同时提出了规则的应用场景。针对足球视频中事件过少的问题,设计了基于规则的初始定位算法对视频进行预处理。通过多规则组合和应用,从原始视频中初步定位可能发生任意球射门事件的位置,并将其作为深度学习模型的输入进行进一步预测。在公共足球数据集上将所提模型与其他模型进行对比实验。结果表明,该模型取得了最好的效果,其精确率达到78%,召回率达到81.25%。相比其他模型,其精确率的提升尤为明显。可见,足球规则与深度学习相结合的任意球事件检测模型有效提升了任意球射门事件的检测性能,为足球视频中其他事件的检测提供了参考依据。

一种基于三维卷积的声学事件联合估计方法

梅鹏程, 杨吉斌, 张强, 黄翔

计算机科学. 2023, 50 (3): 191-198. doi:10.11896/jsjkx.220500259

摘要 ( 883 )

PDF(3439KB) ( 754 )

参考文献 | 相关文章 | 多维度评价

声学事件定位与检测在监控、异常检测等任务中应用广泛,以基于卷积递归神经网络架构为代表的深度学习方法可以联合实现声学事件检测和声源定位。为提高定位与检测的综合性能,提出了一种基于三维卷积的声学事件联合估计方法SELD3Dnet。通过对输入的多通道音频计算幅度相位特征,并经过多重三维卷积结构提取高层特征表示,最后利用循环网络和全连接层实现声音事件类别和空间位置的估计。在处理多通道的声学信号特征时,三维卷积可以同时对时间、频率、信号通道3个维度进行卷积计算,最大程度地利用信号通道间的相关性,克服噪声和混响的影响。在TUT2018和TAU2019等公开数据集上进行了充分的对比实验。结果表明,所提方法在TUT2018 REAL和TUT2019 MREAL数据集上的综合性能都有显著提升。其中,在TUT2018 REAL数据集上声学事件检测的F1指标显著提升了13.9%,帧准确率显著提升了21.1%;在TUT2019 MREAL数据集上F1指标显著提升了10.8%,帧准确率显著提升了14.4%。表明所提方法能有效克服实际信号中混响的影响。

基于特征融合的边缘引导乳腺超声图像分割方法

白雪飞, 马亚楠, 王文剑

计算机科学. 2023, 50 (3): 199-207. doi:10.11896/jsjkx.211200294

摘要 ( 754 )

PDF(3397KB) ( 1071 )

参考文献 | 相关文章 | 多维度评价

针对乳腺超声图像边缘模糊、斑点噪声多、对比度低等问题,提出了一种融合多特征的边缘引导多尺度选择性核U-Net(Edge-guided Multi-scale Selective Kernel U-Net,EMSK U-Net)方法。EMSK U-Net采用基于U-Net的对称编解码结构可以适应小数据集医学图像分割的特点,将扩张卷积与传统卷积构成选择性核模块作用于编码路径,并提取下采样过程中的选择性核特征进行边缘检测任务,在丰富图像空间信息的同时细化边缘信息,有效缓解斑点噪声和边缘模糊的问题,在一定程度上可以提升小目标的检测精度。然后在解码路径通过多尺度特征加权聚合获取丰富的深层语义信息,多种信息之间相互补充,从而提升网络的分割性能。在3个公开的乳腺超声图像数据集上的实验结果表明,与其他分割方法相比,EMSK U-Net算法各项指标表现良好,分割性能有显著提升。

极化自注意力约束颜色溢出的图像自动上色

刘航, 普园媛, 吕大华, 赵征鹏, 徐丹, 钱文华

计算机科学. 2023, 50 (3): 208-215. doi:10.11896/jsjkx.220100149

摘要 ( 1067 )

PDF(5154KB) ( 899 )

参考文献 | 相关文章 | 多维度评价

自动上色可以将灰度图像转换为色彩合理的自然彩色图像,可以为老旧照片、黑白影视作品等重新恢复颜色,因此在计算机视觉和图形学领域受到广泛关注。然而,为灰度图像分配色彩是一项极具挑战性的任务,存在颜色溢出问题。为解决该问题,提出了一种极化自注意力约束颜色溢出的图像自动上色方法。首先,将前景中的实例和背景分开,降低背景对前景的上色影响,从而减少前景和背景之间的颜色溢出;然后,使用极化自注意力模块把特征分为颜色通道和空间位置两部分,使上色更加准确、具体,从而减少全局图像、实例对象内的颜色溢出;最后,结合融合模块,将全局特征和实例特征通过不同权重融合为一体,完成最终上色。实验结果表明,与ChromaGAN,MemoGAN等算法相比,所提方法在主要指标FID,LPIPS上分别提升了9.7%和10.9%,且SSIM和PSNR指标均达到最优。

基于多粒度特征融合的叶片分类与分级方法

刘松岳, 王欢

计算机科学. 2023, 50 (3): 216-222. doi:10.11896/jsjkx.211100203

摘要 ( 752 )

PDF(2674KB) ( 797 )

参考文献 | 相关文章 | 多维度评价

长期以来,已有很多工作致力于研究植物叶片分类,虽然它们在公开数据集上表现较好,但实际应用并不理想,且难以应用于更复杂的问题,如叶片分级,即要求在对叶片进行分类的基础上,再对同一类的叶片进行更细级别(质量等级)的划分。为此,提出了一种新的植物叶片分类以及分级模型,该模型关注叶片的多粒度信息,并将粗粒度与细粒度进行有效融合。该模型包含粗粒度和细粒度两个分支,由粒度混合损失将两个分支联系起来,促使模型逐步学习由粗到细的粒度表征。采用了多步骤训练方式,每一步提取不同层级的特征,实现浅层特征与深层特征的融合。此外,还提出了几何通道注意力模块,该模块由空间变换和双线性注意力池化组成,使模型可以关注图像中更具区分度的局部区域,提取出的特征更具区分性。所提方法在Flavia leaf和Swedish leaf两个公开的叶片分类数据集上分别达到了99.8%和99.7%的分类准确率,且在所构建的烟叶分级数据集上达到了71.9%的分级准确率,均超过了目前最优的方法。

基于多特征融合的油画艺术风格分类

谢秦秦, 何朗, 徐汝利

计算机科学. 2023, 50 (3): 223-230. doi:10.11896/jsjkx.211200110

摘要 ( 830 )

PDF(2615KB) ( 845 )

参考文献 | 相关文章 | 多维度评价

针对现有油画艺术风格分类算法忽略画面主体区域与整体效果对其艺术风格影响的问题,提出了一种基于多特征融合的油画分类算法(Multi-Feature Fusion Classifier,MFFC)。首先,基于油画艺术元素间常见的排列形式,设计重叠式图像分块法,提取油画空间特征,弥补现有算法中的构图风格缺失,同时区分主体区域与背景区域;其次,将空间特征与底层特征串联融合,增加画面元素的位置信息;最后,设计空间票选法,优先将主体区域的分类结果作为算法结果输出,进一步突出油画主体区域在分类中的作用,实现油画艺术风格的自动分类。在FS-Classifier模型创建的数据集上对所提算法进行测试,其准确率、精确率、召回率、F1-score和AUC分别为96.92%,63.69%,98.75%,98.57%和0.917,相比FS-Classifier分别提升了6.72%,5.85%,9.05%,7.1%和0.128;在公共数据集WIKIART上进行测试,并与其他6种算法进行比较,准确率至少提升了13.27%。实验结果表明,该算法有效提高了空间特征对油画艺术风格分类任务的表现性能,具有良好的实用价值。

跨层融合和感受野扩增的SSD目标检测算法

张卫良, 陈秀宏

计算机科学. 2023, 50 (3): 231-237. doi:10.11896/jsjkx.211100281

摘要 ( 937 )

PDF(3432KB) ( 856 )

参考文献 | 相关文章 | 多维度评价

鉴于SSD(Single Shot Multibox Detector)不同层缺乏信息的交互以及模型感受野的限制,提出了一种改进的SSD目标检测算法——ESSD(Enhanced SSD),以提高目标检测的准确性。首先,使用SSD模型中原有的多尺度特征图,利用FPN(Feature Pyramid Networks)的思想,设计了一种跨层信息交互模块,在增强了不同层的语义信息能力的同时减小了不同层的信息差异。然后,为了提高模型的感受野和多尺度检测能力,设计了一种感受野扩增模块。最后,采用批处理归一化层缩短训练时间,以提高模型的收敛速度。为了评价ESSD的有效性,在PASCAL VOC2007测试集以及PASCAL VOC2012测试集上进行了实验。实验结果表明,在PASCAL VOC2007数据集上其mAP为82.1%且检测速度为15.7FPS,相比原有的SSD512,其mAP提升了2.3%;在PASCAL VOC2012测试集上其mAP达到了80.6%,也比SSD512高2.1%。实验证明了ESSD检测器在达到较高检测精度的情况下,仍然可以满足实时性。

基于深度学习的可视化仪表板生成技术研究

陈亮, 王璐, 李生春, 刘昌宏

计算机科学. 2023, 50 (3): 238-245. doi:10.11896/jsjkx.230100064

摘要 ( 979 )

PDF(3758KB) ( 822 )

参考文献 | 相关文章 | 多维度评价

仪表板是支持制造企业开展数据可视化分析和经营决策的重要手段。为解决可视化仪表板设计与实现过程中用户对专业知识依赖性强及流程迭代繁杂的问题,提出了一种基于深度学习技术YOLOv5s算法的可视化仪表板自动识别与生成方法。首先,基于YOLOv5s算法对仪表板图像及手绘草图中包含的可视化图表组件进行检测,并针对在检测过程中出现的手绘草图中不规则线条对识别图表的干扰及误检等问题,引入CA注意力机制来增强模型对重要特征的关注及目标精确定位能力,从而提高模型的识别精度;其次,将图表检测模型部署在Web中,服务器根据模型检测结果调用封装好的可视化图表组件代码,生成多组件组合的初始仪表板;最后,基于此Web设计,开发了一款数据可视化仪表板构建平台,为用户提供可修改配置仪表板样式及数据的详细选项,以方便用户快速构建完整的仪表板。通过收集Tableau,Power BI等可视化工具产生的仪表板图像及企业应用过程中手绘仪表板草图形成数据集,基于该数据集进行实验验证,改进的模型识别精度比原YOLOv5s模型提升了2.1%,mAP为98.4%,并通过系统部署应用验证了图表识别方法及开发的平台可有效识别及生成相应图表组件,满足用户的基本需求。

特征增强损失与前景注意力人群计数网络

张译, 吴秦

计算机科学. 2023, 50 (3): 246-253. doi:10.11896/jsjkx.220100219

摘要 ( 946 )

PDF(6985KB) ( 928 )

参考文献 | 相关文章 | 多维度评价

人群计数旨在准确估计图像中的总人数并呈现其分布。相关数据集中的图像通常涉及各类场景且包含多人。为节约人力,大多数数据集通常在每个人头部以单点标注作为标签。然而,点标签无法囊括人头部的完整范围,使得人群特征与分布标签的匹配难以收敛,预测值无法聚集在前景区域,严重影响密度估计图质量和模型计数准确度。为了解决这个问题,使用计数损失来约束全图上的预测值范围,并佐以像素级的分布一致损失优化密度图匹配过程。此外,复杂场景中存在许多易与人群特征混淆的背景噪声,为了避免假阳性预测对后续计数和密度图估计的干扰,提出前景分割模块和特征增强损失来自适应地聚焦前景区域,并加大前景位置上人头特征对计数的贡献,从而达到抑制背景误判的作用。此外,为了使网络更好地适应人头的多尺度形态,对每个待训练图片分别进行上下采样操作,以获得具有同目标的多尺度形态。在多个数据集上进行了实验,结果表明,与最先进的方法相比,所提方法取得了更好或更有竞争力的结果。

演化循环神经网络研究综述

胡中源, 薛羽, 查加杰

计算机科学. 2023, 50 (3): 254-265. doi:10.11896/jsjkx.220600007

摘要 ( 893 )

PDF(3002KB) ( 955 )

参考文献 | 相关文章 | 多维度评价

演化计算利用生物演化过程中的自然选择机制和遗传规律求解优化问题,循环神经网络的精度和效率依赖其参数以及结构的优化效果,采用演化计算解决循环神经网络中的参数与结构自适应优化问题是自动化深度学习领域的研究热点。文中针对结合演化计算和循环神经网络的算法进行了详细的调研。首先,简要介绍了演化算法的传统类别、常见算法和优点,以及循环神经网络模型的结构及特点,并对影响循环神经网络性能的因素进行了分析;其次,分析了演化循环神经网络的算法框架,并分别从权重优化、超参数优化和结构优化方面分析了当前演化循环神经网络的研究进展;然后,对演化循环神经网络的一些其他工作进行了分析;最后,指出了演化循环神经网络面临的挑战以及发展趋势。

文档增强型知识库问答

冯程程, 刘派, 姜琳颖, 梅笑寒, 郭贵冰

计算机科学. 2023, 50 (3): 266-275. doi:10.11896/jsjkx.220300022

摘要 ( 670 )

PDF(3488KB) ( 780 )

参考文献 | 相关文章 | 多维度评价

近年来,知识库(Knowledge Base,KB)被广泛应用于问答(Question Answering,QA)任务中。给定自然语言问题,利用知识库为给定问题提供正确答案,被称为KBQA问题。然而,知识库本身可能是不完整的(例如,KB不包含问题的答案或问题中的一些实体和关系),这限制了现有KBQA模型的总体性能。为了解决这个问题,文中提出了一个新的模型,利用文本语料库信息提供额外信息来增强知识库覆盖率和背景信息以增强问题的表示。具体来说,该模型由3个模块组成,即实体和问题表征模块、文档和问题增强表征模块以及答案预测模块。实体和问题表征模块从检索到的知识库子图中学习实体的表示,然后通过融合种子实体信息更新问题表示;文档和问题增强表征模块尝试学习与给定问题相关文档的正确表示,然后通过融合文档信息进一步改进问题表示;最后,答案预测模块根据知识库实体表征、文档表征和更新的问题表征进行答案预测。利用所提方法在WebQuestionsSP数据集上进行了大量的实验,结果表明,与其他方法相比,所提方法可以获得更高的准确性。

基于边界定位与纠偏的中文命名实体提取规则研究

刘盼, 郭延明, 雷军, 老明瑞, 李国辉

计算机科学. 2023, 50 (3): 276-281. doi:10.11896/jsjkx.220200020

摘要 ( 763 )

PDF(1515KB) ( 885 )

参考文献 | 相关文章 | 多维度评价

相对于英文天然由单词组成而言,中文由于没有分词符,汉字之间的组词更灵活,在命名实体识别时,其边界更加难以确定。当前的主流方法将命名实体识别任务转化为序列标注任务,文中采用BIOES标注方案,针对预测的标签序列进行研究。通过单独比较实体头部标签B或尾部标签E,计算实体边界准确率,结果表明提高边界准确率能够进一步提升实体识别准确率;对具有连续标签的实体边界进行拓展和重定位,采用实体最后一个字符的类型标签对实体类型进行纠偏,利用分词信息对标签不完整的实体进行填充;最后,提出增加边界标记的BIO⁺ES标注方案,用于区分实体边界的非实体字符,以进一步提升中文命名实体识别的性能。

基于BERT和多特征融合嵌入的中文拼写检查

刘哲, 殷成凤, 李天瑞

计算机科学. 2023, 50 (3): 282-290. doi:10.11896/jsjkx.220100104

摘要 ( 1154 )

PDF(2288KB) ( 955 )

参考文献 | 相关文章 | 多维度评价

由于汉字的多样性和中文语义表达的复杂性,中文拼写检查仍是一项重要且富有挑战性的任务。现有的解决方法通常存在无法深入挖掘文本语义的问题,且在利用汉字独特的相似性特征时往往通过预先建立的外部资源或是启发式规则来学习错误字符与正确字符之间的映射关系。文中提出了一种融合汉字多特征嵌入的端到端中文拼写检查算法模型BFMBERT(BiGRU-Fusion Mask BERT)。该模型首先利用结合混淆集的预训练任务使BERT学习中文拼写错误知识,然后使用双向GRU网络捕获文本中每个字符错误的概率,利用该概率计算汉字语义、拼音和字形特征的融合嵌入表示,最后将这种融合嵌入输入到BERT中的掩码语言模型(Mask Language Model,MLM)以预测正确字符。在SIGHAN 2015基准数据集上对BFMBERT进行了评测,取得了82.2的F1值,其性能优于其他基线模型。

门控机制融合多种特征的中文事件共指消解

环志刚, 蒋国权, 张玉健, 刘浏, 刘姗姗

计算机科学. 2023, 50 (3): 291-297. doi:10.11896/jsjkx.220700146

摘要 ( 709 )

PDF(2960KB) ( 1053 )

参考文献 | 相关文章 | 多维度评价

事件共指消解是很多自然语言处理任务的基础,旨在识别文本中指代相同真实事件的事件提及。由于中文语法相比英文更复杂,捕获英文文本特征的方法在中文事件共指消解中效果并不明显。为解决文档内中文事件共指,提出了一种门控机制神经网络(Gated Mechanism Neural Network,GMNN)。针对中文具有主语省略、结构松散等特点,引入事件基本属性作为符号特征。在此基础上,提出了一种新的门控去噪机制,对符号特征向量进行微调,过滤符号特征中的噪声,提取在特定上下文语境中的有用信息,进而提高共指事件的识别率。在ACE2005中文数据集上进行了实验,结果表明,GMNN的AVG分数提升了2.66,有效地提高了中文事件共指消解的效果。

基于自适应门控信息融合的多模态情感分析

陈真, 普园媛, 赵征鹏, 徐丹, 钱文华

计算机科学. 2023, 50 (3): 298-306. doi:10.11896/jsjkx.220100156

摘要 ( 1193 )

PDF(3144KB) ( 938 )

参考文献 | 相关文章 | 多维度评价

多模态情感分析的目标是使用由多种模态提供的互补信息来实现可靠和稳健的情感分析。近年来,通过神经网络提取深层语义特征,在多模态情感分析任务中取得了显著的效果。而多模态信息的不同层次的特征融合也是决定情感分析效果的重要环节。因此,提出了一种基于自适应门控信息融合的多模态情感分析模型(AGIF)。首先,通过门控信息融合网络将Swin Transformer和ResNet提取的不同层次的视觉和色彩特征根据对情感分析的贡献进行有机融合。其次,由于情感的抽象性和复杂性,图像的情感往往由多个细微的局部区域体现,而迭代注意可以根据过去的信息精准定位这些情感判别区域。针对Word2Vec和GloVe无法解决一词多义的问题,采用了最新的ERNIE预训练模型。最后,利用自动融合网络“动态”融合各模态特征,解决了(拼接或TFN)确定性操作构建多模态联合表示所带来的信息冗余问题。在3个公开的真实数据集上进行了大量实验,证明了该模型的有效性。

结合上下文和依存句法信息的中文短文本情感分析

杜启明, 李男, 刘文甫, 杨舒丹, 岳峰

计算机科学. 2023, 50 (3): 307-314. doi:10.11896/jsjkx.211200189

摘要 ( 905 )

PDF(2301KB) ( 1193 )

参考文献 | 相关文章 | 多维度评价

依存句法分析旨在从语言学的角度分析句子的句法结构。现有的研究表明,将这种类似于图结构的数据与图卷积神经网络(Graph Convolutional Network,GCN)进行结合,有助于模型更好地理解文本语义。然而,这些工作在将依存句法信息处理为邻接矩阵时,均忽略了句法依赖标签类型,同时也未考虑与依赖标签相关的单词语义,导致模型无法捕捉到文本中的深层情感特征。针对以上问题,提出了一种结合上下文和依存句法信息的中文短文本情感分析模型(Context and Dependency Syntactic Information,CDSI)。该模型不仅利用双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)提取文本的上下文语义,而且引入了一种基于依存关系感知的嵌入表示方法,以针对句法结构挖掘不同依赖路径对情感分类任务的贡献权重,然后利用GCN针对上下文和依存句法信息同时建模,以加强文本表示中的情感特征。基于SWB,NLPCC2014和SMP2020-EWEC数据集进行验证,实验表明CDSI模型能够有效融合语句中的语义以及句法结构信息,在中文短文本情感二分类以及多分类中均取得了较好的效果。

基于多视角建模的汉语议论文写作质量评估方法

贺亚琼, 蒋峰, 褚晓敏, 李培峰

计算机科学. 2023, 50 (3): 315-322. doi:10.11896/jsjkx.220100137

摘要 ( 711 )

PDF(1859KB) ( 897 )

参考文献 | 相关文章 | 多维度评价

自动作文评分是一项代替人工为学生作文进行等级评分的任务,其中丰富的语义、严密的组织和合理的逻辑是重要的考虑因素。已有的研究大多数只从语义或组织等视角出发评估作文的质量,未考虑如逻辑等更高层次的因素。因此,文中提出了一个多视角评价框架(Multi-perspective Evaluation Framework,MPE),从语义表达、组织结构和整体逻辑3个方面对学生议论文进行了客观、可靠的评价。具体来说,多视角评价框架首先利用预训练模型编码句子并获得由低到高3个层次的语义信息,来评估文章的语义表达;其次,框架将句子功能识别与段落功能识别相结合,用于评估文章的组织结构;然后,通过计算段落之间的连贯性来评估文章的整体逻辑;最后,该框架综合这3个方面的评估特征,对作文评分。实验结果表明,所提出的多视角评价框架能够有效地对不同质量的作文进行评分,优于所有基准系统。

基于碰撞危急程度和深度强化学习的实时轨迹规划算法

徐林玲, 周远, 黄鸿云, 刘杨

计算机科学. 2023, 50 (3): 323-332. doi:10.11896/jsjkx.220100007

摘要 ( 693 )

PDF(4622KB) ( 808 )

参考文献 | 相关文章 | 多维度评价

动态环境的实时碰撞规避是移动机器人轨迹规划中的一个巨大挑战。针对可变障碍物数量的环境,提出了基于LSTM(Long Short Term Memory)和DRL(Deep Reinforcement Learning)的实时轨迹规划算法Crit-LSTM-DRL。首先,根据机器人和障碍物的状态,预测碰撞可能发生的时间,计算各个障碍物相对于机器人的碰撞危急程度(Collision Criticality);其次,将障碍物根据碰撞危急程度由低到高排序,然后由LSTM模型提取固定维度的环境表征向量;最后,将机器人状态和该环境表征向量作为DRL的输入,计算对应状态的价值。在任何一个时刻,针对每一个动作,通过LSTM和DRL计算下一时刻对应的状态的价值,从而计算当前状态的最大价值以及对应的动作。针对不同环境,训练获得3个模型,即在5个障碍物的环境里训练的模型、在10个障碍物的环境里训练的模型和在可变障碍物数量(1~10)的环境里训练的模型,分析了它们在不同测试环境中的性能。为进一步分析单个障碍物和机器人之间的交互影响,将障碍物表示为障碍物和机器人的联合状态(Joint State),分析了在上述3个训练环境下获得的模型的性能。实验结果验证了Crit-LSTM-DRL的有效性。

深度学习模型的后门攻击研究综述

应宗浩, 吴槟

计算机科学. 2023, 50 (3): 333-350. doi:10.11896/jsjkx.220600031

摘要 ( 1515 )

PDF(2563KB) ( 1377 )

参考文献 | 相关文章 | 多维度评价

近年来,以深度学习为代表的人工智能在理论与技术上取得了重大进展,在数据、算法、算力的强力支撑下,深度学习受到空前的重视,并被广泛应用于各领域。与此同时,深度学习自身的安全问题也引起了广泛的关注。研究者发现深度学习存在诸多安全隐患,其中在深度学习模型安全方面,研究者对后门攻击这种新的攻击范式进行广泛探索,深度学习模型在全生命周期中都可能面临后门攻击威胁。首先分析了深度学习面临的安全威胁,在此基础上给出后门攻击技术的相关背景及原理,并对与之相近的对抗攻击、数据投毒攻击等攻击范式进行区分。然后对近年来有关后门攻击的研究工作进行总结与分析,根据攻击媒介将攻击方案分为基于数据毒化、基于模型毒化等类型,随后详细介绍了后门攻击针对各类典型任务及学习范式的研究现状,进一步揭示后门攻击对深度学习模型的威胁。随后梳理了将后门攻击特性应用于积极方面的研究工作。最后总结了当前后门攻击领域面临的挑战,并给出未来有待深入研究的方向,旨在为后续研究者进一步推动后门攻击和深度学习安全的发展提供有益参考。

针对机器学习的成员推断攻击综述

彭钺峰, 赵波, 刘会, 安杨

计算机科学. 2023, 50 (3): 351-359. doi:10.11896/jsjkx.220100016

摘要 ( 876 )

PDF(1995KB) ( 1176 )

参考文献 | 相关文章 | 多维度评价

近年来,机器学习不仅在计算机视觉、自然语言处理等领域取得了显著成效,也被广泛应用于人脸图像、金融数据、医疗信息等敏感数据处理领域。最近,研究人员发现机器学习模型会记忆它们训练集中的数据,导致攻击者可以对模型实施成员推断攻击,即攻击者可以推断给定数据是否存在于某个特定机器学习模型的训练集。成员推断攻击的成功,可能导致严重的个人隐私泄露。例如,如果能确定某个人的医疗记录属于某医院的数据集,则表明这个人曾经是那家医院的病人。首先介绍了成员推断攻击的基本原理;然后系统地对近年来代表性攻击和防御的研究进行了总结和归类,特别针对不同条件设置下如何进行攻击和防御进行了详细的阐述;最后回顾成员推断攻击的发展历程,探究机器学习隐私保护面临的主要挑战和未来潜在的发展方向。

面向未来网络的安全高效防护架构

杨昕, 李挥, 阙建明, 马震太, 李更新, 姚尧, 王滨, 蒋傅礼

计算机科学. 2023, 50 (3): 360-370. doi:10.11896/jsjkx.220600265

摘要 ( 737 )

PDF(5496KB) ( 872 )

参考文献 | 相关文章 | 多维度评价

传统互联网提供了端到端的传输服务,在过去的半个世纪得到了蓬勃发展。然而,近年来基于该体系的网络攻击已经引起了严重的安全问题。顺应下一代内生安全性网络的发展趋势,以未来多标识场景为研究背景,文中提出了层次化的安全高效防护架构,从网络层到应用层提供全面的保护。该安全架构在网络层提出了内嵌身份认证和包签名的多标识路由寻址方案,保障入网实体可信、数据防篡改且可追溯;在应用层,该架构设计了结合加权中心性算法的拟态防护方案,选择网络核心组件进行重点保护,以尽可能低的防护开销提升服务的鲁棒性,抵御潜在攻击。对于所提方案,同时进行了理论分析和多种场景下的原型实验。实验结果证明,该方案以较低的防守代价,提供了良好的传输性能,使得基于TCP/IP的攻击方法论失效,对传统网络体系下的各种攻击手段免疫,证明了所提安全防护架构的有效性。

基于时延特征的网络设备异常检测

崔竞松, 张童桐, 郭迟, 郭文飞

计算机科学. 2023, 50 (3): 371-379. doi:10.11896/jsjkx.211200280

摘要 ( 574 )

PDF(3202KB) ( 968 )

参考文献 | 相关文章 | 多维度评价

随着互联网的飞速发展,网络设备的安全问题受到了广泛关注。针对现有的网络设备异常检测技术存在破坏性强、检测难度大的问题,文中以网络设备传输处理数据包所花费的时延作为检测依据,提出了一种基于时延特征的异常检测方案。所提方案采用了侧信道分析的方法,无须对网络设备进行升级改造,具有非侵入、易实施、广域性等特点。首先,使用高精度授时技术时戳机采集家庭路由器传输数据包时的时延变化信息,采用遗传算法提取时延分布的峰值位置特征;然后,针对数据集不平衡的问题,使用一类支持向量机算法构建异常检测算法;最后,通过搭建实验平台验证了检测方案的有效性,并对实验结果进行了评估。实验结果表明,所提方法具备可行性和有效性。

一种基于GRU的半监督网络流量异常检测方法

李海涛, 王瑞敏, 董卫宇, 蒋烈辉

计算机科学. 2023, 50 (3): 380-390. doi:10.11896/jsjkx.220100032

摘要 ( 1042 )

PDF(2137KB) ( 916 )

参考文献 | 相关文章 | 多维度评价

入侵检测系统(IDS)是在出现网络攻击时能够发出警报的检测系统,检测网络中未知的攻击是IDS面临的挑战。深度学习技术在网络流量异常检测方面发挥着重要的作用,但现有的方法大多具有较高的误报率且模型的训练大多使用有监督学习的方式。为此,提出了一种基于门循环单元网络(GRU)的半监督网络流量异常检测方法(SEMI-GRU)。该方法将多层双向门循环单元神经网络(MLB-GRU)和改进的前馈神经网络(FNN)相结合,采用数据过采样技术和半监督学习训练方式,应用二分类和多分类方式检验网络流量异常检测的效果,并使用NSL-KDD,UNSW-NB15和CIC-Bell-DNS-EXF-2021数据集进行验证。与经典机器学习模型和DNN,ANN等深度学习模型相比,SEMI-GRU方法在准确率、精确率、召回率、误报率和F1分数等指标上的表现均表现更优。在NSL-KDD二分类和多分类任务中,SEMI-GRU在F1分数指标上领先于其他方法,分别为93.08%和82.15%;在UNSW-NB15二分类和多分类任务中,SEMI-GRU在F1分数上的表现优于对比方法,分别为88.13%和75.24%;在CIC-Bell-DNS-EXF-2021轻文件攻击数据集二分类任务中,SEMI-GRU对所有测试数据均分类正确。

基于深度学习的勒索软件早期检测方法

刘文静, 郭春, 申国伟, 谢博, 吕晓丹

计算机科学. 2023, 50 (3): 391-398. doi:10.11896/jsjkx.220200182

摘要 ( 721 )

PDF(2288KB) ( 986 )

参考文献 | 相关文章 | 多维度评价

近年来,勒索软件的活跃度高居不下,给社会造成了严重的经济损失。文件一旦被勒索软件加密后将难以恢复,因此如何及时且准确地检测出勒索软件成为了当前的研究热点。为了提升勒索软件检测的及时性和准确性,在分析多种勒索软件家族与良性软件运行初期行为的基础上,提出了一种基于深度学习的勒索软件早期检测方法(Ransomware Early Detection Method Based on Deep Learning,REDMDL)。REDMDL以软件运行初期所调用的一定长度的应用程序编程接口(Application Programming Interface,API)序列为输入,结合词向量和位置向量对API序列进行向量化表征,再构建深度卷积网络与长短时记忆网络(Convolutional Neural Network-Long Short Term Memory,CNN-LSTM)相结合的神经网络模型,来实现对勒索软件的早期检测。实验结果显示,REDMDL能够在一个软件运行后数秒内高准确率地判定其是勒索软件还是良性软件。