计算机科学

第51卷第6A期目录

计算机科学. 2024, 51 (6A): 0-0.

摘要 ( 199 )

PDF(590KB) ( 671 )

相关文章 | 多维度评价

知识图谱的可视化文献计量分析

何静, 赵睿, 张恒硕

计算机科学. 2024, 51 (6A): 230500123-10. doi:10.11896/jsjkx.230500123

摘要 ( 268 )

PDF(8967KB) ( 394 )

参考文献 | 相关文章 | 多维度评价

随着网络社会不断发展,人们对信息检索提出了更高要求,知识图谱的产生和发展为其提供支持。因此知识图谱研究逐渐受到学者关注,与各领域融合的相关研究也逐渐增加。为洞察知识图谱研究历程及发展趋势,文中使用CiteSpace软件,对中国知网(CNKI)和 Web of Science(WOS)数据库中知识图谱的研究进行可视化分析,按年发文量、机构共现、作者共现、关键词共现、关键词聚类及突显词对2013－2022年的文献进行梳理。文中选取中文研究中的深度学习、人工智能、文献计量、可视化,外文研究中的社会网络分析、任务分析、数据采掘、多智能体系统为研究热点进行关键词综述。通过研究发现,现阶段知识图谱相关研究尽管呈现全面深入发展趋势,但中文研究中存在联系性不强、稳定性较弱、研究范围较窄的情况,可在后续研究中进行相应完善。

神经网络模型轻量化方法综述

高杨, 曹仰杰, 段鹏松

计算机科学. 2024, 51 (6A): 230600137-11. doi:10.11896/jsjkx.230600137

摘要 ( 1486 )

PDF(2583KB) ( 1691 )

参考文献 | 相关文章 | 多维度评价

近年来,神经网络模型凭借着较强的特征提取能力在各行各业的应用越来越广泛,并取得了不错的效果。然而,随着数据量的不断增大以及人们对高准确率的不断追求,神经网络模型的参数规模急剧增大,网络复杂度不断提高,导致计算、存储等资源开销不断扩大,使其在资源受限场景下的部署面临极大挑战。因此,如何在不影响模型性能的前提下实现模型轻量化,进而降低模型训练和部署的成本成为当前的研究热点之一。为此,文中从复杂模型压缩以及轻量化模型设计两方面入手,对当前典型的模型轻量化方法进行总结和分析,以期厘清模型压缩技术的发展脉络。其中,复杂模型压缩技术从模型剪枝、模型量化、低秩分解、知识蒸馏及混合方式5方面进行归纳,而轻量化模型设计则从空间卷积设计、移位卷积设计和NAS架构搜索3方面进行梳理。

基于值函数分解的多智能体深度强化学习方法研究综述

高玉钊, 聂一鸣

计算机科学. 2024, 51 (6A): 230300170-9. doi:10.11896/jsjkx.230300170

摘要 ( 266 )

PDF(3173KB) ( 429 )

参考文献 | 相关文章 | 多维度评价

多智能体深度强化学习方法是深度强化学习方法在多智能体问题上的扩展,其中基于值函数分解的多智能体深度强化学习方法取得了较好的表现效果,是目前研究和应用的热点。文中介绍了基于值函数分解的多智能体深度强化学习方法的主要原理和框架;根据近期相关研究,总结出了提高混合网络拟合能力问题、提高收敛效果问题和提高算法可扩展性问题3个研究热点,从算法约束、环境复杂度、神经网络限制等方面分析了3个热点问题产生的原因;根据拟解决的问题和使用的方法对现有研究进行了分类梳理,总结了同类方法的共同点,分析了不同方法的优缺点;对基于值函数分解的多智能体深度强化学习方法在网络节点控制、无人编队控制两个热点领域的应用进行了阐述。

基于图卷积神经网络的点云语义分割综述

黄海新, 蔡明启, 王钰瑶

计算机科学. 2024, 51 (6A): 230400196-7. doi:10.11896/jsjkx.230400196

摘要 ( 224 )

PDF(3986KB) ( 414 )

参考文献 | 相关文章 | 多维度评价

随着点云在自动驾驶、地图测绘和矿山测量等领域的广泛应用,人们愈发关注这种蕴含丰富信息的数据表示形式。点云语义分割作为点云数据处理的重要手段,因具有极高的研究价值和应用前景而受到广泛关注。由于点云所具有的置换不变性和旋转不变性等特点,传统的卷积神经网络无法直接处理不规则的点云数据,而图卷积神经网络却可以使用图卷积算子直接提取点云特征,逐步成为当前点云分割领域的研究热点。虽已有综述性文章对点云分割方法做出总结,但这些文章对图卷积的介绍较为粗略。因而对近几年基于图卷积的点云分割方法进行了分析和归类,总结每类方法的研究思路和特点;然后,介绍了一些在点云语义分割领域中主流的点云数据集和评价指标,并对提及的分割方法的实验结果进行对比;最后,对各类方法的发展方向进行了展望。

基于预训练语言模型的机器翻译最新进展

杨滨瑕, 罗旭东, 孙凯丽

计算机科学. 2024, 51 (6A): 230700112-8. doi:10.11896/jsjkx.230700112

摘要 ( 231 )

PDF(1950KB) ( 427 )

参考文献 | 相关文章 | 多维度评价

自然语言处理涉及许多重要主题,其中之一是机器翻译。预训练语言模型,如BERT和GPT,是用于处理包括机器翻译在内的各种自然语言处理任务的先进方法。因此,许多研究人员使用预训练语言模型来解决机器翻译问题。为推动研究向前发展,首先概述了这一领域的最新进展,包括主要的研究问题和基于各种预训练语言模型的解决方案;其次比较了这些解决方案的动机、共性、差异和局限性;然后总结了训练这类机器翻译模型常用的数据集,以及评估这些模型的指标;最后讨论了进一步的研究方向。

基于softmax的加权Double Q-Learning算法

钟雨昂, 袁伟伟, 关东海

计算机科学. 2024, 51 (6A): 230600235-5. doi:10.11896/jsjkx.230600235

摘要 ( 158 )

PDF(2861KB) ( 333 )

参考文献 | 相关文章 | 多维度评价

强化学习作为机器学习的一个分支,用于描述和解决智能体在与环境的交互过程中,通过学习策略以达成回报最大化的问题。Q-Learning作为无模型强化学习的经典方法,存在过估计引起的最大化偏差问题,并且在环境中奖励存在噪声时表现不佳。Double Q-Learning(DQL)的出现解决了过估计问题,但同时造成了低估问题。为解决以上算法的高低估问题,提出了基于softmax的加权Q-Learning算法,并将其与DQL相结合,提出了一种新的基于softmax的加权Double Q-Learning算法(WDQL-Softmax)。该算法基于加权双估计器的构造,对样本期望值进行softmax操作得到权重,使用权重估计动作价值,有效平衡对动作价值的高估和低估问题,使估计值更加接近理论值。实验结果表明,在离散动作空间中,相比于Q-Learning算法、DQL算法和WDQL算法,WDQL-Softmax算法的收敛速度更快且估计值与理论值的误差更小。

面向工业数字孪生的三层知识图谱结构设计方法

唐昕, 孙宇菲, 王钰珏, 石敏, 朱登明

计算机科学. 2024, 51 (6A): 230400153-6. doi:10.11896/jsjkx.230400153

摘要 ( 191 )

PDF(3703KB) ( 412 )

参考文献 | 相关文章 | 多维度评价

随着工业领域数字化和智能化的发展,企业正面临着提高生产效率、降低生产成本、优化生产过程以及实现实时监控等挑战。数字孪生技术作为一种有效的解决方案,受到了广泛关注。然而,工业建设数字孪生过程中存在数据获取与整合、模型构建与更新以及实时性与精度等难点。为解决这些问题,提出了一种基于数字孪生的知识图谱概念-实例-模块结构设计方法。数字孪生知识图谱模型采用概念-实例-模块三层架构,概念层通过知识图谱建立全面有机的知识网络;实例层进行数字化建模,实现理论参数的真实再现;知识模块层则将前两层知识进行融合,形成功能模块,以实现全面监测和控制。这一模型能够对工业加工知识进行更为准确、细致的建模和分析,帮助企业实现数字化建模、精确仿真模拟、预测分析、异常检测等高级应用功能。

基于改进飞蛾扑火优化算法的船机桨匹配设计研究

陈振霖, 罗亮, 郑龙, 姬胜晨, 陈顺怀

计算机科学. 2024, 51 (6A): 230500157-9. doi:10.11896/jsjkx.230500157

摘要 ( 126 )

PDF(5623KB) ( 285 )

参考文献 | 相关文章 | 多维度评价

基于改进飞蛾扑火优化(Improved Moth-Flame Optimization,IMFO)算法,以两艘现有船舶为计算实例,展开了综合考虑螺旋桨推进效率、空泡性能和桨叶强度的船机桨匹配工作。以遗传算法(Genetic Algorithm,GA)和原始飞蛾扑火优化(Moth-Flame Optimization,MFO)算法为对比算法,分析了IMFO辅助船机桨匹配工作时的性能。数值实验的结果表明,在解决船机桨匹配问题时,IMFO算法的收敛时间相比GA算法在两个算例中分别缩短了44.24%和54.14%,相比MFO算法分别缩短了23.9%和23.12%。此外,在求解精度方面,在计算示例1中,IMFO算法相比GA算法和MFO算法略有提升;而在计算示例2中,IMFO算法相比GA算法提高了3.66%,较MFO算法提高了0.98%。最后,通过对两个算例的可行解空间进行可视化表示,进一步讨论了IMFO算法的求解性能。上述结果对比证明了IMFO算法具备强大的全局搜索能力,在解决船机桨匹配问题时具有良好的竞争力和鲁棒性。

基于改进自适应蚁群算法的移动机器人路径规划

魏书鑫, 王群京, 李国丽, 许家紫, 文彦

计算机科学. 2024, 51 (6A): 230500145-9. doi:10.11896/jsjkx.230500145

摘要 ( 204 )

PDF(4060KB) ( 356 )

参考文献 | 相关文章 | 多维度评价

针对传统的蚁群算法(Ant Colony Optimization,ACO)存在收敛速度慢、效率低、容易陷入局部最优值等缺点,提出了一种新的ACO变体。首先引入了一种新的具有方向信息的启发式机制,在迭代过程中添加方向指导,进一步提高了算法的收敛速度。其次,提出了一种改进的启发式函数,以增强目标的目的性并减少路径的转弯次数。然后,引入了一种改进的状态转移概率规则,提高了搜索效率并增加了种群多样性。此外,提出了一种不均匀分布初始信息素浓度的新方法,以避免盲目搜索。形成的新的ACO变体称为改进的自适应蚁群优化算法(Modified Adaptive Ant Colony Optimization,MAACO)。为了验证所提出的MAACO的有效性,基于3种不同的空间环境模式,与现有其他7种算法进行了一系列实验。在所有的仿真实验中,所提出的MAACO生成了标准偏差为零的最短路径,并且在最小收敛生成内实现了最少的转弯次数;就3个实验而言,其与最佳现有结果相比,转弯次数平均减少了两次,平均减少比例为22.2%。实验结果证明了MAACO在减少路径长度、减少转弯次数和提高收敛速度方面的优点和其在路径规划中的实用性和高效性。

基于多尺度卷积编码器的说话人验证网络

刘小湖, 陈德富, 李俊, 周旭文, 胡姗, 周浩

计算机科学. 2024, 51 (6A): 230700083-6. doi:10.11896/jsjkx.230700083

摘要 ( 222 )

PDF(2371KB) ( 333 )

参考文献 | 相关文章 | 多维度评价

说话人验证是一种有效的生物身份验证方法,说话人嵌入特征的质量在很大程度上影响着说话人验证系统的性能。最近,Transformer模型在自动语音识别领域展现出了巨大的潜力,但由于Transformer中传统的自注意力机制对局部特征的提取能力较弱,难以提取有效的说话人嵌入特征,因此Transformer模型在说话人验证领域的性能难以超越以往的基于卷积网络的模型。为了提高Transformer对局部特征的提取能力,文中提出了一种新的自注意力机制用于Transformer编码器,称为多尺度卷积自注意力编码器(Multi-scale Convolutional Self-Attention Encoder,MCAE)。利用不同尺度的卷积操作来提取多时间尺度信息,并通过融合时域和频域的特征,使模型获得更丰富的局部特征表示,这样的编码器设计对于说话人验证是更有效的。通过实验表明,在3个公开的测试集上,所提方法的综合性能表现更佳。与传统的Transformer编码器相比,MCAE也是更轻量级的,这更有利于模型的应用部署。

DRSTN:深度残差软阈值化网络

曹岩, 朱真峰

计算机科学. 2024, 51 (6A): 230400112-7. doi:10.11896/jsjkx.230400112

摘要 ( 121 )

PDF(3274KB) ( 270 )

参考文献 | 相关文章 | 多维度评价

在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能。神经网络“端到端”的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展。另外,神经网络模型往往需要较长的训练时间。为了提高深度残差网络模型的分类效果和训练效率,引入了模型迁移方法和软阈值化方法,提出了DRSTN(Deep Residual Soft Thresholding Network)网络,并对此网络结构进行微调,生成了不同版本的DRSTN网络。DRSTN网络的性能得益于3个方面的有机整合:1)通过梯度加权类激活映射(Gradients-weighted Class Activation Mapping,Grad-CAM)方法对网络的特征提取进行可视化,根据可视化结果挑选进一步优化的模型;2)基于模型迁移,研究人员不必全新地搭建模型,可以直接在已有的模型上进行优化,能够节省大量训练时间;3)软阈值化作为非线性变换层嵌入到深度残差网络体系结构中,以消除样本中不相关的特征。实验结果表明,在相同训练条件下,DRSTN_KS(3*3)_RB(2:2:2)网络在CIFAR-10数据集上的分类精度相比SKNet-18,ResNet18和ConvNeXt_tiny网络分别提高了15.5%,8.8%和10.9%;该网络也具有一定的泛化性,在MNIST和Fashion MNIST数据集上能够达到快速的迁移效果,分类精度分别达到99.06%和93.15%。

基于多策略改进的人工蜂鸟算法

李振, 冯锋

计算机科学. 2024, 51 (6A): 230500079-9. doi:10.11896/jsjkx.230500079

摘要 ( 187 )

PDF(4266KB) ( 360 )

参考文献 | 相关文章 | 多维度评价

针对人工蜂鸟算法(AHA)在迭代过程中出现全局勘探能力不足和收敛速度较慢的问题,提出了一种多策略改进的人工蜂鸟算法(IAHA)。首先,采用融合Tent混沌映射与反向学习的策略对种群进行初始化,生成高质量的初始种群,为算法全局寻优奠定基础;然后,在引导觅食阶段引入莱维飞行策略以提高全局搜索能力,使算法能够快速跳出局部最优,加快收敛速度;最后,将单纯形法引入算法中,在每一次迭代结束前对质量较差的种群进行处理,提高算法的局部寻优能力。将IAHA分别与4种基本算法、3种单改进阶段的人工蜂鸟算法、2种现有的改进人工蜂鸟算法进行对比,对8个基准测试函数进行仿真实验以及Wilcoxon秩和检验,对IAHA性能进行评估,并分析其时间复杂度。实验结果表明,与上述所提的算法相比,IAHA的收敛速度更快,全局寻优能力更强,算法性能更佳。

主实体增强型层叠指针网络在中文医学实体关系抽取中的应用

姜植瀚, 昝红英, 张莉

计算机科学. 2024, 51 (6A): 230800179-6. doi:10.11896/jsjkx.230800179

摘要 ( 153 )

PDF(2823KB) ( 310 )

参考文献 | 相关文章 | 多维度评价

随着中国医学事业的快速发展,中文医学文本的数量不断增加。为了从这些中文医学文本中提取有价值的信息,并解决中文医学领域的实体关系抽取问题,研究人员已经提出一系列基于双向LSTM的模型。然而,由于双向LSTM的训练速度等问题,文中引入了层叠指针网络框架来处理中文医学文本的实体关系抽取任务。为了弥补层叠指针网络框架中主实体识别能力不足以及解决复用编码层时的梯度问题,文中提出了主实体增强模块,并引入了条件层归一化方法,从而提出了面向中文医学文本的主语增强型层叠指针网络框架(Subject Enhanced Cascade Binary Pointer Tagging Framework for Chinese Medical Text,SE-CAS)。通过引入主实体增强模块,能够精确识别有效的主实体,并排除错误实体。此外,还使用条件层归一化方法来替代原模型中的简单相加方法,并将其应用于编码层和主实体编码层。实验结果证明,所提模型在CMeIE数据集上取得了5.73%的F1值提升。通过消融实验证实,各个模块均能带来性能提升,并且这些提升具有叠加效应。

基于DAN与FastText的藏文短文本分类研究

李果, 陈晨, 杨进, 群诺

计算机科学. 2024, 51 (6A): 230700064-5. doi:10.11896/jsjkx.230700064

摘要 ( 129 )

PDF(2772KB) ( 311 )

参考文献 | 相关文章 | 多维度评价

随着藏文信息不断融入社会生活,越来越多的藏文短文本数据存在网络平台上。针对传统分类方法在藏文短文本上分类性能低的问题,文中提出了一种基于DAN-FastText的藏文短文本分类模型。该模型使用FastText网络在较大规模的藏文语料上进行无监督训练获得预训练的藏文音节向量集,使用预训练的音节向量集将藏文短文本信息转化为音节向量,把音节向量送入DAN(Deep Averaging Networks)网络并在输出阶段融合经过FastText网络训练的句向量特征,最后通过全连接层和softmax层完成分类。在公开的TNCC(Tibetan News Classification Corpus)新闻标题数据集上所提模型的Macro-F1是64.53%,比目前最好评测结果TiBERT模型的Macro-F1得分高出2.81%,比GCN模型的Macro-F1得分高出6.14%,融合模型具有较好的藏文短文本分类效果。

基于不变图卷积神经网络的文本分类

黄瑞, 徐计

计算机科学. 2024, 51 (6A): 230900018-5. doi:10.11896/jsjkx.230900018

摘要 ( 169 )

PDF(2129KB) ( 328 )

参考文献 | 相关文章 | 多维度评价

文本分类是自然语言处理中一个基本而又重要的任务,近年来,图神经网络被越来越多地应用于文本分类中。然而,使用图神经网络的图表示学习在涉及文本分类的任务中不能很好地满足新词的归纳学习,其一般假设训练和测试数据来自相同的分布,但现实中这个假设经常不成立。为了克服这些问题,文中提出了Invariant-GCN,用于通过GCN进行归纳文本分类。首先为每个文档构建单个图,使用GCN根据其局部结构学习细粒度的单词表示,这可以有效地为新文档中没见过的单词生成嵌入进而将单词节点作为文档嵌入合并;然后提取最大限度地保留不变类内信息的期望子图,使用这些子图进行学习不受分布变化的影响;最后通过图分类方法完成文本分类。在4个基准数据集上与5种分类方法进行了比较,实验结果表明Invariant-GCN具有良好的文本分类效果。

基于Transformer的司法文书命名实体识别方法

王颖洁, 张程烨, 白凤波, 汪祖民

计算机科学. 2024, 51 (6A): 230500164-9. doi:10.11896/jsjkx.230500164

摘要 ( 185 )

PDF(3019KB) ( 355 )

参考文献 | 相关文章 | 多维度评价

命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础。目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决。相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现有的司法文书识别结果较低。因此,从以下3方面开展研究:首先,提出了一种多标签层级迭代的文本标注方式,可以对原始司法文书文本进行自动化标注,同时有效地提升司法文书命名实体识别任务的实体识别效果;其次,提出了一种交融式的Transformer神经网络模型,对汉字固有属性的深层特征进行了充分利用,用于对司法文书进行命名实体识别;最后,对所提出的标注方法和模型与其他神经网络模型进行了对比实验。所提出的文本标注方式可以较为准确地实现司法文书的标注任务;同时,所提出的模型在通用数据集中相对于对照模型有较大的提高,并在司法领域数据集中取得了良好的效果。

融合BERT模型与词汇增强的中医命名实体识别模型

李旻哲, 殷继彬

计算机科学. 2024, 51 (6A): 230900030-6. doi:10.11896/jsjkx.230900030

摘要 ( 221 )

PDF(2711KB) ( 437 )

参考文献 | 相关文章 | 多维度评价

现有的中医命名实体识别相关研究较少,基本都是基于中文病例做相关研究,在传统中医编写的病例文本中表现不佳。针对中医案例中命名实体密集且边界模糊难以划分的特点,提出了一种融合词汇增强和预训练模型的中医命名实体识别方法LEBERT-BILSTM-CRF。该方法从词汇增强和预训练模型融合的角度进行优化,将词汇信息输入到BERT模型中进行特征学习,达到划分词类边界和区分词类属性的目的,提高中医医案命名实体识别的精度。实验结果表明,在文中构建的中医病例数据集上针对10个实体进行命名实体识别时,提出的基于LEBERT-BILSTM-CRF的中医案例命名实体识别模型综合准确率、召回率、F1分别为88.69%,87.4%,88.1%,高于BERT-CRF,LEBERT-CRF等常用命名实体识别模型。

融合标签知识的中文医学命名实体识别

尹宝生, 周澎

计算机科学. 2024, 51 (6A): 230500203-7. doi:10.11896/jsjkx.230500203

摘要 ( 148 )

PDF(2602KB) ( 315 )

参考文献 | 相关文章 | 多维度评价

医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学领域命名实体识别模型很容易出现识别错误的情况。为解决这一难题,文中提出了一种融合标签知识的中文医学命名实体识别方法,即通过专业领域词典获得文本标签的释义后,分别将文本、标签及标签释义编码,基于自适应融合机制进行融合,有效平衡特征提取模块和语义增强模块的信息流,从而提高模型性能。其核心思想在于医学实体标签是通过总结归纳大量医学数据得到的,而标签释义是对标签进行科学解释和说明的结果,模型融入这些蕴含了丰富的医学领域内的先验知识,可以使其更准确地理解实体在医学领域中的语义并提升其识别效果。实验结果表明,该方法在中文医学实体抽取数据集(CMeEE-V2) 3个基线模型上分别取得了0.71%,0.53%和1.17%的提升,并且为小样本场景下的实体识别提供了一个有效的解决方案。

融合HousE和注意力机制的知识推理模型

朱玉亮, 刘俊涛, 饶子昀, 张毅, 曹万华

计算机科学. 2024, 51 (6A): 230600209-8. doi:10.11896/jsjkx.230600209

摘要 ( 163 )

PDF(1997KB) ( 301 )

参考文献 | 相关文章 | 多维度评价

知识推理技术是解决知识图谱缺失问题所提出的方法,并在近年来不断发展。为了解决推理中准确度低、可解释性差、适用性不强等问题,提出了一种融合注意力机制和HousE的知识推理模型Att-HousE。该模型由一个带注意力机制的规则生成器和一个带HousE嵌入的规则预测器组成,规则生成器生成推理需要的规则并传入预测器,预测器更新并得到不同规则的得分,然后通过EM算法不断训练优化生成器与预测器。具体而言,该模型是建立在RNNLogic的基础上并作出改进,注意力机制可以选取更值得关注的关系作为规则,提高了模型准确度,HousE嵌入则在处理复杂关系上更具有灵活性,并适用于建立多边关系。在公开实验数据集上的结果表明,Att-HousE在FB15K-237上做推理任务时,MRR指标整体比RNNLogic高出6.3%;在稀疏数据集WN18RR上,Hits@10指标整体比RNNLogic高出2.7%,证明了引入HousE和注意力机制后可以更全面地抓取和形成多边关系,提升知识推理的精度。

结合对话状态信息的个性化对话回复生成

桂海涛, 王中卿

计算机科学. 2024, 51 (6A): 230800055-7. doi:10.11896/jsjkx.230800055

摘要 ( 147 )

PDF(2284KB) ( 268 )

参考文献 | 相关文章 | 多维度评价

尽管个性化回复生成模型取得了显著成功,但这些研究都未能很好地考虑到对话状态信息对于个性化对话回复的影响。针对此问题,基于预训练生成模型提出了结合对话状态的自监督对话回复生成模型,该模型可以有效地对结合对话状态生成个性化的回复。首先,将对话状态纳入情景喜剧数据集中,以增强模型对上下文信息的理解能力。其次,采用自监督的训练技术,赋予预训练语言生成模型独特的对话文本特征知识,并采用多种掩码策略合并对话文本和对话状态,进一步提升模型性能。最后,基于历史对话,使用自监督生成模型生成个性化回复。在自行收集的情景喜剧数据集上进行性实验,结果表明,结合对话状态的对话回复生成模型在多项指标上优于一些强基准,进而证明了对话状态和个性化回复生成模型的有效性。

基于改进TF-IDF与BERT的领域情感词典构建方法

蒋昊达, 赵春蕾, 陈瀚, 王春东

计算机科学. 2024, 51 (6A): 230800011-9. doi:10.11896/jsjkx.230800011

摘要 ( 226 )

PDF(2427KB) ( 348 )

参考文献 | 相关文章 | 多维度评价

领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。

融合主题特征的文本情感分析模型

杨俊哲, 宋莹, 陈逸菲

计算机科学. 2024, 51 (6A): 230600111-8. doi:10.11896/jsjkx.230600111

摘要 ( 187 )

PDF(3199KB) ( 363 )

参考文献 | 相关文章 | 多维度评价

随着大型语言模型的快速发展,如何在保证模型性能的同时减少模型参数量,成为了自然语言处理领的一个重要挑战。然而,现有的参数压缩技术往往难以兼顾模型的稳定性和泛化能力。为此,提出了一种融合主题特征的情感分析新架构,旨在利用主题信息增强模型对文本情感极性的判断能力。具体而言,采用一种结合LDA和K-means的方法来提取文本的主题特征,并将其作为固定维度的向量与词嵌入进行拼接,得到新的词向量表示。随后使用平均池化技术构建句子级别的表征向量,并输入到一个全连接层进行情感分类。为了验证所提模型的有效性,在公开的情感分析数据集上与多个基准算法进行了对比实验。实验结果表明,所提模型在多个数据集上明显优于ALBERT,准确率提高了约3.5%,在参数量仅有微小增加的情况下维持了较高的稳定性和泛化能力。

远程模板检测算法及其在蛋白质结构预测中的应用

梁方, 徐旭瑶, 赵凯龙, 赵炫锋, 张贵军

计算机科学. 2024, 51 (6A): 230600225-7. doi:10.11896/jsjkx.230600225

摘要 ( 131 )

PDF(3594KB) ( 285 )

参考文献 | 相关文章 | 多维度评价

在从传统力场驱动的蛋白质结构预测到当前数据驱动的AI结构建模的发展历程中,蛋白质结构模板检测是蛋白质结构预测中的关键环节,如何检测高精度蛋白质结构远程模板对提升结构的预测精度具有重要的研究意义。该研究提出了一种基于自适应特征向量提取的远程同源模板检测算法ASEalign。首先,采用多特征信息融合的深度学习技术预测蛋白质接触图;然后,设计了融合接触图、二级结构、序列谱谱比对和溶剂可及性等多维度特征打分函数,并通过自适应地提取接触图矩阵中的特征值和特征向量进行模板比对;最后,将检测出的高质量模板输入AlphaFold2中进行结构建模。在135个蛋白质的测试集上的结果表明,ASEalign相于主流的模板检测算法HHsearch精度提升了11.5%;同时,结构建模的精度优于AlphaFold2。

结合预训练的多文档摘要研究

丁一, 王中卿

计算机科学. 2024, 51 (6A): 230300160-8. doi:10.11896/jsjkx.230300160

摘要 ( 136 )

PDF(2977KB) ( 293 )

参考文献 | 相关文章 | 多维度评价

新闻文本摘要任务旨在从庞大复杂的新闻文本中快速准确地提炼出简明扼要的摘要。基于预训练语言模型对多文档摘要进行研究,重点研究结合预训练任务的具体模型训练方式对模型效果提升的作用,强化多文档之间的信息交流,以生成更全面、更简练的摘要。对于结合预训练任务,提出对基线模型、预训练任务内容、预训练任务数量、预训练任务顺序的对比实验,探索标记了行之有效的预训练任务,总结归纳了强化多文档之间的信息交流的具体方法,精炼提出了简明高效的预训练流程。在公开新闻多文档数据集上进行训练和测试,实验结果表明预训练任务的内容、数量、顺序对ROUGE值都有一定提升,并且整合三者结论提出的特定预训练组合对ROUGE值有明显提升。

基于集成学习的跨语言文本主题发现方法研究

李帅, 于娟, 巫邵诚

计算机科学. 2024, 51 (6A): 230300201-8. doi:10.11896/jsjkx.230300201

摘要 ( 127 )

PDF(3202KB) ( 288 )

参考文献 | 相关文章 | 多维度评价

跨语言文本主题发现是跨语言文本挖掘领域的重要研究方向,对跨语言文本分析和组织各种文本数据具有较高的应用价值。基于Bagging和跨语言词嵌入改进LDA主题模型,提出跨语言文本主题发现方法BCL-LDA(Bagging,Cross-lingual word embedding with LDA),从多语言文本中挖掘关键信息。该方法首先将Bagging集成学习思想与LDA主题模型结合生成混合语言子主题集;然后利用跨语言词嵌入和K-means算法对混合子主题进行聚类分组;最后使用TF-IDF算法对主题词进行过滤排序。汉语-德语、汉语-法语主题发现实验表明,该方法在主题连贯性和多样性方面均表现优异,能够提取出语义更加相关且主题更加连贯多样的双语主题。

路径规划问题的多策略改进樽海鞘群算法研究

赵宏伟, 董昌林, 丁兵如, 柴海龙, 潘志伟

计算机科学. 2024, 51 (6A): 230600083-9. doi:10.11896/jsjkx.230600083

摘要 ( 193 )

PDF(4715KB) ( 273 )

参考文献 | 相关文章 | 多维度评价

针对移动机器人寻找最优路径问题,提出了一种融合无标度网络、自适应权重和黄金正弦算法变异策略的樽海鞘群算法BAGSSA(Adaptive Salp Swarm Algorithm with Scale-free of BA Network and Golden Sine)。首先,生成一个无标度网络来映射跟随者的关系,增强算法全局寻优的能力,在追随者进化过程中集成自适应权重ω,以实现算法探索和开发的平衡;同时选用黄金正弦算法变异进一步提高解的精度。其次,对12个基准函数进行仿真求解,实验数据表明平均值、标准差、Wilcoxon检验和收敛曲线均优于基本樽海鞘群和其他群体智能算法,证明了所提算法具有较高的寻优精度和收敛速度。最后,将BAGSSA应用于移动机器人路径规划问题中,并在两种测试环境中进行仿真实验,仿真结果表明,改进樽海鞘群算法较其他算法所寻路径更优,并具有一定理论与实际应用价值。

基于注意力机制和提示学习联合训练的上下位关系识别研究

白宇, 王新哲

计算机科学. 2024, 51 (6A): 230700226-5. doi:10.11896/jsjkx.230700226

摘要 ( 123 )

PDF(1921KB) ( 282 )

参考文献 | 相关文章 | 多维度评价

专利术语间的上下位关系是一种重要的语义关系,专利文本中术语间的上下位关系识别在专利检索、查询扩展、知识图谱构建等多个领域发挥着重要作用。然而,专利文本领域的多样性、语言表述的复杂性使得术语间的上下位关系识别仍然面临许多挑战。文中提出一种融合提示学习和注意力机制的术语上下位关系识别方法,该方法基于远程监督框架,将术语之间的最短依存路径作为辅助特征融入提示模板,使用图神经网络将术语间的共现信息融入提示学习和注意力机制联合训练过程。在专利文本测试数据集上的实验结果表明,所提方法的AUC值、F1值达到94.94%和89.33%,相较于PARE模型分别提升了3.82%和3.17%。该方法有效地去除了使用远程监督方法标注的数据集的噪声,避免了掩码语言模型的训练目标和下游任务的不匹配问题,充分利用了预训练语言模型中存在的语言知识信息。

融合证据句子提取的文档级关系抽取

安先跨, 肖蓉, 杨肖

计算机科学. 2024, 51 (6A): 230800081-6. doi:10.11896/jsjkx.230800081

摘要 ( 192 )

PDF(2144KB) ( 285 )

参考文献 | 相关文章 | 多维度评价

文档级关系抽取作为自然语言处理领域的一个关键任务,旨在从长文档中准确抽取实体对之间的语义关系。传统的文档级关系抽取方法通常将整个文档作为输入,但事实上,人类只需根据文档中的部分句子即可预测实体对的关系,即证据句子。在现有研究中,很多研究方法都利用了证据句子,但是都存在无法找全以及很难充分利用这些证据句子的优势等问题。针对该问题,引入更加高效且准确的证据句子选取方法,通过融合公式法和删句法的证据句子提取策略,并将证据提取与训练推理过程相融合,使得文档级关系抽取模型更加关注重要的句子,同时仍可以识别文档中的完整信息。实验表明,改进后的模型在公共数据集上的表现优于已有模型。

基于图卷积和注意力神经网络的旅行商问题新解法

韦念念, 韩曙光

计算机科学. 2024, 51 (6A): 230700222-8. doi:10.11896/jsjkx.230700222

摘要 ( 145 )

PDF(3158KB) ( 330 )

参考文献 | 相关文章 | 多维度评价

旅行商问题是一个经典的组合优化问题。为快速求解旅行商问题,设计了由图嵌入网络、图卷积神经网络、注意力神经网络和多层感知机组合而成的深度学习模型的学习分支规则,通过改进传统的分支定界算法提高算法性能。对15个城市的旅行商问题实例进行监督训练,并在SCIP求解器上分别测试10,15,20,25和30个城市的旅行商问题实例。发现:基于学习分支规则的分支定界算法的求解时间比基于传统分支规则的分支定界算法的求解时间分别快－0.0022s,0.0178s,1.7643s,2.3074s和2.0538s。因此,基于图神经网络的分支变量选择对传统分支规则的改进是有效的,可以较好地泛化到训练规模更大的旅行商问题实例中。

图片模糊集的一种相似度量及其在模式识别中的应用

高建雷, 罗敏霞

计算机科学. 2024, 51 (6A): 230500153-5. doi:10.11896/jsjkx.230500153

摘要 ( 137 )

PDF(1884KB) ( 323 )

参考文献 | 相关文章 | 多维度评价

图片模糊集能刻画具有模糊性、不确定性和不一致性的信息,相似度量是刻画两个对象的相似程度。文中研究图片模糊集的相似度量。考虑图片模糊集3个隶属度的信息差,基于指数函数构造出一种新的相似度量。文中提出的相似度量不仅满足相似度量的公理化定义,并且在实际应用中得到合理的计算结果。将相似度量应用到模式识别中,与现存的一些相似度量进行对比分析,结果表明所提出的相似度量不仅可以弥补一些现存相似度量的缺陷,还可以得到合理的计算结果。

基于Electra预训练模型并融合依存关系的中文事件检测模型

尹宝生, 孔维一

计算机科学. 2024, 51 (6A): 230600158-6. doi:10.11896/jsjkx.230600158

摘要 ( 140 )

PDF(2413KB) ( 290 )

参考文献 | 相关文章 | 多维度评价

事件检测是信息提取领域的一个重要研究方向。现存的事件检测模型受到语言模型训练目标的限制,只能被动地获取词与词之间的依赖关系,使得模型在训练的过程中过多地关注与训练目标不相关的成分,从而导致检测结果错误。以往的研究表明,充分理解上下文信息对于基于深度学习的事件检测技术至关重要。因此,在Electra预训练模型的基础上,引入KVMN网络来捕捉单词之间的依赖关系,以增强单词的语义特征,并采用了一种门控机制来加权这些特征。然后,为了解决中文事件检测中模型识别错误决策的问题,在输入中加入负样本,对不同样本加入不同程度的噪声,使模型学习更好的嵌入表示,有效提高了模型对未知样本的泛化能力。最后,在公共数据集LEVEN上的实验结果表明,该方法优于现有方法,取得了93.43%的F1值。

基于深度强化学习的自学习排课遗传算法研究

徐海涛, 程海燕, 童名文

计算机科学. 2024, 51 (6A): 230600062-8. doi:10.11896/jsjkx.230600062

摘要 ( 211 )

PDF(2527KB) ( 411 )

参考文献 | 相关文章 | 多维度评价

排课是教学活动中一项常规而重要的事项,传统的人工排课方式费时费力,且容易出现错误,无法满足大规模排课的需求,而经典排课遗传算法存在收敛速度过快、排课效率随约束因素的增加而下降等问题。针对已有排课遗传算法存在的问题,提出一种基于深度强化学习的自学习排课遗传算法(GA-DRL)。GA-DRL算法利用Q-learning算法,实现了交叉参数和变异参数的自适应调整,增强了遗传算法的搜索能力,通过建立马尔可夫决策过程(MDP)的参数动态调整模型,对种群适应度函数进行状态集合的分析,实现对种群的整体性能的综合评价。同时将深度Q-网络算法(DQN)引入调度问题中,以解决排课中种群状态多、Q表数据量大的问题。实验结果表明,与经典排课遗传算法和改进的遗传算法相比,GA-DRL算法在正确率和寻优能力上有所提升。所提算法还可以应用于考场安排、电影院的排座和航空航线规划等问题。

基于双重方向向量的大规模多目标进化算法

韩立君, 王鹏, 李瑞旭, 刘仲尧

计算机科学. 2024, 51 (6A): 230700155-11. doi:10.11896/jsjkx.230700155

摘要 ( 156 )

PDF(2758KB) ( 300 )

参考文献 | 相关文章 | 多维度评价

大规模多目标优化问题的决策空间维度高达数百维,在巨大的搜索空间中实现快速收敛同时高效保持种群多样性极具挑战。针对上述问题,文中提出了一种基于双重方向向量的大规模多目标进化算法(DDLE),该算法的主要思想是利用两类不同的方向向量引导种群进化,提高算法的搜索效率。首先,设计了一种收敛性方向向量生成策略提升算法的收敛速度;其次,推出了一种多样性方向向量生成策略增强种群的多样性;最后,提出了一种基于自适应的环境选择算子动态平衡种群进化过程中的收敛性与多样性。为验证DDLE的性能,将其与5种先进的算法在72个大规模基准测试问题上进行了对比实验。实验结果表明,DDLE在求解大规模多目标优化问题上相较于其它对比算法具有显著优势。

面向工艺实体识别的双向神经概率转换器

李瑞婷, 王裴岩, 王立帮, 杨丹清忻

计算机科学. 2024, 51 (6A): 230700206-8. doi:10.11896/jsjkx.230700206

摘要 ( 123 )

PDF(2993KB) ( 263 )

参考文献 | 相关文章 | 多维度评价

工艺实体识别旨在识别出产品制造中所遵照或是产生的文本中蕴含的零件、材料、属性和属性值等实体。目前,工艺等领域实体识别大多加入词典或正则规则等领域实体先验知识,修正神经网络模型识别结果或是生成预识别特征加入模型中。但上述方法未能实现领域实体识别的先验知识与神经网络模型统一建模,领域知识的加入没有减小模型训练代价,仍需大量标注数据。为解决上述问题,提出了面向工艺实体识别的双向神经概率转换器(Bi-NPT),将工艺实体识别先验知识建模为正则规则,然后将正则规则转化为参数化的概率有限状态转换器,使得模型在训练前带有实体识别的先验知识,同时具有可训练性。通过在标注数据上的训练,模型能够习得正则规则未覆盖实体的识别能力。实验结果表明,提出的Bi-NPT在未训练的情况下与正则规则实体识别效果相当,这表明未经过训练的初始模型即携带了实体识别知识。在小样本条件下,Bi-NPT优于PER,Template-based BART和NNShot方法;在充足样本条件下,Bi-NPT优于BiLSTM与TENER等方法。

一种基于异构图神经网络和文本语义增强的实体关系抽取方法

彭勃, 李耀东, 龚贤夫, 李浩

计算机科学. 2024, 51 (6A): 230700071-5. doi:10.11896/jsjkx.230700071

摘要 ( 162 )

PDF(1988KB) ( 334 )

参考文献 | 相关文章 | 多维度评价

信息化时代,如何从海量自然语言文本中提取结构化信息已经成为研究热点。电力系统中繁杂的知识信息需要通过构建知识图谱来解决,而实体关系抽取是其上游的信息抽取任务,其完成度直接关系到知识图谱的有效性。而随着深度学习的不断发展,利用深度学习技术来完成实体关系抽取任务的研究逐渐展开并取得了良好的效果。然而目前依然存在文本语义应用不完全等问题。针对这些问题本文尝试提出了一种基于异构图神经网络和文本语义增强的实体关系抽取方法,该方法使用词节点与关系节点学习语义特征,并通过BRET与预训练任务分别获得两种节点的初始特征,使用多层图网络结构迭代更新,并在每一层中使用基于多头注意力机制的信息传递实现两种节点的交互。通过该模型与其他实体关系抽取在两个公开数据集上实验对比,所提模型取得了预期效果,在多种情境下普遍优于对比模型。

基于混沌映射的改进金枪鱼群优化算法对比研究

尹萍, 谈果戈, 宋伟, 谢涛涛, 姜建彪, 宋洪圆

计算机科学. 2024, 51 (6A): 230600082-10. doi:10.11896/jsjkx.230600082

摘要 ( 193 )

PDF(6227KB) ( 332 )

参考文献 | 相关文章 | 多维度评价

Kubernetes作为当前云资源管理的标准平台,因其默认调度机制的局限性,目前普遍采用基于群智能优化算法的改进方法进行Pod的调度。而针对群智能优化算法存在的寻优性能易受初值影响、迭代后期容易早熟收敛等问题,选择金枪鱼群优化(Tuna Swarm Optimization,TSO)作为基础算法,根据混沌映射具有的遍历性、随机性等特点,提出了基于混沌映射的种群初始化优化方案。选择目前研究中普遍涉及的Tent、Logistic等多种混沌映射,分别对金枪鱼种群进行初始化,以提高初始种群的多样性。通过一系列基准测试函数进行仿真实验,对比基于不同混沌映射的改进金枪鱼群优化算法的实验结果,证明了基于混沌映射的优化方案可以有效提高原始TSO算法的收敛速度和寻优精度。

深度学习驱动的水下图像处理研究进展

张天驰, 刘宇轩

计算机科学. 2024, 51 (6A): 230400107-12. doi:10.11896/jsjkx.230400107

摘要 ( 239 )

PDF(3749KB) ( 344 )

参考文献 | 相关文章 | 多维度评价

随着人工智能和水下设备的发展,水下机器人能够便捷地获取水下图像。水下图像对于海洋的探索和开发等活动至关重要,但由于水下成像环境十分复杂,导致获取到的水下图像成像质量较低,具有低对比度、模糊和颜色失真等退化问题,难以满足水下生产活动的要求。近年来,基于深度学习的水下图像处理方法和质量评价指标发展迅速,受到诸多学者的关注。目前已有基于深度学习的水下图像处理方法的综述,但仍存在总结不够全面及缺少最新研究成果等问题。因此,文中首先分析水下图像退化成因并提出所需处理的问题,根据各类算法的原理特点将水下图像处理方法进行分类;其次,详细分析和归纳了基于深度学习的水下图像处理最新研究成果,总结出各类算法的主要特征;然后,详细整理了现有的公开水下图像数据集和当前主流以及最新的基于学习的水下图像质量评测指标,并通过设计实验将传统算法和基于深度学习的水下图像处理方法进行对比分析;最后,分析总结了一些水下图像处理领域尚未解决的问题,并对未来的发展方向进行展望。

面向图像数据的ConvNeXt特征提取研究

杨鹏跃, 王锋, 魏巍

计算机科学. 2024, 51 (6A): 230500196-7. doi:10.11896/jsjkx.230500196

摘要 ( 194 )

PDF(2915KB) ( 359 )

参考文献 | 相关文章 | 多维度评价

卷积神经网络在计算机视觉任务中已取得诸多成果,无论是目标检测还是分割,都依赖于提取到的特征信息,一些模糊性的数据和物体形状各异等问题为特征提取带来了极大的挑战。传统的卷积结构只能学习到特征图相邻空间位置的上下文信息,无法对全局信息进行提取,而自注意力机制等模型虽具有更大的感受野和建立全局的依赖关系,但存在计算复杂度过高和需要大量数据等不足。为此,提出了一种CNN与LSTM结合的模型,该模型在增强局部感受野的前提下,可以更好地结合图像数据的全局信息。研究以主干网络ConvNeXt-T为基础模型,通过拼接不同大小卷积核以融合多尺度特征来解决物体形状各异的问题,并从水平和垂直两个方向聚合双向长短期记忆网络关注全局与局部信息的交互性。实验对公开访问的CIFAR-10,CIFAR-100,Tiny ImageNet数据集进行图像分类任务,所提出的网络在3个数据集实验中相较于基础模型ConvNeXt-T在准确率上分别提高了3.18%,2.91%,1.03%。实验证明改进后的ConvNeXt-T网络相较于基础模型在参数量和准确性方面都有了大幅度提升,可提取到更加有效的特征信息。

基于增量学习的多尺度钢材微观组织图像分类

曾培益

计算机科学. 2024, 51 (6A): 230500180-8. doi:10.11896/jsjkx.230500180

摘要 ( 162 )

PDF(4307KB) ( 320 )

参考文献 | 相关文章 | 多维度评价

钢铁材料微观组织决定了钢的力学性能,因此对钢材微观组织的识别十分重要。钢铁材料显微组织图片放大倍数差异大,同种微观组织在不同放大倍数下的形貌也有很大差别,对持续扩充的多尺度钢材微观组织数据集进行分类的难度很大。因此,结合VGG16网络和自组织增量神经网络(Self Organizing Incremental Neural Network,SOINN),构建基于增量学习的多尺度钢材微观组织图像分类模型;同时,提出基于中心距离的交叉熵损失(Cross Entropy Loss based on Center Distance,CELCD)和交叉训练策略,并融合交叉训练、CELCD和Anchor loss克服“灾难性遗忘”问题,实现对钢材微观组织图片数据的持续学习和高效分类。实验比较了不同增量学习方法在旧数据上的分类精度和“遗忘程度”,结果表明,在增量学习后所提方法的预测精度较增量学习前仅下降14.02% 的前提下,在旧数据上的分类精度最高可达80.49%,与上限精度仅相差5.49%,优于其他增量学习方法。

基于跨语言迁移学习及联合训练的泰语语音合成

张欣瑞, 杨鉴, 王展

计算机科学. 2024, 51 (6A): 230500174-7. doi:10.11896/jsjkx.230500174

摘要 ( 229 )

PDF(3772KB) ( 346 )

参考文献 | 相关文章 | 多维度评价

随着深度学习和神经网络的快速发展,基于深度神经网络的端到端语音合成系统因性能优异成为主流。然而近年来,泰语语音合成相关研究还不充分,主要原因是大规模泰语数据集稀缺且该语言拼写方式有其特殊性。为此,在低资源前提下基于FastSpeech2声学模型和StyleMelGAN声码器研究泰语语音合成。针对基线系统中存在的问题,提出了3个改进方法以进一步提高泰语合成语音的质量。(1)在泰语语言专家指导下,结合泰语语言学相关知识设计泰语G2P模型,旨在处理泰语文本中存在的特殊拼写方式;(2)根据所设计的泰语G2P模型转换的国际音标表示的音素,选择拥有相似音素输入单元且数据集丰富的语言进行跨语言迁移学习来解决泰语训练数据不足的问题;(3)采用FastSpeech2和StyleMelGAN声码器联合训练的方法解决声学特征失配的问题。为了验证所提方法的有效性,从注意力对齐图、客观评测MCD和主观评测MOS评分3方面进行测评。实验结果表明,使用所提泰语G2P模型可以获得更好的对齐效果进而得到更准确的音素持续时间,采用“所提泰语G2P模型+联合训练+迁移学习”方法的系统可以获得最好的语音合成质量,合成语音的MCD和MOS评分分别为7.43±0.82分和4.53分,明显优于基线系统的9.47±0.54分和1.14分。

基于多尺度特征的地基云图分类检测算法

孙继飞, 贾克斌

计算机科学. 2024, 51 (6A): 230400041-6. doi:10.11896/jsjkx.230400041

摘要 ( 155 )

PDF(2957KB) ( 302 )

参考文献 | 相关文章 | 多维度评价

地基云的自动识别方法和技术为气象分析中的云状识别和云量估计任务提供了重要的手段和依据。然而,对这两种任务的研究往往独立,互不相干,导致地基云图的分类与分割技术无法有效地结合使用。特别是当云图中出现多类云状时,现有技术难以按不同云类分别划分区域并进行云量计算。为了解决这一问题,提出用基于深度学习的语义分割方法实现对地基云图的按类分割。首先,构建了地基云图语义分割数据集GBCSS,该数据集包含3000幅云图,共计11个类别。在此基础上,提出了一种基于U型神经网络的改进方案UNet-PPM作为地基云图语义分割模型。为了增强网络对云的轮廓特征提取能力,引入了金字塔池化模块。该模块提取并聚合了不同尺度的图像特征,提升了网络获取全局信息的能力。最后,将设计的网络在GBCSS上进行了训练以及评估,其在测试集上达到了91.5%的像素准确率。与U-Net相比,UNet-PPM在像素准确率上有5.4%的提升,表明该网络对云的轮廓特征提取的能力更强,以及语义分割应用在地基云图中的可行性。

基于聚类优化学习的少样本图像分类

苏如祺, 卞雄, 朱松豪

计算机科学. 2024, 51 (6A): 230300227-7. doi:10.11896/jsjkx.230300227

摘要 ( 120 )

PDF(3123KB) ( 305 )

参考文献 | 相关文章 | 多维度评价

少样本图像分类的目标是在训练少量标记训练数据的基础上实现新类别图像的分类,然而这一目的在现有条件下很难实现。因此,目前的少样本学习方法主要借鉴迁移学习的思想,其核心是利用情景训练式的元训练构建先验知识,从而解决未知新任务。然而,研究工作表明,相较于复杂的少样本学习方法,具有强大特征表示的嵌入模型学习方法更为简单、有效。受此启发,提出一种新的基于直推式聚类优化学习的少样本图像分类方法。该方法首先利用样本数据的内部特征结构信息实现每个类别的综合表示;然后优化每个类别的中心,形成更具区别性的特征表示,从而有效增加不同类别之间的特征差异。大量实验结果表明,所提的基于直推式聚类优化学习的少镜头图像分类方法有效提高了各种训练条件下的图像分类精度。

基于注意力机制与密集邻域预测的轻量化图像语义分割

王国刚, 董志豪

计算机科学. 2024, 51 (6A): 230300204-8. doi:10.11896/jsjkx.230300204

摘要 ( 136 )

PDF(3847KB) ( 288 )

参考文献 | 相关文章 | 多维度评价

DeepLabv3+计算复杂度高,空洞空间金字塔池化模块难以突出重要通道特征,解码器生成的高语义化特征图缺乏足够的细节信息。针对上述问题,提出一种基于注意力机制与密集邻域预测的轻量化图像语义分割模型。该模型把MobileNet V2作为主干网络,减少了模型参数量;利用通道空洞空间金字塔池化提取多尺度信息,并对特征图的各通道加权,强化重要通道特征的学习;采用密集邻域预测融合高级特征与低级特征,细化分割结果。在PASCAL VOC 2012增强数据集上进行实验,结果表明,所提方法的平均交并比和平均像素精确度均高于其他7种主流对比算法。与DeepLabv3+相比,参数量与计算量分别减少184.82×10⁶和90.83GFLOPs,该算法在提升分割精度的同时减少了计算开销。

基于快速傅里叶卷积与特征修剪坐标注意力的壁画修复

张乐, 余映, 革浩

计算机科学. 2024, 51 (6A): 230400083-9. doi:10.11896/jsjkx.230400083

摘要 ( 130 )

PDF(10264KB) ( 297 )

参考文献 | 相关文章 | 多维度评价

针对现存古代壁画长时间自然风化引起的不同程度的裂缝、脱落等病害,人工修复成本过高,而目前已有的壁画修复方法大多都存在框架复杂、耗费算力大,并且修复色彩不够准确和质量不够高等问题,提出了一种以快速傅里叶卷积和坐标注意力为框架的生成对抗网络用于修复工作。该方法将待修复壁画图像和掩码输入该网络,经编码器后传入用于特征推理的残差模块以推理出待修复区域的合理内容;训练过程中由特定的用于修复任务的鉴别器进行对抗训练,最终达到修复效果。所提模型中的特征推理部分为一个包含门控残差连接、6个快速傅里叶卷积模块和改进的特征修剪坐标注意力模块的残差块,具有较大的感受野和提取丰富特征的能力,可解决当前方法所存在的修复结果不佳的问题。在自制数据集下进行实验,与现有几种经典的修复方法进行对比的结果表明,所提算法不仅结构简单,还有着更优秀的修复能力,可应用于古代壁画修复工作,可节省大量的人工成本。

面向3D肝脏CT图像分割的改进vnet模型

杨舒琪, 韩俊玲, 康晓东, 杨靖怡, 郭洪洋, 李博

计算机科学. 2024, 51 (6A): 230400038-6. doi:10.11896/jsjkx.230400038

摘要 ( 169 )

PDF(3921KB) ( 371 )

参考文献 | 相关文章 | 多维度评价

分割3D医学影像是放疗计划的重要步骤。临床上,计算机断层扫描被广泛应用于肝脏及肝肿瘤的3D 医学影像图像分割。由于肝脏复杂的边缘结构及纹理特征,肝脏分割仍是一项具有挑战性的工作。针对这一问题,提出了一种面向3D肝脏CT图像精准分割的改进vnet模型。首先,将肝脏CT图像进行HU值截断和重采样,以完成三维数据集的预处理;同时,将vnet解码器和编码器中的卷积核替换为SG模块,即逐通道卷积和逐点卷积的组合,以减小网络模型的参数量。与vnet模型进行对比实验,结果表明该模型方法在肝脏分割数据集上的评估结果总体优越,Dice系数为94.93%,比vnet模型提高了3.49%,大大减少了模型的参数量;同时该方法在MSD脾脏分割数据集和新冠肺炎数据集上也表现出良好的鲁棒性并取得了优越的分割结果。

基于双流卷积神经网络的稻米缺陷分割

吴一博, 郝应光, 王洪玉

计算机科学. 2024, 51 (6A): 230600107-8. doi:10.11896/jsjkx.230600107

摘要 ( 132 )

PDF(4290KB) ( 279 )

参考文献 | 相关文章 | 多维度评价

目前水稻质量精细化评估因为没有水稻缺陷精细化检测相关工作而无法实现,传统的水稻质量评估都是基于粗略的缺陷有无分类而实现的。针对水稻缺陷像素级分类问题,提出了一种基于深度学习的水稻缺陷分割模型,该模型使用了一个改进的DoubleU-Net网络作为主要架构,分为NETWORK1和NETWORK2两部分,其中NETWORK1是基于VGG-19修改的U型网络结构,而NETWORK2是基于Swin Transformer修改的U型网络结构,将这两部分串联起来,同时融合CNN局部信息提取和Transformer全局信息提取的优势,可以更好地捕捉图像的上下文信息。同时,使用了多重损失函数,包括加权的二元交叉熵损失、加权的交并比损失和一个无需训练的智能损失网络,在提高模型训练稳定性的同时进一步提高了模型分割的精度。在制作的密集水稻缺陷数据集上进行训练测试,该模型均取得了较其他方法更好的分割性能,具有鲁棒性和较好的泛化能力。

基于多距离测度异质集成学习的结肠病理图像细粒度分类研究

梁美彦, 范莹莹, 王琳

计算机科学. 2024, 51 (6A): 230400043-7. doi:10.11896/jsjkx.230400043

摘要 ( 117 )

PDF(3407KB) ( 290 )

参考文献 | 相关文章 | 多维度评价

结肠病理学图像的细粒度分类对癌症治疗和预后评估都具有重要意义。然而,结肠病理学图像尤其是其组织学亚型图像在形态上极为相似,通过人工的方法进行高精度识别面临着巨大的挑战。而基于单个模型的计算机辅助诊断方法容易产生预测偏差。为此,提出了多距离测度异质集成学习的细粒度分类方法对结肠病理学微卫星状态进行分型预测。该方法分别通过余弦距离、曼哈顿距离与欧氏距离在潜在空间上度量每个基学习器输出的置信分数与理想解的差距,来集成不同基学习器的预测,再通过融合这些距离来提高模型的整体决策性能。实验结果表明,该方法在结肠病理学图像细粒度分类任务上,分类准确率、精确率、召回率与F-1分值都达到了94%以上,为病理学图像的亚型分类提供了新的视角。

基于无监督显著性掩码引导的红外与可见光图像融合网络

李东阳, 聂仁灿, 潘琳娜, 李贺

计算机科学. 2024, 51 (6A): 230600170-5. doi:10.11896/jsjkx.230600170

摘要 ( 205 )

PDF(3975KB) ( 317 )

参考文献 | 相关文章 | 多维度评价

在具有挑战性的拍摄环境中,使用单张红外或可见光图像很难捕获清晰详细的纹理信息以及热辐射信息。然而,红外和可见光图像融合允许保存来自红外图像的热辐射信息和来自可见光图像的纹理细节。现有的许多方法在融合过程中直接生成融合图像,忽略了对源图像像素级权重贡献的估计,强调了不同源图像之间的学习。为此,提出了基于无监督显著性掩码引导的红外与可见光图像融合网络,利用密集结构在源图像中进行全面的特征提取。它产生一个权重估计概率来评估每个源图像对融合图像的贡献。此外,由于红外与可见光图像缺乏真实标签,难以使用有监督学习,UMGN还引入了显著性掩码,便于网络集中学习红外图像的热辐射信息和可见光纹理信息。在训练过程中还引入了加权保真度项和梯度损失,以防止梯度退化。与大量其他最先进的方法进行对比实验,结果证明了所提出的UMGN方法的优越性和有效性。

基于MCC的后端优化方法及其在ORB-SLAM2中的应用

王婷, 程兰, 续欣莹, 阎高伟, 任密蜂, 张喆

计算机科学. 2024, 51 (6A): 230600081-7. doi:10.11896/jsjkx.230600081

摘要 ( 141 )

PDF(4037KB) ( 251 )

参考文献 | 相关文章 | 多维度评价

自主定位和环境感知是机器人实现复杂任务的前提,视觉同时定位与建图(VSLAM)技术是有效解决方案。VSLAM中,传感器误差和环境噪声等影响定位和建图精度,造成累计误差。后端优化是VSLAM中消除累计误差的关键环节,现有后端优化算法通常以高斯噪声为前提,属于MSE标准下的后端算法。然而,由于图像的非凸特性和真实场景中产生的非高斯噪声,高斯噪声假设并不总成立,导致现有算法在真实场景中运行时性能下降。鉴于此,利用最大互相关熵(MCC)标准在处理非高斯噪声方面的优势,提出了一种基于MCC标准的后端优化方法,并将所提出方法应用于ORB-SLAM2框架,以测试所提出的方法在定位和建图精度方面的性能。最后,在EuRoC和KITTI公开数据集上进行实验,结果表明,无论是室内还是室外,所提方法在大部分序列中性能优于原ORB-SLAM2中基于Huber的后端优化算法以及基于Cauchy的后端优化算法。

基于集成学习的MRI脑肿瘤智能诊断

李鑫蕊, 张艳芳, 康晓东, 李博, 韩俊玲

计算机科学. 2024, 51 (6A): 230600043-7. doi:10.11896/jsjkx.230600043

摘要 ( 151 )

PDF(3249KB) ( 323 )

参考文献 | 相关文章 | 多维度评价

脑肿瘤是由于颅脑内部组织出现癌变而导致的高危害疾病,及时诊断脑肿瘤对其治疗及预后至关重要。现阶段不同的网络模型有不同的分类效果,单一的网络模型很难在多个评价指标上有突出的表现。文中基于集成学习提出了一种分类功能强大的Treer-Net模型,它是以TransFG,ResNet50,EfficientNet B4,EfficientNet B7和ResNeXt101为基础模型,通过集成学习的加权平均的结合策略得到的模型。文中将其在脑肿瘤MRI二分类、三分类和四分类的公开数据集上训练完成分类任务。实验数据和结果表明,Treer-Net模型在脑肿瘤三分类数据集上的准确率、精确率、召回率和AUC分别高达99.15%,99.16%,99.15%和99.87%,通过对比分析,充分验证了所提的集成学习方法具有精准、快捷的优越性,更适用于临床辅助诊断脑肿瘤。

基于时频融合特征的肺动脉高压心音分类模型

王彦麟, 孙静, 杨宏波, 郭涛, 潘家华, 王威廉

计算机科学. 2024, 51 (6A): 230800091-7. doi:10.11896/jsjkx.230800091

摘要 ( 129 )

PDF(3051KB) ( 310 )

参考文献 | 相关文章 | 多维度评价

先心病相关肺动脉高压是一种严重的心血管疾病,致死率高,对其进行早期筛查与识别对于治愈尤为重要。目前临床是通过右心导管术确诊,此为有创检查,不便于在大规模筛查中采用,研究一种无创便捷的识别方法迫在眉睫。文中建立了一种时频融合的心音分类模型。首先对心音信号进行预处理,然后使用融合滤波器组对信号进行转换并求取动态时频特征,最后将得到的融合特征参数输入表格式先验数据拟合网络(TabPFN)中进行分类识别。实验结果表明,该算法在正常、CHD-PAH和CHD中的平均准确率、精确率、灵敏度、特异度和F1分别为92.21%,92.15%,92.15%,96.11%,92.14%。对于先心病相关肺动脉高压的早期筛查与识别具有重要意义。

基于自适应直方图均衡化的医学图像可逆对比度增强算法

谭碰, 欧博

计算机科学. 2024, 51 (6A): 230700124-7. doi:10.11896/jsjkx.230700124

摘要 ( 144 )

PDF(3561KB) ( 313 )

参考文献 | 相关文章 | 多维度评价

目前,一些可逆数据隐藏算法通常是对图像进行类似直方图均衡化的信息嵌入操作来实现对比度增强。这类方法虽然简单有效,但是缺乏明确的目标函数来指引参数选择,难以优化对比度增强效果,因而容易产生增强不足或过度增强等问题。为了优化可逆信息嵌入后的对比度增强效果,提出了一种基于自适应直方图均衡化并结合对比度增强的医学图像可逆数据隐藏算法。该方法基于预测误差扩展技术来实现可逆数据嵌入,并通过所定义的自适应直方图均衡化目标函数来优化预测残差直方图的修改,确定最优的数据嵌入点,在确保对比度增强的前提下实现低失真的可逆嵌入。实验结果表明,相比同类算法,所提方法在实现可逆嵌入的同时,能够进一步增强图像对比度,辅助提升医学图像中的目标识别效率。

基于DIoU损失与平滑约束的结构化SVM目标跟踪方法

孙子文, 袁广林, 李从利, 秦晓燕, 朱虹

计算机科学. 2024, 51 (6A): 230700113-8. doi:10.11896/jsjkx.230700113

摘要 ( 115 )

PDF(5877KB) ( 280 )

参考文献 | 相关文章 | 多维度评价

基于结构化SVM的目标跟踪因其优良的性能而受到了广泛的关注,但是现有方法存在损失函数不精确和模型漂移问题。针对这两个问题,首先提出基于DIoU损失与平滑约束的结构化SVM模型。该模型采用DIoU函数作为损失函数,利用t时刻超平面法向量w_t与t－1时刻超平面法向量w_t－1差值的L₂范数作为平滑约束。其次基于对偶坐标下降原理设计了该模型的求解算法。最后利用提出的基于DIoU损失与平滑约束的结构化SVM实现了一种多尺度目标跟踪方法。对所提出的目标跟踪方法在OTB100和VOT-ST2021数据集上进行了实验验证,实验结果表明:所提出的Scale-DCSSVM在OTB数据集上的跟踪成功率比DeepSRDCF高1.1个百分点,在VOT-ST2021上的EAO比E.T.Track高1.2个百分点。所提方法具有较优的性能。

结合多尺度卷积块与密集卷积块的遥感图像融合

侯林昊, 刘帆

计算机科学. 2024, 51 (6A): 230400110-6. doi:10.11896/jsjkx.230400110

摘要 ( 124 )

PDF(4347KB) ( 310 )

参考文献 | 相关文章 | 多维度评价

遥感图像融合的目的在于获得与多光谱图像相同光谱分辨率和与全色图像相同空间分辨率的高分辨率多光谱图像。尽管深度学习在遥感图像融合方面取得了显著的成果,但由于深度模型网络的限制,网络无法充分提取图像中丰富的空间信息,导致融合图像空间信息缺失,融合结果质量低。因此引入了多尺度块,不同尺度的图像特征可以通过不同大小的卷积核学习,从而增加提取特征的丰富性。随后引入了密集卷积块,通过密集连接来达到特征重用的目的,在网络较深时减少了浅层特征信息的丢失。在特征融合阶段,所提方法将网络不同层次的特征图作为特征融合层的输入,提高融合图像的质量。在GE1数据集以及QB数据集上与6种融合算法进行对比实验,实验结果表明所提方法的融合图像更好地保留了空间信息与光谱信息,在主观和客观评价上均优于对比方法。

基于跟踪检测时序特征融合的视频遮挡目标分割方法

郑申海, 高茜, 刘鹏威, 李伟生

计算机科学. 2024, 51 (6A): 230600186-6. doi:10.11896/jsjkx.230600186

摘要 ( 189 )

PDF(3416KB) ( 343 )

参考文献 | 相关文章 | 多维度评价

视频实例分割是近年来兴起的一项在图像实例分割基础上引入时序特性的视觉任务,旨在同时对每一帧的目标进行分割并实现帧间的目标跟踪。移动互联网和人工智能的迅猛发展产生了大量的视频数据,但由于拍摄角度、快速运动和部分遮挡等,视频中的物体往往会出现分裂或模糊的情况,使得从视频数据中准确地分割目标并对目标进行处理和分析面临着重大挑战。经查阅和实践发现,现有的视频实例分割方法在遮挡情况下的表现较差。针对上述问题,提出了一种改进的遮挡视频实例分割算法——通过融合Transformer和跟踪检测的时序特征来改善分割性能。为增强网络对空间位置信息的学习能力,该算法将时间维度引入Transformer网络中,并考虑到视频中目标检测、跟踪和分割之间的相互依赖和促进关系,提出了一种能够有效地聚合目标在视频中的跟踪偏移的融合跟踪模块和检测时序特征模块,提升了遮挡环境下的目标分割性能。通过在OVIS和YouTube-VIS数据集上进行的实验,验证了所提方法的有效性。相比当前的基准方法,该方法展现出了更好的分割精度,进一步证明了其优越性。

多重注意力引导的超声乳腺癌肿瘤图像分割

郭洪洋, 程前, 康晓东, 杨靖怡, 杨舒琪, 李芳, 张蕊

计算机科学. 2024, 51 (6A): 230500004-6. doi:10.11896/jsjkx.230500004

摘要 ( 157 )

PDF(3702KB) ( 324 )

参考文献 | 相关文章 | 多维度评价

传统基于U-Net超声乳腺图像分割任务中存在预测尺度单一和信息丢失等问题。针对存在的问题,提出一种由多重注意力引导机制的U-Net超声乳腺肿瘤图像分割。首先,在U-Net的编码结构中,引入多个SE通道注意力,对输入的乳腺肿瘤图像进行多层级的语义信息提取,引导编码器聚焦乳腺肿瘤特征,减少冗余背景信息带来的干扰;其次,通过设计特征融合处理模块,对编码器传来的特征图进行复杂语义特征的融合处理;最后,在解码器部分,加入金字塔结构捕获全局空间信息,提高模型对肿瘤图像的多尺度特征提取能力,以提高整体网络的表达能力和分割性能。在乳腺肿瘤图像数据集上对该方法进行了仿真实验,结果表明,与其他U-Net改进策略相比,该方法具有更强的准确率和鲁棒性。

基于检测框下边沿的单目视觉车辆测距研究

刘宏利, 王雨林, 邵磊, 李季

计算机科学. 2024, 51 (6A): 231000077-6. doi:10.11896/jsjkx.231000077

摘要 ( 146 )

PDF(4259KB) ( 311 )

参考文献 | 相关文章 | 多维度评价

对车辆测距是当今驾驶领域的热门研究方向。针对传统测距方法测距精度受到车型大小影响的问题以及前车存在的X轴偏移问题,提出了基于检测框下边沿中心点的车辆测距模型。该模型通过使用单目视觉摄像头及车辆检测算法获取前方车辆的位置信息,并通过车辆检测框得出的下边沿中心点坐标,以及相机安装的俯仰角信息综合建立了车辆测距模型,解决了车型大小带来的误差问题;通过构建三角函数模型,解决了前车相对于实验车辆存在的X轴分量问题,并优化改进了前车安全距离的判定方式;设定车尾矩形框中心点横坐标与车辆外接矩形框宽度的比值λ,根据λ取值分情况讨论,使该模型更符合场景应用需要。并提出了基于测距关键点的逆透视变换模型,减小了测距误差。实验表明,改进后测距模型的测距精度不受车型大小的影响且能考虑到前车位置的X轴分量问题,改进后的测距模型相对于传统测距模型,测距误差降低了约1.5%,且测距精度明显提高。

基于高斯增强模块的相机模型辨别

黄远航, 边山, 王春桃

计算机科学. 2024, 51 (6A): 230700125-5. doi:10.11896/jsjkx.230700125

摘要 ( 109 )

PDF(2364KB) ( 283 )

参考文献 | 相关文章 | 多维度评价

在多媒体取证中,高通滤波器是卷积神经网络常用的预处理层之一,用于抑制图像内容的影响,只强调高频特征。但与此同时,其他一些包含取证痕迹的有用信息也将被不加区别地剔除。为了解决这一问题,文中提出了一个简单而高效的高斯增强模块(Gaussian Enhancement Module,GEM)来提取“扩展的”高频特征,即在维持原有特征强度的基础上增强高频细节信息。GEM由两个连续的一维低通高斯滤波器组成,以获得一个模糊版本的特征图,并进一步得到相应的扩展高频残差。通过以高频残差作为空间掩膜,它可以自适应地强化脆弱和细微的低级取证特征,并防止在特征传递过程中出现衰减现象。在相机模型辨别数据集上进行实验,通过将该模块插入多个主流骨干网络,GEM仅仅带来非常轻微的模型复杂度的增加,网络性能和鲁棒性却显著提高,表明该模块支持“即插即用”,与特定的网络架构无关。

基于SPD-Conv结构和NAM注意力机制的鱼群小目标检测

谌雨章, 王诗琦, 周雯, 周婉婷

计算机科学. 2024, 51 (6A): 230500176-7. doi:10.11896/jsjkx.230500176

摘要 ( 183 )

PDF(5404KB) ( 341 )

参考文献 | 相关文章 | 多维度评价

为解决因水下成像环境退化导致图像分辨率较低,以及因鱼群目标较小等因素导致的检测精度不高的问题,提出了一种结合SPD-Conv结构和NAM注意力机制的改进YOLOv7检测算法。首先,采用Space-to-Depth(SPD)结构改进头部网络,取代了网络中原有的跨步卷积结构,保留了更多的细粒度信息,提升了特征学习的效率,提高了网络对低分辨率图像的检测效果。然后在网络中引入Normalization-based Attention Module(NAM)注意力机制,采用CBAM的模块集成方式,使用BN缩放因子来计算注意力权重,抑制了不显著的特征,提升了小目标检测的准确率。最后针对水下成像退化,对检测图片做反卷积预处理,减小了水下成像退化因素对检测造成的影响。实验结果显示,在WildFish数据集上模型的整体精度达到97.2%,与YOLOv7算法相比提升了7.6%,准确率提升了8.5%,召回率提升了9.8%,与Efficientdet,SSD,YOLOv5及YOLOv8算法相比,所提模型精度分别提升了12.6%,17.8%,4%及2.9%,在Aquarium数据集上模型的整体精度达到80.5%,相比Efficientdet,SSD,YOLOv5,YOLOv7及YOLOv8分别提升了18.4%,11.6%,6.9%,2.0%及2.7%,可以满足水下鱼群识别的需求。

基于YOLOP-L的多特征融合道路全景驾驶检测

吕嘉璐, 周力, 巨永锋

计算机科学. 2024, 51 (6A): 230700185-8. doi:10.11896/jsjkx.230700185

摘要 ( 177 )

PDF(4238KB) ( 360 )

参考文献 | 相关文章 | 多维度评价

目前,驾驶员视角下的交通图像检测技术成为交通领域的重要研究方向,同时提取车辆、道路、交通标志等多种特征已经成为驾驶员理解道路信息多样性的亟需任务。以往研究已在单类目标检测的特征提取方面取得了长足进步,然而,这些研究不能很好地联合应用于其他区别较大的特征检测任务中,且融合训练过程中会损失个别特征检测的精度。针对驾驶员视野范围内道路信息多样且复杂的特点,本文提出了一种基于多特征融合训练的检测模型YOLOP-L,它能够同时对多种不同特征交通目标进行融合训练,同时保证单项检测任务的精度。首先,为了解决特征融合中语义信息表达不完整的问题,设计的SP-LNet模块通过FPN与双向特征网络结合实现网络更深层次的融合,使得提取的信息更完整,从而提升道路小目标的检测性能;其次,设计新的分割头深度可分离卷积,将语义信息与局部特征融合促使多特征融合的训练准确度与速度得到进一步提升;再次,体系中设计的GDL-Focal多类混合损失函数更专注于困难样本,可用于解决样本特征不平衡的问题。最后,对比实验表明:YOLOP-L相比原YOLOP网络运行的速度更快;在车辆目标检测任务下召回率提升了2.2%;在车道线检测任务下准确率提升2.8%,车道线IoU的值较HybridNets网络下降2.45%,但较YOLOP-L网络提升1.95%;在可行驶区域分割任务下其整体检测性能提升1.1%。结果表明,在具有挑战性的BDD100K数据集上,YOLOP-L可以在复杂场景下有效解决检测精度不足和分割缺失的问题,提高了车辆识别、车道线检测以及道路行驶区域联合训练的准确性和鲁棒性。

基于注意力机制的残差特征聚合网络超分辨率图像重建研究

孙阳, 丁建伟, 张琪, 魏慧雯, 田博文

计算机科学. 2024, 51 (6A): 230600039-6. doi:10.11896/jsjkx.230600039

摘要 ( 184 )

PDF(2823KB) ( 333 )

参考文献 | 相关文章 | 多维度评价

针对单图像超分辨率算法级联残差块的输出特征仅在局部作用的问题,提出了一种结合注意力机制的残差特征聚合网络。该网络通过跳跃连接将各残差块输出不同层次的特征聚合到残差组的尾部,实现特征的充分提取与复用,扩大网络的感受野并增强特征的表达能力,使得不同层次的特征图更充分地参与到图像重建中。同时,为增强特征信息空间上的相关性,引入增强空间注意力机制以改善残差块的性能。大量实验表明,此模型可以获得良好的超分辨率性能。在×4倍SR任务中与RCAN,SAN和HAN等主流方法相比,在5个基准测试集上取得的峰值信噪比平均提升0.07dB,0.06dB,0.006dB,结构相似度平均提升0.001 2,0.001 1,0.0008,重建图像质量明显提高,细节更加丰富,充分说明了所提方法的有效性与先进性。

感受野扩展与多分支聚合的目标检测方法

阙越, 甘梦晗, 刘志伟

计算机科学. 2024, 51 (6A): 230600151-6. doi:10.11896/jsjkx.230600151

摘要 ( 187 )

PDF(3159KB) ( 317 )

参考文献 | 相关文章 | 多维度评价

目标检测旨在实现对图像中目标的精确识别和定位,是计算机视觉中一个重要的研究领域。基于深度学习的目标检测已取得长足的发展,但依然存在不足之处。大的下采样系数带来的语义信息有利于图像分类,但下采样过程中不可避免地会造成信息损失,导致模型特征提取不充分,从而检测准确性下降。针对上述问题,提出一种感受野增强与多分支聚合模型用于目标检测。首先,设计感受野增强模块,以扩大主干网络的感受野。该模块可以获取目标上下文线索,且不改变特征的空间分辨率,可以缓解下采样过程中目标信息丢失问题。然后,为了充分利用卷积神经网络的局部性以及自注意力机制的长距离特征依赖特性,构建感受野扩展复合主干网络,以保留局部特征以及提高模型的全局特征感知能力。最后,提出多分支聚合检测头网络,在3个预测分支之间形成信息流动,融合分支之间的特征信息,以提高模型检测能力。在MS COCO数据集上进行了验证实验,结果表明所提模型的平均精度优于多种主流目标检测模型。

基于跨域小样本学习的SAR图像目标识别方法

史松昊, 王晓丹, 杨春晓, 王艺菲

计算机科学. 2024, 51 (6A): 230800136-7. doi:10.11896/jsjkx.230800136

摘要 ( 184 )

PDF(3162KB) ( 321 )

参考文献 | 相关文章 | 多维度评价

由于SAR图像获取难度大,可供研究的样本数量较少,解决有限样本条件下SAR图像目标识别问题成为业界公认的挑战。随着深度学习在计算机视觉领域的发展,衍生出了多种小样本图像分类方法,因此考虑采用跨域小样本学习范式解决小样本SAR图像目标识别问题。具体地,先在多个源域中训练得到不同域的特征提取器,而后通过知识蒸馏的方法获取一个通用的特征提取器,这里采用中心核对齐的方法,将提取的特征映射到一个更高维的空间,从而更好地区分原特征之间的非线性相似性;通过上一阶段获得的通用特征提取器提取目标域图像特征,最后采用原型网络的方法预测样本的类别。实验证明,该方法在缩减模型参数的同时,获得了88.61%的准确率,为解决小样本SAR图像目标识别问题提供了新的思路。

基于有损压缩编码的降噪自编码器

袁振, 刘进锋

计算机科学. 2024, 51 (6A): 230400172-7. doi:10.11896/jsjkx.230400172

摘要 ( 136 )

PDF(4874KB) ( 297 )

参考文献 | 相关文章 | 多维度评价

图像预处理算法的优劣程度直接关系到图像后置处理的效果,如图像分割、目标检测、边缘提取等。为了获取高质量的数字图像,对图像进行降噪处理成了必不可少的前置步骤。图像降噪旨在尽可能地保持原始信息完整性(即主要特征)的同时,又能够去除信号中无用的信息。为此,提出了一种基于有损压缩编码的卷积自编码器(AutoEnconders,AE)去噪模型;并根据最大编码率下降原则(the principle of Maximal Coding Rate Reduction,MCR²)设计了新的损失函数代替主流深度学习算法中常用的均方误差(Mean Squared Error,MSE)损失,以提高模型的鲁棒性和适应性。模型首先通过编码器处理带噪图像,得到隐变量,然后使用解码器进行解码,消除噪声并得到重构图像。接下来,保持编码器不变,将重构图像输入编码器,使编码器继续学习并得到重构隐变量。最后,通过计算隐变量与重构隐变量的距离来间接衡量重构图像与原始图像的误差,并将其作为收敛代价进行模型训练。在thumbnails128×128和CBSD68数据集上对所提模型进行了大量实验验证。实验结果表明,该自编码器框架(AE-MCR²)在不同类型的噪声(高斯噪声、伯努利噪声和泊松噪声)下均表现出良好的性能,并具有一定的可解释性。

基于改进FCOS的遥感图像舰船目标检测

陈天鹏, 胡建文

计算机科学. 2024, 51 (6A): 230700166-7. doi:10.11896/jsjkx.230700166

摘要 ( 133 )

PDF(3328KB) ( 274 )

参考文献 | 相关文章 | 多维度评价

由于遥感图像中舰船目标方向任意,基于深度学习的通用目标检测算法采用水平框,在检测舰船时易框选大量背景,检测效果欠佳。文中提出一种改进全卷积一阶段目标检测网络(FCOS)的遥感图像舰船目标检测算法,以FCOS为基线,在检测头部分增加一条偏移回归分支,通过偏移水平框的上边中点和右边中点,产生旋转框。舰船目标通常具有较大的长宽比,预测框与真实框之间的角度偏差对交并比的影响较大,进而影响模型的检测精度。针对该问题,在计算偏移损失时引入与舰船目标长宽比有关的加权因子,使得具有较大长宽比的目标获得较大的偏移损失。在HRSC2016数据集上的实验结果表明,所提算法的平均精确度达到89.00%,检测速度达到19.8FPS,相比同类型的无锚框算法,其在检测速度和检测精度上均表现优秀。

基于统计分析的仿射运动估计快速算法

钟煜城, 黄晓峰, 牛伟宏, 崔燕

计算机科学. 2024, 51 (6A): 230400081-8. doi:10.11896/jsjkx.230400081

摘要 ( 130 )

PDF(3116KB) ( 292 )

参考文献 | 相关文章 | 多维度评价

为降低新一代通用视频编码标准(Versatile Video Coding,VVC)的计算复杂度,提出了一种基于统计分析的仿射运动估计(Affine Motion Estimation,AME)快速算法。从加速AME过程的角度出发,首先摒弃AME的3种运动矢量(Motion Vector,MV)精度中的整像素和1/16像素精度,保留1/4像素精度;其次利用迭代次数与量化参数(Quantization Parameter,QP)、slice类型以及编码单元(Coding Unit,CU)大小的关系,得到一个迭代次数的自适应计算式来减少AME迭代次数;然后将细粒度搜索(Fine Granularity Search,FGS)算法中CU 4个角落的4个整像素用2个对角分像素进行替代;最后运用绝对变换差和(Sum of Absolute Transform Difference,SATD)代价来替代率失真(Rate Distortion Optimization,RDO)代价。实验结果表明,与H.266/VVC参考软件VTM-10.0相比,提出的算法在低延迟(Low Delay B,LDB)和随机访问(Random Access,RA)配置下分别节省了8.34%和8.83%的时间,与此同时性能损失仅为0.10%和0.12%。

面向嵌入式平台的光学遥感图像舰船检测识别

何鑫宇, 陆陈鑫, 冯书谊, 欧阳尚荣, 穆文涛

计算机科学. 2024, 51 (6A): 230700117-7. doi:10.11896/jsjkx.230700117

摘要 ( 147 )

PDF(4164KB) ( 278 )

参考文献 | 相关文章 | 多维度评价

建设海洋强国是我国当前大力发展的战略方向。针对现有基于深度学习的遥感图像舰船目标检测识别算法在嵌入式平台上存在检测分类识别率低、运行速率慢等问题,提出了一种基于寒武纪MLU220嵌入式平台改进的Mix-YOLO网络模型。该模型以YOLOv7-tiny网络为基本框架,首先,引入MobileNet系列网络模块对特征提取网络进行部分替换,减少网络参数量;然后,引入ULSAM注意力机制,以便增强网络学习分类能力,减少虚警率;最后,为了显著提升嵌入式平台检测速率,采用将网络模型大模块拆分为小模块的编写方式。实验结果表明:Mix-YOLO算法在原YOLOv7-tiny网络基础上,参数量和计算量分别下降了39.70%和29.70%,处理帧率由97.27fps提升至120.88fps,精度提高了7.7％,能够实现对遥感图像中舰船目标的实时检测识别。

基于多模态视频分类任务的模态融合策略研究

王一帆, 张雪芳

计算机科学. 2024, 51 (6A): 230300212-5. doi:10.11896/jsjkx.230300212

摘要 ( 146 )

PDF(2566KB) ( 360 )

参考文献 | 相关文章 | 多维度评价

尽管过往人工智能相关技术在众多领域取得了成功,但是通常只是模拟了人类的某一种感知能力,也就意味着被限制在处理单个模态的信息之中。从多个模态信息中提取特征并进行有效融合对于从弱/限制领域人工智能向强/通用人工智能的发展迈进具有重要意义。本研究基于编码器-解码器结构,在视频分类任务上对多模态信息的特征编码进行早期特征融合、对各模态信息的预测结果进行后期决策融合以及对两者相结合的不同多模态信息融合策略进行了对比研究;同时对音频模态信息参与模态融合的两种方式进行了对比,即直接将音频进行特征编码进而参与模态融合或音频通过语音转文本进而以文本的形式参与模态融合。实验结果表明,将文本和音频模态单独的预测结果与另外两种模态的融合特征的预测结果进行决策融合能够进一步提高分类预测准确率;此外,通过语音识别将语音转换成文本模态信息,能够更加充分利用其中包含的语义信息。

基于多尺度局部特征融合的行人重识别方法

吴蕾, 王海瑞, 朱贵富, 赵江河

计算机科学. 2024, 51 (6A): 230300236-6. doi:10.11896/jsjkx.230300236

摘要 ( 136 )

PDF(3227KB) ( 293 )

参考文献 | 相关文章 | 多维度评价

针对现有行人重识别方法在提取行人特征时存在特征不对齐、忽略相邻区域语义相关性、背景杂乱以及训练效率低的问题,提出一种多尺度局部特征融合的方法。首先引入空间变换网络对图像进行自适应仿射变换,实现行人空间特征对齐;接着横向均等分割不同尺度的特征图,对相邻局部块采取不同的拼接方式,以弥补切割造成的相邻块关联性信息缺失的问题;再融合全局特征与局部特征,挖掘二者之间的关联性。同时,融入随机擦除的方法对数据集进行处理,防止模型过拟合;并且使用多种损失函数对网络模型进行训练,提升模型的类内紧致性和类间差异性。将所提方法在Market-1501和DukeMTMC-ReID数据集上进行实验,Rank-1分别达到95.0%,88.8%,mAP分别达到89.2%,78.9%,结果表明所提方法能够提取更具判别力的行人特征。

复杂光照环境下的标识线图像增强方法

吴静, 樊绍胜, 胡成扬

计算机科学. 2024, 51 (6A): 230300187-5. doi:10.11896/jsjkx.230300187

摘要 ( 115 )

PDF(3803KB) ( 292 )

参考文献 | 相关文章 | 多维度评价

自动驾驶汽车在行驶过程中需要识别道路标识线以确保行驶在车道上,变电站巡检机器人通过识别道路标识线实现准确巡检。但由于复杂光照环境的影响,道路标识线信息难以准确提取。传统的图像增强方法无法对所有复杂光照环境下的道路标识线图像都产生良好的增强效果,对此提出一种复杂光照环境下的道路标识线图像增强方法。利用HSV色域空间的亮度图像的亮度差进行分层处理,对高亮度差的图像使用自适应伽马校正的方法进行图像增强,对低亮度差的图像先使用直方图锥形拉伸扩大图像灰度级,再利用自适应伽马校正提升图像对比度。实验结果表明,该算法能有效解决低光照、曝光等复杂光照环境所导致的道路标识线难以识别的问题,是一种有效的图像增强方法。

方向感知金字塔聚合网络的道路中心线提取

张小青, 王青旺, 瞿信, 沈世全, 吴长义, 刘菊

计算机科学. 2024, 51 (6A): 230400101-7. doi:10.11896/jsjkx.230400101

摘要 ( 104 )

PDF(2895KB) ( 277 )

参考文献 | 相关文章 | 多维度评价

道路中心线作为抽象类,无明确显性特征,进而造成模型无法准确提取道路中心线。针对该问题,文中将道路中心线提取建模为语义分割任务,并根据道路中心线的线性结构特点提出了一种方向感知金字塔聚合网络(Direction-aware Pyramidal Aggregation Network,DAPANet)。首先,针对道路中心线的空间分布特性及结构特点,设计了方向感知模块(Direction-aware Module,DAM),在主干网络(ResNet18)最后输出的4个层级上分别使用4个方向感知层提取道路中心线的方向特征。然后,进一步设计融合多向性特征的金字塔聚合模块(Pyramid Aggregation Module,PAM),融合4个层级提取到的结构特征,得到更具有鲁棒性的道路中心线特征。最后,在无人机平台下采集的真实数据上进行了实验,实验结果显示所提出的DAPANet取得了84.7%的mIoU和98.6%的Precision,道路中心线的IoU达到77.28%,性能优于其他先进的对比方法,证明了所提方法对提取道路中心线的有效性。

基于轻量化YOLOv5s的集装箱锁孔识别算法

李源鑫, 郭忠峰, 杨钧麟

计算机科学. 2024, 51 (6A): 230900021-6. doi:10.11896/jsjkx.230900021

摘要 ( 216 )

PDF(4569KB) ( 408 )

参考文献 | 相关文章 | 多维度评价

为提高现有集装箱的锁孔识别检测效率,减少算法参数量以及减小模型大小,提出了一种基于轻量化YOLOv5s的集装箱锁孔识别算法。该算法将YOLOv5s的Backbone主干特征提取网络部分更换为轻量级神经网络模型MobileNetV3,并对neck部分的特征融合结构进行进一步的优化,减少了模型的参数量和计算量,并提高了检测速度。引入注意力机制SimAM层,提高了检测的准确率和效率。使用不同的改进方法对模型进行重构后,在自建的集装箱锁孔数据集上进行训练和测试,并与改进的YOLOv5s进行对比实验。结果表明,改进后的模型大小仅为2.4MB,每幅图像的平均检测时间仅为5.1ms,平均检测精度达97.3%;与原始目标检测模型相比,该模型的大小减小了82.8%,检测速度提高了39%,在确保高检测精度的前提下展现出了较强的算法实时性。

航拍绝缘子图像缺陷智能识别算法研究

戴永东, 金扬, 戴雨凡, 付晶, 王茂飞, 刘玺

计算机科学. 2024, 51 (6A): 230700172-5. doi:10.11896/jsjkx.230700172

摘要 ( 153 )

PDF(3682KB) ( 311 )

参考文献 | 相关文章 | 多维度评价

由于电力线路绝缘子缺陷容易导致输电系统故障,因此,研究缺陷检测算法至关重要。传统的检测方法只能在有足够的前提知识、干扰低或在特定条件下才能准确定位绝缘子并检测出故障。为了能够在无人机航拍图像中自动定位绝缘子并检测出绝缘子缺陷,提出了一种全新的深度卷积神经网络(CNN)架构,该架构不仅能定位绝缘子而且还能检测绝缘子的缺陷。该架构分为两个模块,第一个模块为绝缘子定位,负责检测图像中的所有绝缘子;第二个模块为绝缘子缺陷检测,负责检测图像中所有绝缘子的缺陷。使用具有候选区域网络(Region Proposal Network,RPN)的CNN将绝缘子缺陷检测转换为两级对象检测问题。最后,在真实数据集上进行实验,所提方法缺陷检测精确率和召回率分别为91.2%和95.6%,满足了鲁棒性和准确性要求。

基于改进YOLOv7的钢材缺陷检测

黄海新, 吴迪

计算机科学. 2024, 51 (6A): 230800018-5. doi:10.11896/jsjkx.230800018

摘要 ( 199 )

PDF(3684KB) ( 356 )

参考文献 | 相关文章 | 多维度评价

钢材表面缺陷检测在实际生产中非常重要。为了准确检测缺陷,设计了一种基于改进的YOLOv7的钢材表面缺陷检测模型。首先在骨干网络结构中引入Ghost模块,增强模型提取特征和识别小特征的能力,同时降低模型参数量;其次在池化模块中嵌入注意力机制;最后通过引入EIOU改善损失函数,从而更好地优化 YOLOv7 网络模型,且可以更好地处理样本的不平衡,从而达到更好的优化相似度。实验结果表明,与原模型相比,所提模型mAP达到76.9%,提高了4.2%。该模型可以满足钢表面缺陷的准确检测和识别需求。

一种单阶段无监督可见光-红外跨模态行人重识别方法

娄刃, 和任强, 赵三元, 郝昕, 周跃琪, 汪心渊, 李方芳

计算机科学. 2024, 51 (6A): 230600138-7. doi:10.11896/jsjkx.230600138

摘要 ( 176 )

PDF(2959KB) ( 375 )

参考文献 | 相关文章 | 多维度评价

无监督“可见光-红外”跨模态行人重识别任务能够缓解智能监控场景中需要大量人工标注的问题。常见多阶段模型用于处理不同模态数据。文中提出了一种有效的单阶段无监督跨模态行人重识别的方法,设计了基于置信因子的聚类算法和图嵌入的跨模态特征处理方法,分别用于解决无标签问题和跨模态问题。实验结果表明,相较于现有算法,所提方法在r=1时精度至少取得了7%的提高。

复杂背景下输电线路缺陷检测算法研究

邬春明, 王调君

计算机科学. 2024, 51 (6A): 230500178-6. doi:10.11896/jsjkx.230500178

摘要 ( 165 )

PDF(3309KB) ( 297 )

参考文献 | 相关文章 | 多维度评价

输电线路定期巡检对保障电力系统安全稳定运行具有重要的意义。针对输电线路航拍图像背景复杂、目标尺度变化大、小目标多等问题,提出了基于YOLOv5s的输电线路目标检测算法。该算法采用特征细化模块优化微小目标特征,并在网络中嵌入SimAM注意力模块,通过能量函数统一权值的方式优化模型的特征提取,最后引入NWD损失函数削弱模型对小目标位置偏差的敏感性,提升模型对小目标的识别检测能力。实验结果表明,该模型对输电线路目标的平均检测精度高达98.8%,相较于基准模型,提高了1.2%。

卷烟厂卷包车间工人违规作业行为检测方法

刘恒, 林虹宇, 吴涛

计算机科学. 2024, 51 (6A): 230700123-8. doi:10.11896/jsjkx.230700123

摘要 ( 134 )

PDF(5402KB) ( 288 )

参考文献 | 相关文章 | 多维度评价

小目标检测一直是目标检测领域的难点,针对卷烟厂卷包车间摄像头安装位置较高、小目标检测精度低和总体检测精度较低的问题,提出了一种改进的YOLOv8n目标检测算法 YOLOv8n-FIAL。首先使用添加通道重排机制的C2fg模块代替原本C2f模块,提高特征学习能力,使用自适应通道特征融合模块代替YOLOv8n算法Neck部分的Concate操作,使特征融合更加充分;然后增加小目标检测层,提高小目标检测精度,降低漏检率;最后使用Focal-EIOU损失函数替换原来的CIOU损失函数,平衡锚框与真实框重叠较大的高质量锚框的数量远少于低质量锚框训练实例不平衡的问题。实验结果表明,在自制的卷烟厂工人违规作业数据集上,所提出的YOLOv8n-FIAL检测方法相比原始的YOLOv8n方法的总体平均精度均值提升了7.6%,对口鼻、手拿手机和衣服领口这3类小目标平均精度均值提升最大,分别提升了8.3%,8%和9.6%;在公共数据集VOC2007上,YOLOv8n-FIAL算法相比YOLOv8n算法的总体平均精度均值提升了1.6%。

基于改进Efficientnetv2模型的铁矿石图像分类方法

吕一鸣, 王激扬

计算机科学. 2024, 51 (6A): 230600212-6. doi:10.11896/jsjkx.230600212

摘要 ( 172 )

PDF(3102KB) ( 287 )

参考文献 | 相关文章 | 多维度评价

随着当今世界的飞速发展,各种高楼大厦林立,对于铁以及钢材的需求日益增加,随之而来的对于铁矿石的需求也逐年上涨,由于铁矿产业是对不可再生资源的开采,因此对铁矿石进行分类,提高铁矿石的利用效率就变得极其重要。为了提高铁矿石的分类速度以及分类准确率,文中提出了一种基于卷积神经网络和注意力机制的铁矿石图像分类方法。该方法不需要对输入的图像进行手工提取特征,通过深度学习模型框架来弥补传统图像处理算法的不足,实现对铁矿石准确、高效的分类,可以较好地识别多种类型的铁矿石。对于铁矿石的3种基本类型具有较好的分类效果以及准确率。实验结果证明,所提方法在数据集上的准确率达到88.46%,相比其他算法模型,其模型训练时间更短,性能更优。利用深度学习的方法,部署自动化铁矿石分类模型,对于社会发展有重要意义。

基于残差密集卷积自编码的高噪声图像去噪方法

张杰, 卢淼鑫, 李嘉康, 徐大勇, 黄雯潇, 史小平

计算机科学. 2024, 51 (6A): 230400073-7. doi:10.11896/jsjkx.230400073

摘要 ( 130 )

PDF(3987KB) ( 314 )

参考文献 | 相关文章 | 多维度评价

在高噪声图像去噪中,传统卷积自编码器难以挖掘有效的深度特征信息,进而影响了图像的重建质量。为了提高高噪声图像的重建质量,提出了一种残差密集卷积自编码器网络模型。该模型首先使用卷积操作代替池化操作以提高高噪声图像的表征能力;同时,在编码和解码阶段设计三级密集残差网络结构,实现图像特征的有效挖掘;最后,设计一个优化损失函数以进一步提高重建图像的质量。实验结果表明,设计的去噪方法能够从高噪声图像中重建高质量的图像,同时能够保留更多的细节特征信息,有效验证了该算法在图像去噪中的有效性。该方法能够有效解决高噪声图像的去噪问题,具有重要的应用价值。

基于改进图像增强及CNN的复杂环境车牌识别算法

杨秀璋, 武帅, 任天舒, 廖文婧, 项美玉, 于小民, 刘建义, 陈登建

计算机科学. 2024, 51 (6A): 220200162-7. doi:10.11896/jsjkx.220200162

摘要 ( 247 )

PDF(4043KB) ( 402 )

参考文献 | 相关文章 | 多维度评价

传统图像识别和深度学习模型较难检测复杂环境下的车牌,其场景适用性和精确率较低,从而严重威胁交通安全,影响智慧交通发展。基于此,文中提出了一种基于改进图像增强及CNN的复杂环境车牌识别算法。首先,结合目标图像的平均灰度值,利用ACE算法和暗通道先验去雾算法对复杂环境下的车牌数据集进行图像增强;然后提出了一种融合色彩关键特征和波峰关键特征的车牌区域定位算法,通过8个核心步骤有效定位复杂环境下车牌的区域;最后构建五层卷积神经网络的模型,以实现车牌字符识别。实验结果表明,所提算法能有效识别复杂环境下行驶车辆的车牌,该算法在复杂环境车牌区域定位的精确率为86.04%,召回率为82.60%,F₁值为84.29%,其F₁值比传统图像处理算法提升了47.29%,比SSD算法提升了24.73%,比YOLO算法提升了26.37%,比YOLOv3提升了17.15%。同时,所提方法的时间复杂度较低,属于一种轻量级的车牌识别方法,能消除噪声并实现车牌字符识别,具有一定的应用前景和实用价值,也将为智慧交通的研究提供理论基础。

融合注意力机制与线激光辅助的输送带缺陷检测网络

宋震, 王纪强, 侯墨语, 赵林

计算机科学. 2024, 51 (6A): 230800115-6. doi:10.11896/jsjkx.230800115

摘要 ( 140 )

PDF(3491KB) ( 321 )

参考文献 | 相关文章 | 多维度评价

针对输送带缺陷种类繁多、缺陷特征像素占比小以及传统算法检测精度低的问题,采用随机仿射变换,扩充样本数据集;分析各通道间的关联关系及其贡献值对模型特征提取的影响,提出了一种通道关联加权注意力机制,利用关联卷积及全连接方式计算通道关联度及贡献权值,调整相应通道信息占比,提升模型检测精度;分析了上采样以及卷积块对输出特征图大小的影响,改进原特征金字塔特征卷积块及上采样结构,提高算法对小目标的特征提取以及缺陷检测能力;最后在输送带缺陷数据集上进行测试。结果表明:改进算法模型能对输送带典型的异物插入、破损、撕裂等缺陷特征进行有效识别,识别精准度可达99.7%,召回率大于99.5%,平均精度均值达到99.5%。

一种改进YOLOv5的CT图像肺结节检测方法

邬春明, 刘亚丽

计算机科学. 2024, 51 (6A): 230500019-6. doi:10.11896/jsjkx.230500019

摘要 ( 281 )

PDF(3643KB) ( 359 )

参考文献 | 相关文章 | 多维度评价

针对YOLOv5算法对CT图像中的肺结节检测效果较差的问题,提出基于改进YOLOv5的肺结节检测方法。将YOLOv5网络中Neck部分的特征金字塔改进为加权双向特征金字塔网络;在YOLOv5网络中的Backbone部分加入高效通道注意力机制与坐标注意力机制。在LIDC-IDRI数据集上进行实验,结果表明,检测的平均精度可达80.2%,召回率可达90.75%,因此该方法能够有效检测肺结节。相较于YOLOv5算法,改进后的算法在mAP上提高了7.7%,在召回率上提高了5.5%。

融合注意力机制的DeeplabV3+服装图像分割方法

肖雅慧, 张自力, 胡新荣, 彭涛, 张俊

计算机科学. 2024, 51 (6A): 230900153-7. doi:10.11896/jsjkx.230900153

摘要 ( 182 )

PDF(3840KB) ( 341 )

参考文献 | 相关文章 | 多维度评价

针对在服装图像语义分割中存在由服装颜色、纹理、背景以及多目标遮挡导致的边缘分割粗糙和分割精度低等问题,文中基于Deeplabv3+框架,提出了一种图像语义分割算法(FFDNet)。首先,模型的骨干网络采用ResNet101网络,并添加通道空间注意力模块(Feature-Enhanced Attention Module,FEAM),通过对特征图加权来挖掘并增强特征信息,提高网络表达能力。其次引入特征对齐模块(Feature Align Module,FAM)作为一种新的上采样方式,解决不同尺度特征融合之间特征未对齐导致分割错误且效率低的问题,以此提高对服装图像分割的准确性和鲁棒性。最后,FFDNet在Deepfashion2和PASCAL VOC 2012数据集上的平均交并比分别达到55.2%和79.4%;在参数量方面,该模型相比原模型在Deepfashion2上仅增加了0.61MB。与其他现有经典模型对比,其分割性能更优,能有效捕获图像局部细节信息,减少像素分类错误。

基于改进Deeplabv3+算法的滚珠丝杠驱动表面点蚀缺陷检测

郎朗, 陈晓琴, 刘莎, 周强

计算机科学. 2024, 51 (6A): 240200058-6. doi:10.11896/jsjkx.240200058

摘要 ( 174 )

PDF(3613KB) ( 288 )

参考文献 | 相关文章 | 多维度评价

针对滚珠丝杠驱动表面背景环境复杂、点蚀缺陷目标小因而难以检测的问题,提出改进的Deeplabv3+滚珠丝杠驱动表面缺陷分割算法。本算法采用Re2Net-50替换Deeplabv3+的主干网络,显著提升了对小尺寸缺陷目标的识别能力。此外,通过在主干网络中融合特征金字塔网络FPN,能够加强多尺度信息的提取,从而增强了对缺陷目标的精确定位。最后,本研究在Deeplabv3+网络的ASPP模块之后引入了Coordinate Attention机制,能够增强模型对图像中空间和维度的关注,有效地捕获了图像中的长距离空间依赖关系。实验结果表明,与原始的Deeplabv3+相比,所提算法在平均交并比MIoU指标上提高了4.38%,准确率Accuracy提高了5.52%,F1-score提高了2.74%。同时,与其他经典的语义分割算法相比,所提算法也展现出了一定的优越性。

融合三维人脸动态信息和光流信息的人脸表情识别

张华忠, 潘曰凯, 涂晓光, 刘建华, 许罗鹏, 周超

计算机科学. 2024, 51 (6A): 230700210-7. doi:10.11896/jsjkx.230700210

摘要 ( 164 )

PDF(3757KB) ( 300 )

参考文献 | 相关文章 | 多维度评价

人脸表情识别在静态图像上取得了卓越的成效,但这些方法应用于视频或图像序列时,准确度和鲁棒性往往会受到影响。传统的方法通常无法基于空间信息和光流信息进行人脸表情的识别,然而这些辅助识别信息都是二维信息,没有考虑到人脸的表情变化是一种三维的变化过程。为充分挖掘人脸表情识别的深层语义信息,提出了一种基于三维人脸动态信息和光流信息相结合的融合表情识别方法。该方法构建基于人脸深度图像、光流图像和RGB图像的多流卷积神经网络,通过融合3种模态的信息进行人脸表情识别。所提方法在CAER,RAVDESS数据集上进行了充分验证,实验结果表明,其在表情识别性能上优于目前的主流方法,证明了其有效性。

改进YOLOV7的跌倒人员检测

赵俊杰, 周晓静, 李佳欣

计算机科学. 2024, 51 (6A): 230800039-6. doi:10.11896/jsjkx.230800039

摘要 ( 193 )

PDF(4346KB) ( 345 )

参考文献 | 相关文章 | 多维度评价

随着人口老龄化的到来,老年人在跌倒后能否及时被发现并得到救治显得越来越重要。采用YOLOV7可以通过图像识别老年人跌倒,为提高原始YOLOV7的检测精度和速度,本研究对YOLOV7进行了一系列改进,并提出了一种新型YOLOV7结构——YOLOV7-CMJ。首先对收集到的图片进行处理,对部分图片进行了旋转、亮度等预处理,并对其进行标定以获取样本数据集;其次引入CBAM注意力机制,增强了通道注意力和空间注意力,从而提升模型的准确性;最后,将YOLOV7中原有的PANet特征融合改为MJPANet,即多跳动征融合结构,并将之前的Concat采用加权的方式进行替换,从而得到改进YOLOV7-CMJ结构。通过与原始YOLOV7进行实验对比可知,改进后的算法精度提高了7.4%、召回率提高了7.1%、平均精度提高了7.1%,证明了改进算法的有效性,更好地满足了摔倒检测要求。

CTGANBoost:基于CTGAN与Boosting的信贷欺诈检测研究

卓佩妍, 张瑶娜, 刘炜, 刘自金, 宋友

计算机科学. 2024, 51 (6A): 230600199-7. doi:10.11896/jsjkx.230600199

摘要 ( 143 )

PDF(2382KB) ( 285 )

参考文献 | 相关文章 | 多维度评价

在金融行业中,信贷欺诈检测是一项重要的工作,能够为银行和消金机构减少大量的经济损失。然而,信贷数据中存在类别不平衡和正负样本特征重叠的问题,导致少数类识别灵敏度低且不同类别数据区分度低。针对这些问题,提出一种面向信贷欺诈检测的CTGANBoost方法。首先,在AdaBoost(Adaptive Boosting)方法的每一轮Boosting迭代中,引入基于类别标签信息约束的CTGAN(Conditional Tabular Generative Adversarial Network)方法学习特征分布,进行少数类数据增强工作;其次,基于CTGAN合成的增强数据集,设计了权重归一化方法,确保在样本加权过程中保持原始数据集的分布特征和相对权重。在3个开源数据集上的实验结果表明,CTGANBoost方法的表现均优于其他主流的信贷欺诈检测方法,AUC值提升了0.5%~2.0%,F1值提升了0.6%~1.8%,验证了CTGANBoost方法的有效性和泛化能力。

基于Edge-TB的联邦学习中客户端选择策略和数据集划分研究

周天阳, 杨磊

计算机科学. 2024, 51 (6A): 230800046-6. doi:10.11896/jsjkx.230800046

摘要 ( 240 )

PDF(3558KB) ( 321 )

参考文献 | 相关文章 | 多维度评价

联邦学习是分布式机器学习在现实中的应用之一。针对联邦学习中的异构性,基于FedProx算法,提出优先选择近端项较大的客户端选择策略,效果优于常见的选择局部损失值较大的客户端选择策略,可以有效提高FedProx算法在异构数据和系统下的收敛速度,提高有限聚合次数内的准确率。针对联邦学习数据异构的假设,设计了一套异构数据划分流程,得到了基于真实图像数据集的异构联邦数据集作为实验数据集。使用开源的分布式机器学习框架Edge-TB作为实验测试平台,以异构划分后的Cifar10作为数据集,实验表明,采用新的客户端选择策略的改进FedProx算法较原算法在有限的聚合轮数内准确率提升14.96%,通信开销减小6.3%;与SCAFFOLD算法相比,准确率提升3.6%,通信开销减小51.7%,训练时间减少15.4%。

基于OOD评分的工业缺陷增强数据筛选研究

尹旭东, 陈俊洋, 周波

计算机科学. 2024, 51 (6A): 230700111-7. doi:10.11896/jsjkx.230700111

摘要 ( 179 )

PDF(4415KB) ( 281 )

参考文献 | 相关文章 | 多维度评价

在基于深度学习的工业缺陷检测中,数据增强能在一定程度上缓解部分缺陷数据缺乏的窘境,但如何从大量增强数据中筛选出有效的增强数据,提升工业检测模型的性能,目前尚未有相关研究。针对这一问题,进行了基于分布外检测(Out-of-Distribution Detection,OOD)评分的工业缺陷增强数据筛选研究。首先使用pix2pix网络生成工业增强数据,接着采用基于深度集成的OOD评分方法获得OOD评分,并利用该评分对增强数据进行分组;然后通过降维投影视图对增强数据分布进行分组观察;最后使用目标检测算法对增强数据进行分组缺陷检测,根据目标检测模型的精度增益探索分布外程度对增强数据质量的影响。实验结果表明,OOD评分较高的工业缺陷增强数据与训练数据分布差异较大,将这部分增强数据用于训练集的数据扩充能够提高模型的泛化性,可以更有效地提升目标检测算法的检测精度。

基于相似网络融合算法的癌症亚型预测

张晓茜, 李东喜

计算机科学. 2024, 51 (6A): 230500006-7. doi:10.11896/jsjkx.230500006

摘要 ( 122 )

PDF(3298KB) ( 254 )

参考文献 | 相关文章 | 多维度评价

从基因表达数据中挖掘基因之间的相互作用关系,构建基因调控网络,是生物信息学中重要的研究课题之一。但目前流行的神经网络在其架构中仅考虑基因之间的交互和关联,不考虑患者之间的交互和关联。为此,提出了一种基于加权基因相似网络和样本相似网络融合算法的癌症亚型预测模型,即WGCSS(Weighted Genetic Correlation network and Sample Similarity network)。该方法实现了特征空间和样本空间信息的融合,同时考虑了基因之间和样本之间的相互作用关系,并使用图卷积网络进行预测。在两个空间中聚合信息会导致严重的过度平滑问题,为此在该模型中引入残差层以缓解过度平滑问题。该方法通过聚合两个空间中的数据信息,可以使得癌症亚型预测的结果更加准确。为了验证方法的泛化性能,使用了乳腺浸润癌(BRCA)、多形性胶质母细胞瘤(GBM)和肺癌(LUNG)数据集进行分析,由此产生的高分类精度结果可以表明该方法的优越性。另外,还对3类数据集进行了生存分析,证明该方法在3个癌症数据集上癌症亚型的生存曲线存在显著差异。

基于注意力的多尺度蒸馏异常检测

乔虹, 邢红杰

计算机科学. 2024, 51 (6A): 230300223-11. doi:10.11896/jsjkx.230300223

摘要 ( 138 )

PDF(4867KB) ( 316 )

参考文献 | 相关文章 | 多维度评价

基于知识蒸馏的异常检测方法中,教师网络远大于学生网络,使得所得特征表示在同一位置对应图像的感受野不同。为解决此问题,可使学生网络与教师网络结构相同。然而,学生与教师网络完全相同,使得在测试阶段,对于异常样本,教师网络与学生网络特征表示差异过小而影响异常检测的性能。为解决该问题,提出了基于高效通道注意力模块的多尺度知识蒸馏异常检测方法(ECA Based Multi-Scale Knowledge Distillation Anomaly Detection,ECA-MSKDAD),并结合数据增强操作提出了相对距离损失函数。使用经过预训练的网络作为教师网络,同时使用与教师网络结构相同的网络作为学生网络。在训练阶段,对训练样本采取数据增强操作以扩充训练集的规模,并在学生网络中引入高效通道注意力(Efficient Channel Attention,ECA)模块,以增加教师网络和学生网络之间的差异,增大异常数据的重构误差,进而提高模型的检测性能。此外,利用相对距离损失函数,将数据间关系从教师网络传递到学生网络,对学生网络的网络参数进行优化。在MVTec AD进行实验,与9种相关方法比较,所提方法在异常检测与异常定位上均取得更优的性能。

基于方差迁移的非平衡数据过采样方法

郑一凡, 王卯宁

计算机科学. 2024, 51 (6A): 230400198-6. doi:10.11896/jsjkx.230400198

摘要 ( 134 )

PDF(2961KB) ( 296 )

参考文献 | 相关文章 | 多维度评价

重采样是解决非平衡数据分类问题的重要方法。但在数据集很小的情况下,欠采样会丢失数据集的重要信息,因此过采样是非平衡数据分类问题的研究重点。现有的过采样方法虽然部分解决了类间不平衡问题,但是本质上并未给少数类引入额外的信息,且仍然存在着过拟合的风险。针对这些问题,提出了一种基于多数类方差迁移的少数类合成方法(Variance Transfer Oversampling,VTO),从足够多样化的多数类中提取样本偏移向量,综合少数类和多数类的特征权重矩阵以调整,最终将经过置信条件筛选的偏移向量叠加至少数类样本中心,从而在少数类样本生成中引入多数类方差,进而丰富少数类特征空间。为了验证所提算法的有效性,使用决策树为分类模型在6个KEEL数据集上训练,对比SMOTEENN等其他过采样方法,以F-score和PR-AUC值为评价指标进行了实验。结果显示,该算法在处理非平衡数据分类问题时具有更大优势。

一种适用于大图的k步可达性查询算法

同正南, 卜天明

计算机科学. 2024, 51 (6A): 230500031-10. doi:10.11896/jsjkx.230500031

摘要 ( 140 )

PDF(2449KB) ( 284 )

参考文献 | 相关文章 | 多维度评价

k步可达查询用于在给定的有向无环图(Directed Acyclic Graph,DAG)中回答两点之间是否存在长度不超过k的路径。针对现有方法的索引规模大、查询处理效率低的问题,提出了一种构建在大图上的基于树覆盖的倍增索引来提高索引查询效率,并结合GRAIL算法和改进的 FELINE 算法对本身就不可达查询点对进行剪枝。基于 19 个真实的数据集进行了实验测试,并将所提算法与现有算法在构建索引大小、索引时间、查询时间3个指标上进行了实验对比。实验结果验证了所提算法的高效性。

融入类别标签和主题信息的用户兴趣识别方法

康智勇, 李弼程, 林煌

计算机科学. 2024, 51 (6A): 230500169-8. doi:10.11896/jsjkx.230500169

摘要 ( 151 )

PDF(2114KB) ( 287 )

参考文献 | 相关文章 | 多维度评价

社交网络用户兴趣发现对信息过载缓解、个性化推荐和信息传播正向引导等方面具有重要意义。目前已有的兴趣识别研究未能同时考虑文本主题信息及其对应的类别标签信息对模型学习文本特征的帮助,文中提出了一种融入类别标签和主题信息的用户兴趣识别方法。首先,利用BERT预训练模型、BiLSTM模型和多头自注意力机制分别获取文本和标签序列的语义特征;其次,引入标签注意力机制,使模型更加关注文本与其类别标签更相关的词语信息;然后,利用LDA主题模型和Word2Vec模型得到文本主题特征;接着,设计门控机制进行特征融合,使模型能够自适应地融合多种特征,进而实现微博文本兴趣类别分类;最后,统计用户发表的所有文本在各个兴趣类别上的数量,将数量最多的兴趣类别确定为用户兴趣识别结果。为验证所提方法的有效性,文中构建了一个微博兴趣识别数据集。实验结果表明,该模型在微博文本兴趣类别分类和用户兴趣识别任务中均取得了最优性能。

基于轻量级图卷积和隐式反馈增强的多样化推荐

黄春淦, 王桂平, 吴波, 白鑫

计算机科学. 2024, 51 (6A): 230900038-11. doi:10.11896/jsjkx.230900038

摘要 ( 144 )

PDF(3648KB) ( 268 )

参考文献 | 相关文章 | 多维度评价

近年来,研究人员一直在努力提高推荐系统的准确性,而忽视了多样化对用户满意度的重要影响。目前大多数多样化推荐算法在传统算法生成的准确性候选列表后施加多样性约束进行后处理。然而,这种解耦设计总是导致推荐系统的次优状态。与此同时,尽管利用图卷积神经(Graph Convolution Networks,GCN)的推荐算法在提高推荐准确性方面的有效性已得到证实,但用于推荐的适用性和多样性设计仍然被忽视。此外,推荐算法采用用户购买这一单一的显式反馈无可避免地陷入“推荐过剩”。因此,提出一种端到端的多样化轻量级图卷积网络推荐模型(DiversifiedLight Graph Convolution Networks Recommendation,DLGCRec)来克服以上弊端。首先,将图卷积简化为轻量级图卷积(Light Graph Convolution Networks,LGCN)以便于推荐,并利用轻量级图卷积将多样化推向上游准确性匹配推荐过程。然后,在轻量级图卷积的采样阶段,利用引入了用户隐式反馈的多样性增强负采样来探索用户的多样化偏好。最后,利用多层特征融合策略捕获节点的完整特征嵌入,提升推荐性能。在真实数据集上进行实验,结果验证了DLGCRec在适用推荐和提升多样性方面的有效性。进一步的消融研究证实,DLGCRec有效地缓解了准确性-多样性困境。

基于图自编码器和GRU网络的分层交通流预测模型

赵子琪, 杨斌, 张远广

计算机科学. 2024, 51 (6A): 230400148-6. doi:10.11896/jsjkx.230400148

摘要 ( 177 )

PDF(3354KB) ( 309 )

参考文献 | 相关文章 | 多维度评价

准确的交通流预测信息不仅可以为交通管理人员提供交通决策的坚实基础,还可以减少交通拥堵情况。在交通流预测任务中,获得有效的交通流的时空特性是保证预测效果的前提。现有的方法大多是用未来时刻的数据进行监督学习,提取的特征具有局限性。针对现有预测模型无法充分挖掘交通流的时空特性的问题,提出了基于改进的图自编码器和门控循环单元的分层交通预测模型。首先使用图注意力自编码器以无监督的方式深度挖掘交通流的空间特性,然后使用门控循环单元进行时间特征提取。分层结构采用分开训练的方式进行时空依赖关系的学习,旨在获取路网天然存在的空间拓扑特征,使其可以兼容不同时间步下的交通流预测任务。大量实验证明,所提出的GAE-GRU模型在不同数据集下的交通预测任务中取得了优异的表现,MAE,RMSE和MAPE指标均优于基线模型。

基于改进主题模型方法的三级短视频用户画像的研究

黄玉民, 赵婵婵

计算机科学. 2024, 51 (6A): 230800093-7. doi:10.11896/jsjkx.230800093

摘要 ( 149 )

PDF(3055KB) ( 389 )

参考文献 | 相关文章 | 多维度评价

针对如何从海量短视频数据、用户数据、交互数据中快速抽象出精准的用户兴趣的问题,提出了基于主题模型的三级标签用户画像构建方法。基于主题构建方法,将融合的LDA和GSDMM主题模型所获取的视频主题词作为用户兴趣表达向量。首先,搭建了LDA过滤器,通过比对阈值剔除与主题无关的文本信息,缩小文本规模,降低非主要语料对于兴趣表达向量生成的影响。然后,提出结合语义信息和语境信息的特征词权重矩阵的构建方法,使用Bi-GRU神经网络计算词向量的上下文特征,并将其作为语境特征,使用TF-IDF算法计算出的词频权重作为语义特征,结合语境和语义特征扩充特征词含义。最后使用带有兴趣权重分配的GSDMM模型学习特征向量权重矩阵,实现用户兴趣标签生成和用户不同喜好程度影响下的兴趣权重修正。实验结果表明,该方法能够比较完备准确地表征用户画像,优于单一的主题构建方法,并且在聚类效果上表现出色。通过构建完备的用户画像,能够精准把握用户痛点,为后续个性化推荐提供服务。

基于本体驱动的航空情报表格信息结构化研究

赖欣, 李思宁, 梁昌盛, 张恒嫣

计算机科学. 2024, 51 (6A): 230800150-7. doi:10.11896/jsjkx.230800150

摘要 ( 139 )

PDF(3804KB) ( 284 )

参考文献 | 相关文章 | 多维度评价

航空资料汇编是国际民航组织推荐的呈现各国航空信息的主要载体,其中以表格数据形式汇总了大量航空数据与航空运行限制信息。为实现航空汇编资料的智能查询,以及对航空资料汇编中静态数据的挖掘与利用,需要对航空汇编资料中的表格信息予以特征提取与结构化处理。将航空资料汇编中表格信息作为研究对象,提出了一种基于本体驱动的航空情报表格信息结构化抽取方法。首先构建航空情报领域信息的本体框架,实现对领域知识统一规范的描述;其次,利用Document AI对表格文档的布局结构进行研究与预处理,并利用随机森林算法与条件随机场模型进行特征实体提取验证与分析。实验结果表明,所提方法能够有效提取航空情报表格中的特征实体,为航空情报领域静态数据深入挖掘提供参考。

RM-RT²NI:融合评论时效与可信近邻影响力的推荐模型

韩志耕, 周婷, 陈耿, 付纯硕, 陈健

计算机科学. 2024, 51 (6A): 230800160-7. doi:10.11896/jsjkx.230800160

摘要 ( 132 )

PDF(2500KB) ( 296 )

参考文献 | 相关文章 | 多维度评价

基于矩阵分解的推荐模型虽然能够处理高维评分数据,但容易遭受评分数据稀疏性的困扰。基于评分和评论的推荐模型通过外加隐藏在评论中的用户偏好与物品属性信息,缓解了评分数据的稀疏性,但在特征提取时大多没有关注评论时效性和可信近邻影响力,无法获得更丰富的用户和物品特征。为进一步提高推荐精度,提出了融合评论时效与可信近邻影响力的推荐模型RM-RT²NI。基于评分矩阵,该模型使用矩阵分解提取了用户偏好和物品属性的浅层特征,利用云模型和修正的用户相似度评估模型和新构建的信度评估模型提取出可信近邻影响力;基于评论文本,该模型利用BERT模型获得每条评论的隐表达,利用双向GRU提取评论间的联系,利用新构建的融合时间因子的注意力机制识别各评论的时效贡献度,以获取用户和物品的深层特征。在此基础上,将用户浅层特征、深层特征以及可信近邻影响力特征融合成用户特征,将物品浅层特征和深层特征融合成物品特征,并将它们输入全连接神经网络以预测用户-物品评分。在5组公开数据集上对RM-RT²NI的推荐性能进行了实验评估,结果显示,与7个基线模型相比,RM-RT²NI具有更高的评分预测精度,且RMSE平均降低了3.0657%。

基于SEIR模型的网络热搜话题传播仿真研究

殷艳艳, 王克克, 田姣姣, 李默, 薛雅心, 卢春雨, 赵云鹏

计算机科学. 2024, 51 (6A): 230500107-6. doi:10.11896/jsjkx.230500107

摘要 ( 156 )

PDF(2902KB) ( 292 )

参考文献 | 相关文章 | 多维度评价

网络热搜话题具有传播扩散现象,当前对于网络热搜话题的研究主要集中在传播效果评估、传播趋势预测、社会影响评价以及舆论引导等方面,而对于网络热搜话题的研究未能揭示传播动力学参数对于传播过程的影响。文中采用SEIR模型构建了网络热搜话题传播动力学模型,分析研究了网络平均度、不信任概率、接触后立即传播概率、感染率、治愈率、复发率等影响因素对模型的影响。

基于自编码的改进K-means光伏能源数据清洗方法

彭勃, 李耀东, 龚贤夫

计算机科学. 2024, 51 (6A): 230700070-5. doi:10.11896/jsjkx.230700070

摘要 ( 148 )

PDF(2046KB) ( 327 )

参考文献 | 相关文章 | 多维度评价

智能电网的发展带来了海量能源数据,数据质量是开展数据价值挖掘等任务的基础。然而,多源海量光伏能源数据的采集与传输过程中不可避免地存在异常数据,因此需要进行数据清洗。目前,基于传统统计机器学习的数据清洗模型存在一定的局限性。文中提出了一种基于Transformer自编码结构的改进型K-means聚类模型,用于能源大数据清洗。该模型通过肘部法则自适应地确定聚类簇数,并利用自编码网络对聚类内数据进行压缩和重构,从而实现异常数据的检测和恢复。同时,模型利用Transformer的多头注意力机制学习数据间的相关特征,提高了对异常数据的筛查能力。在光伏发电公开数据集上的实验证明,与其他方法相比,该模型具有更好的异常数据检测效果,筛查准确率可达96%以上。此外,所提模型能在一定程度上恢复异常数据,为能源大数据应用提供了有效的支持。

深度学习驱动下IaaS云运维异常检测算法的研究进展

司佳, 梁建峰, 谢硕, 邓英俊

计算机科学. 2024, 51 (6A): 230400016-8. doi:10.11896/jsjkx.230400016

摘要 ( 159 )

PDF(2795KB) ( 354 )

参考文献 | 相关文章 | 多维度评价

异常检测是IaaS云系统运维中的一个关键任务,通过早期预警和提前干预,可有效避免系统崩溃等严重事故的发生。但相较于传统数据中心,IaaS云系统具有较大规模的计算节点,节点拓扑复杂、监测数据量大、缺少标注信息等特点,为IaaS云运维异常检测带来新的挑战。从深度学习的技术框架出发,分析了异常检测问题面临的难点,调研总结了IaaS云系统下常见异常检测算法和相关技术。面向节点异常和系统异常两类典型问题,对深度学习驱动的解决方法进行调研:面向节点级别异常,重点调研了时间依赖的运维数据下由时序数据驱动的检测算法;面向系统级别异常,重点调研了网络拓扑建模下由图数据驱动的检测算法。最后,提出了数据驱动下IaaS云运维数据异常检测中的新问题与新挑战。

基于深度强化学习的数据中心热感知能耗优化方法

李丹阳, 吴良基, 刘慧, 姜静清

计算机科学. 2024, 51 (6A): 230500109-8. doi:10.11896/jsjkx.230500109

摘要 ( 122 )

PDF(2863KB) ( 272 )

参考文献 | 相关文章 | 多维度评价

随着数据中心规模的不断扩大,所引起的高能耗、高运营成本和环境污染等问题日益严重,严重影响了数据中心的可持续性。大多数数据中心能耗优化方法为了降低计算能耗,会将任务集中在尽可能少的服务器上,但这样做往往会导致数据中心热点的产生,并且提高了冷却能耗。为了解决这一问题,文中首先对数据中心进行建模,并将数据中心总能耗优化问题建模为一个任务调度问题,并且要求调度过程中不产生数据中心热点。为了解决该问题,文中提出了一种基于深度强化学习的数据中心任务调度方法,并使用奖励塑造对该方法进行优化,在不产生热点的前提下降低数据中心的总能耗。最后,通过仿真环境和真实数据中心负载跟踪数据进行了实验。仿真实验结果表明,所提方法相比其他现有的调度方法能够更好地降低数据中心总能耗,最多降低了25.5%。此外,提出的优化方法还不会产生热点,这进一步证明了其优越性。

基于ARM架构的边缘计算服务器关键平台研究

刘东, 王瑞锦, 赵彦钧, 马朝阳, 袁昊男

计算机科学. 2024, 51 (6A): 230600119-8. doi:10.11896/jsjkx.230600119

摘要 ( 130 )

PDF(4322KB) ( 296 )

参考文献 | 相关文章 | 多维度评价

针对现有边缘计算基础网关服务器既不具备安全、稳定、可靠与通用性强等特点,又无法支持边缘计算场景的计算任务等问题,文中首次在基于ARM架构的鲲鹏920芯片的长虹天宫边缘计算服务器TG225B1上,设计并实现了适用于边缘计算场景的iBMC软硬件架构。该架构采用ARM国产化硬件底座,支持边缘网关硬件管理,实现工控多协议的自适应交互框架。对符合性、功能、性能、易用性、维护性、可靠性、兼容性等指标进行测试,表明iBMC架构能较好满足边缘计算服务器的需求。

一种时延能耗感知的在轨边缘计算任务卸载调度方法

王众晓, 彭青蓝, 孙若骁, 徐锡峰, 郑万波, 夏云霓

计算机科学. 2024, 51 (6A): 240100188-9. doi:10.11896/jsjkx.240100188

摘要 ( 202 )

PDF(3741KB) ( 452 )

参考文献 | 相关文章 | 多维度评价

全球智能设备的迅速增长引发了对计算资源下沉至边缘的巨大需求,催生了边缘计算范式的出现。同时,计算资源稀缺的偏远地区用户对算力的需求又推动了在轨边缘计算(Orbit Edge Computing,OEC)概念的提出和发展。在OEC场景下,偏远地区用户可以通过星地和星间通信链路将计算任务卸载至部署在低轨卫星上的边缘服务器,以此突破地面计算通信基础设施的限制,为偏远地区的用户提供低时延和高可靠的服务。然而,OEC场景中卫星算力受有限载荷和太阳能转化效率约束,同时还存在低轨卫星绕地导致的高度动态的星地连接造成的可用时隙有限的限制,面临着计算资源稀缺和可用通信时间有限所带来的挑战。因此,需要高质高效的任务卸载决策算法来保证OEC系统的高效运行。然而,目前在OEC场景下任务卸载方法大多在处理任务时无法兼顾计算任务卸载时延与能耗,此外传统方法还缺少对任务多样性的考量。针对上述问题,提出了一种基于自适应大邻域搜索的在轨边缘计算任务卸载方法OEC-ALNS,该方法以任务类型加权的任务处理成本为优化目标,并针对性地提出了基于最小化时延的破坏算子和修复算子来进一步提升搜索效率和卸载调度质量。基于Walker Delta低轨卫星星座和真实计算任务数据的实验结果表明,与传统的OEC-TA(OEC Task Allocation)方法相比,提出的OEC-ALNS方法在多个任务集异构的OEC场景中最多能够减少42.22%的加权任务处理成本和降低42.46%的平均时延。

WiCare:一种非接触式的老人如厕跌倒监测模型

段鹏松, 刁宪广, 张大龙, 曹仰杰, 刘广怡, 孔金生

计算机科学. 2024, 51 (6A): 230700044-8. doi:10.11896/jsjkx.230700044

摘要 ( 136 )

PDF(3884KB) ( 285 )

参考文献 | 相关文章 | 多维度评价

老人在卫生间内的跌倒行为存在因救助及时性差而导致严重危害的风险,因此高效快捷的如厕跌倒监测研究具有重要意义。针对当前基于Wi-Fi感知的跌倒监测方法中存在的受噪声影响大而特征提取不充分、监测精度有限的问题,提出了一种基于多级离散小波变换和软阈值处理的信号降噪算法,及一种融合卷积神经网络、双向长短期记忆网络及自注意力机制的非接触式如厕跌倒监测模型WiCare。首先,从原始CSI数据中提取振幅作为基础数据;其次,使用多级离散小波变换和软阈值处理进行感知数据降噪;然后,将感知数据进行多维重构,以更准确地表征跌倒行为特征;最后,利用WiCare提取感知数据中的有效特征,进而实现卫生间如厕跌倒行为监测功能。实验结果表明,WiCare在居家卫生间环境下对跌倒行为监测的准确率为99.41%,与其他同类模型相比,WiCare的识别准确率高,模型复杂度低,且泛化能力更强。

可靠性感知的边缘计算VNF实例放置

梁晶语, 马博闻, 黄霁崴

计算机科学. 2024, 51 (6A): 230500064-6. doi:10.11896/jsjkx.230500064

摘要 ( 157 )

PDF(2612KB) ( 319 )

参考文献 | 相关文章 | 多维度评价

为了解决日益增长的延迟敏感型应用程序和用户需求与计算资源受限的冲突,移动边缘计算(Mobile Edge Computing,MEC)已经成为一种很有前途的计算范式。服务提供商通过在边缘环境中部署虚拟化网络功能(Virtual Network Functions,VNF),为用户提供更加高效和可扩展性的服务供应链(Service Function Chain,SFC)来满足用户请求。若在提供服务过程中出现不可靠的服务或严重的服务失败,可能导致用户的巨大损失,所以网络服务提供商必须保证提供持续可靠的服务。针对该问题,考虑了边缘服务器的可靠性,利用计算统一设备架构(Computational Unified Device Architecture,CUDA)支持的门控循环单元(Gate Recurrent Unite,GRU)来预测VNF实例是否可用,通过预测结果,提前对VNF进行备份,避免了过度冗余备份造成的成本过高问题。考虑服务器的存储资源有限,提出了基于VNF实例可用性的放置(RVP)算法,优化服务提供商的成本。最后对提出的算法进行了性能评估,实验结果验证了RVP算法的优越性。

一种基于谱图SIFT的同源频谱监测数据判定方法

鲁东生, 龙华

计算机科学. 2024, 51 (6A): 230300177-7. doi:10.11896/jsjkx.230300177

摘要 ( 174 )

PDF(3630KB) ( 288 )

参考文献 | 相关文章 | 多维度评价

随着各类无线电应用的普及,在一定空间范围内,超短波监测过程中的监测数据易受到非同源的同频或邻频信号的影响,仅依靠常规监测中的频谱数据是无法判定信号是否同源的,因而不同监测站点获得的数据缺乏关联性,数据分析结果可能产生误导,降低工作效率。依据人工监测的经验,尝试用计算机视觉等技术分析监测数据的频谱图和时频谱图,结合谱图特性引入角度阈值改进SIFT算法的特征点匹配模式,以适应无线电监测数据分析的需要,并提出以图像特征点检测匹配率为前提,利用卡帕值综合评价两种谱图同源判定结果一致性的方法。通过实验模拟和实例验证,两种谱图同源判定结果的卡帕值为0.7605,达到高度一致;同时,所提方法在实践过程中有提高工作效率的作用,具备操作可行性和实际意义。

基于博弈论的认知无线电动态频谱分配策略

滕志军, 张爱玲, 付雨珊

计算机科学. 2024, 51 (6A): 230500138-5. doi:10.11896/jsjkx.230500138

摘要 ( 138 )

PDF(2582KB) ( 320 )

参考文献 | 相关文章 | 多维度评价

对于无线网络频谱分配过程中存在系统收益低和频谱利用率不理想等缺陷,引入干扰价格来控制认知用户发射功率引起的干扰,建立频谱租赁模型,并提出非合作博弈下的动态频谱分配策略,以提高频谱利用率,改善系统收益;创建非合作博弈下的效用函数,推导纳什均衡解,并在权衡网络效用后确定效用权重因子。仿真实验结果证实,所提算法最优发射功率小,频谱利用率高,可获得更优的系统收益。

基于概率误差的三维室内定位系统最优布站方法

谷雨泰, 赵京翼, 杨腾, 陈冲

计算机科学. 2024, 51 (6A): 230700148-7. doi:10.11896/jsjkx.230700148

摘要 ( 151 )

PDF(4111KB) ( 322 )

参考文献 | 相关文章 | 多维度评价

随着智能化、自动化技术的不断发展,室内定位技术的应用场景日益广泛,如何提高室内定位系统的精度和可靠性一直是研究热点。对基站布局进行优化,提升系统整体的定位精度是现有的室内定位系统优化方法之一。对于该方法,现有的研究普遍选择采用其他相似领域的已有方法,主要的两种方法中用于评价卫星共轭的精度稀释因子忽略了基站与标签的距离;作为导弹、惯导系统中落点精度评价因子的概率误差方法没有考虑基站几何结构的影响。对此,提出了一种基于精度稀释因子和概率误差方法的精度评价模型,用于推导三维室内定位系统的最优基站布局,该模型同时考虑了距离和几何结构对室内定位精度的影响,可以很好地应用于室内定位的领域。所提方法在程序模拟和实际定位实验中均取得了优异的效果。在程序模拟中,最优基站布局系统的定位误差均值相比传统四顶角定位系统降低了约14.38%,在实际定位实验中,最优布局的定位精度和效果都得到了显著提升。实验结果验证了精度评价模型的准确性与实用性。所提出的最优基站布局方法在三维室内定位领域具有很高的应用价值和普适性,能够有效提高室内定位系统的精度和效果。

企业API网关热插拔插件的设计与实现

王盛义

计算机科学. 2024, 51 (6A): 230800176-7. doi:10.11896/jsjkx.230800176

摘要 ( 113 )

PDF(3293KB) ( 270 )

参考文献 | 相关文章 | 多维度评价

为了解决微服务架构下传统API网关扩展能力弱、无法热更新等问题,对API网关扩展性进行研究分析,引入热插拔机制来实现企业API网关热插拔插件,同时,提出了一种企业API网关热插拔插件解决方案。实验结果表明,所提出的API网关的热插拔插件方案在支持网关插件热更新的同时不会对API网关的整体性能造成影响,也不会对业务功能的稳定性造成影响。目前,企业API网关已经在几十家大型企业得到应用,提供了身份鉴权、限流限速、协议转换、请求改写等30余种热插拔插件。通过企业API网关彻底解决了原有API网关无法热更新、热部署、难扩展等问题,减少了40%的重复开发工作,节省了30%运维成本,为企业API网关的进一步发展和应用提供了有益的参考,也为构建高效、安全、可扩展的企业API网关提供了新的思路。

多线程C程序内存安全性动态分析方法

严瑞, 陈哲

计算机科学. 2024, 51 (6A): 230900115-6. doi:10.11896/jsjkx.230900115

摘要 ( 147 )

PDF(1915KB) ( 316 )

参考文献 | 相关文章 | 多维度评价

随着软件结构越来越复杂以及其要求更高级别的并发量,出现了越来越多的多线程程序,同时C语言程序缺乏检测其内存安全的能力,进而导致C语言实现的程序可能会存在较多的隐藏漏洞,因此对多线程C程序的内存安全检测尤为的重要。较为前沿且可靠的检测内存安全的技术主要为动态分析技术,且现在对于多线程C程序内存安全检测的工具不是特别完善,错误检测不完全,性能不是很高。因此提出了基于指针的动态分析技术,同时结合无锁技术、源代码插桩技术实现了工具Movec来对多线程C程序的内存安全性进行检测,并且选取专业测试集来进行实验,验证了本工具对于多线程C程序检测内存安全是有效的,检测的错误更多且性能较为优秀。

基于跳表的secGear性能优化方法

唐鑫, 狄农雨, 杨浩, 刘忻

计算机科学. 2024, 51 (6A): 230700030-5. doi:10.11896/jsjkx.230700030

摘要 ( 112 )

PDF(2126KB) ( 263 )

参考文献 | 相关文章 | 多维度评价

机密计算自提出以来,已成为云计算安全问题的重要解决方案。其凭借为云用户提供一个隔离的可信执行环境(TEE),来保证代码和数据的机密性和完整性。但目前主流的机密计算技术存在I/O较慢等性能瓶颈,因此,如何提高机密计算的性能成为了研究热点。现有研究未从数据本身出发进行优化,并不适用于大数据的真实环境。在TEE中设计并实现了一种能够高效组织管理数据的跳表数据结构,以优化机密计算的运行效率,降低TEE中数据处理的开销。最后,通过在国产机密计算框架secGear中进行了对比实验,证明所提方法相比红黑树在数据顺序插入、删除、查找的时间开销方面分别获得了13.5%,10.5%以及1.9%的提升,相比链表在随机插入时性能也得到了明显的提升,能有效提高机密计算的运行效率,具有更好的实际应用意义。

基于推荐列表的缺陷文件识别

王昭丹, 邹卫琴, 刘文杰

计算机科学. 2024, 51 (6A): 230600088-8. doi:10.11896/jsjkx.230600088

摘要 ( 146 )

PDF(2383KB) ( 297 )

参考文献 | 相关文章 | 多维度评价

缺陷定位是缺陷修复的关键步骤,同时也是一项繁琐的软件活动。现有的静态缺陷定位技术通常将缺陷定位视为一个检索任务,即为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排列的可疑文件推荐列表。然而,开发人员仍需人工一一审查从而找到真正有缺陷的文件,这增加了定位的时间和成本。为解决这个问题,提出了一个相应的解决方案。首先运行主流的基于信息检索的静态缺陷定位技术来获得一个初始的可疑文件推荐列表;然后依据问题特性提出3类领域特征,并基于这3类特征构建一个机器学习模型,尝试从列表中识别出真正有缺陷(Truly Buggy)的源代码文件。在4个开源项目(Zoo-Keeper,OpenJPA,Tomcat,AspectJ)的2558个bug上进行了实验,结果表明,在最初可疑文件推荐列表上可以获得72.6％～80.7%的真正有缺陷的文件预测准确率。同时探究了3类特征子集及各个特征在预测真正有缺陷的文件上的重要性,发现缺陷报告与源代码的关系特征更重要。

矩阵乘法的GPU并行计算时耗模型与最优配置方法

雷超, 刘江, 宋佳文

计算机科学. 2024, 51 (6A): 230300200-8. doi:10.11896/jsjkx.230300200

摘要 ( 181 )

PDF(5030KB) ( 409 )

参考文献 | 相关文章 | 多维度评价

水平矩阵乘竖直矩阵是科学计算及工程领域中的基本计算之一,很大程度上影响了整个算法的计算效率。GPU并行计算是迄今主流的并行计算方式之一,其底层设计使得GPU非常契合于大规模矩阵计算。迄今已经有许多研究基于GPU并行计算框架,针对矩阵的结构设计、优化矩阵乘法,但尚未有针对水平矩阵乘竖直矩阵的GPU并行算法及优化。此外,GPU 核函数配置直接影响计算效率,但迄今针对最优核函数配置的研究极为有限,通常需要研究人员针对具体算法的计算特点启发式地设置。基于GPU的线程、内存模型,设计了一种并行水平矩阵乘竖直矩阵乘法PHVM。数值实验结果表明,在左乘矩阵的水平维度远远大于竖直维度时,PHVM要显著优于NVIDIAcuBLAS库中的通用矩阵乘法。进一步,基于GPU的硬件参数,建立了PHVM运行时间的核函数配置最优化理论模型。数值实验结果表明,该理论模型较为准确地描述了 PHVM 算法运行时间随核函数配置(网格大小、线程块大小)变换的变化趋势,且模型得出的理论最优核函数配置与实际最优运行核函数配置相符。

基于DNN模型输出差异的测试输入优先级方法

朱进, 陶传奇, 郭虹静

计算机科学. 2024, 51 (6A): 230600121-8. doi:10.11896/jsjkx.230600121

摘要 ( 125 )

PDF(3498KB) ( 251 )

参考文献 | 相关文章 | 多维度评价

深度神经网络测试需要大量的测试数据来保证DNN的质量,但大多数测试输入缺乏标注信息,而且对测试输入进行标注会带来高昂的人工代价。为了解决标注成本的问题,研究人员提出了测试输入优先级方法,筛选高优先级的测试输入进行标注。然而,大多数优先级方法都受到有限情景的影响,例如难以筛选出高置信度的误分类输入。为了应对上述挑战,文中将差分测试技术应用于测试输入优先级,并提出了基于DNN模型输出差异的测试输入优先级方法(DeepDiff)。DeepDiff首先构建一个与原始模型具有相同功能的差分模型,然后计算测试输入在原始模型与差分模型之间的输出差异,最后为输出差异较大的测试输入分配更高的优先级。在实验验证中,我们对4个广泛使用的数据集和相应的8个DNN模型进行了研究。实验结果表明,在原始测试集上,DeepDiff的有效性比基线方法平均高出13.06%,在混合测试集上高出39.69%。

Dilithium算法的FPGA高效扩展性优化

燕云飞, 李斌, 魏源鑫, 张博林, 马添翼, 周清雷

计算机科学. 2024, 51 (6A): 230800138-9. doi:10.11896/jsjkx.230800138

摘要 ( 167 )

PDF(2933KB) ( 265 )

参考文献 | 相关文章 | 多维度评价

为提高Dilithium在实际应用中的运行效率,提出了一种Dilithium算法的现场可编程门阵列(Field Programmable Gate Array,FPGA)高效扩展性优化实现。具体在以下几个方面进行优化:将KOA(Karatsuba-Offman-Algorithm)算法与快速模约减算法相结合,构成快速模乘单元,优化数论转换(Number TheoreticTransform,NTT)实现的大量多项式乘法;采用多RAM(Random Access Memory)存取参与运算的多项式系数,根据Dilithium算法的特点,设计了一种多项式系数读取策略,以快速、正确地读取RAM中的多项式系数。针对方案中的采样和散列工作,分析了SHAKE算法系列的特点,设计了一种低延迟可扩展的Keccak硬件架构,使得其能够根据输入信号的不同执行不同的SHAKE算法。实验结果表明,所提方案在频率方面相比其他方案提升了60.7%~131.9%,兼顾硬件的资源消耗和执行效率。

基于领域知识微调的缺陷报告严重性预测

陈冰婷, 邹卫琴, 蔡碧瑜, 刘文杰

计算机科学. 2024, 51 (6A): 230400068-7. doi:10.11896/jsjkx.230400068

摘要 ( 127 )

PDF(2873KB) ( 248 )

参考文献 | 相关文章 | 多维度评价

有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要。现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的问题。对此,提出一种基于领域知识微调的缺陷报告严重性预测方法。利用能充分考虑文本上下文语义的BERT预训练模型,并使用缺陷报告数据对其进行模型微调使其学习到相关的领域知识。微调后的BERT模型用于抽取缺陷报告的语义特征,随后使用支持向量机进行严重性预测模型的构建。在 Mozilla,Eclipse和Apache 选取的共计 15个项目上进行的实验表明,在准确率、召回率和 F1 值上,相较传统的信息检索方法,所提方法分别能提升4.5%～22.0%,3.0%～22.0%,4.0%～22.0%;相较通用 BERT 模型,微调后的 BERT 模型的准确率、召回率和 F1 值分别能够提高2.0%～5.1%,1.9%～5.1%,1.8%～5.0%。

面向利润优化的软实时云服务调度与多服务器系统配置方法研究

王添, 沈伟, 张功萱, 徐林丽, 王震, 郁云

计算机科学. 2024, 51 (6A): 230900099-10. doi:10.11896/jsjkx.230900099

摘要 ( 134 )

PDF(2835KB) ( 299 )

参考文献 | 相关文章 | 多维度评价

在云计算中,由于多核技术的不断革新,近年来有许多工作研究了基于多核处理器的多服务器系统。云服务提供商通过建立多服务器系统给用户提供云服务并优化云服务利润是目前云计算领域的一个热点问题,对这些问题的研究推动着云计算技术的不断发展。然而,现有的关于多服务器系统的研究要么局限于通过对多服务器计算资源的配置来优化云服务利润而忽视了云服务请求本身的可调度性,要么局限于开发服务请求调度策略来提升云服务利润而忽视了多服务器系统的动态扩展性。但若使用云服务请求调度与多服务器配置协同优化来提升云服务利润,则会使问题规模的复杂性呈指数增长。因此,为云服务提供商设计一个面向软实时云服务请求的云服务调度与多服务器配置方法是十分必要的。此外,现有的研究在配置多服务器系统时大多忽略了处理云服务请求会遭受瞬时故障的情况。而许多研究表明,软实时任务在遭受瞬时故障时会影响服务请求的执行结果从而影响云服务利润。本研究面向软实时云服务请求,针对云环境中普遍存在的计算性能异构的服务器资源,开发了一个基于深度搜索的灰狼算法来协同优化云服务请求调度和多服务器配置以最大化云服务利润。最后,为了验证所提方法的有效性,进行了大量实验,实证结果表明,与现有的基准方法相比,所提方法得到的云服务利润平均增加了6.83%。

基于深度强化学习的二进制代码模糊测试方法

王栓奇, 赵健鑫, 刘驰, 武伟, 刘钊

计算机科学. 2024, 51 (6A): 230800078-7. doi:10.11896/jsjkx.230800078

摘要 ( 197 )

PDF(2459KB) ( 351 )

参考文献 | 相关文章 | 多维度评价

漏洞挖掘是计算机软件安全领域的主要研究方向,其中模糊测试是重要的动态挖掘方法。为解决二进制代码漏洞挖掘中汇编代码体积庞大导致检测既困难又耗时、模糊测试效率低下等问题,提出基于深度强化学习的二进制代码模糊测试方法。首先将模糊测试过程建模为面向强化学习的多步马尔可夫决策过程,通过构建深度强化学习模型辅助模糊测试变异策略选择,实现对变异策略的动态优化。然后设计和搭建基于深度强化学习的二进制代码模糊测试平台,利用AFL实现模糊测试环境,并使用Keras-RL2库和OpenAI Gym框架实现深度强化学习算法和强化学习环境。最后通过实验分析来验证所提方法和测试平台的有效性和适用性,实验结果显示深度强化学习模型能够辅助模糊测试过程快速覆盖更多路径,能够暴露更多漏洞缺陷,显著提高二进制代码漏洞挖掘和定位的效率。

基于标识与区块链融合的数据安全框架研究

朱军, 张国印, 万静静

计算机科学. 2024, 51 (6A): 230400056-5. doi:10.11896/jsjkx.230400056

摘要 ( 134 )

PDF(4244KB) ( 308 )

参考文献 | 相关文章 | 多维度评价

工业互联网标识解析系统已经成为支撑产业数字化转型的重要新型基础设施。结合目前数据的安全性问题,通过对标识解析架构的梳理,在区块链分布式拓扑结构及其信息安全特性的基础上提出标识与区块链融合的数据安全框架,构建协同模式的安全监管融合的数据安全框架,重点介绍了数据的收集、存储、传输、共享、确权和交易的全流程安全,然后从保密性、完整性、可用性、可追溯性等维度提出标识数据监测的安全指数体系。最后提出数据安全的保护要从固定位置数据的资产保护转变为业务系统数据的加工保护,从关注攻击行为转变为数据生命周期,从防漏洞、补漏洞转变为理数据、管数据的思路上来。

无人机系统安全性综述

王震, 周超, 樊永文, 石鹏飞

计算机科学. 2024, 51 (6A): 230800086-6. doi:10.11896/jsjkx.230800086

摘要 ( 338 )

PDF(2039KB) ( 383 )

参考文献 | 相关文章 | 多维度评价

近年来,无人机越来越受欢迎,无人机在军事、农业、交通运输、电影、供应链和监控等各个行业都有着巨大的潜力。尽管无人机给人们提供了种种便利,但如今与无人机相关的安全事件却层出不穷。恶意方可能对无人机进行攻击,并利用无人机进行危及生命的活动。因此,世界各国政府已经开始规范无人机的使用。无人机需要一种智能和自动化的防御机制,以确保人类、财产和无人机本身的安全。而无人机操作系统防护是防止入侵攻击的一个重要部分。首先,对无人机结构进行了简要介绍;然后,研究了用于消费和商用无人机的现有操作系统的安全性。最后,调查了无人机操作系统的各种安全问题和可能的解决方案。

基于区块链的可搜索属性加密技术应用综述

兰亚杰, 马自强, 陈嘉莉, 苗莉, 许新

计算机科学. 2024, 51 (6A): 230800016-14. doi:10.11896/jsjkx.230800016

摘要 ( 205 )

PDF(2165KB) ( 536 )

参考文献 | 相关文章 | 多维度评价

随着信息共享的蓬勃发展,数据隐私安全问题逐渐凸显,催生了区块链技术和可搜索属性加密技术的迅速发展。区块链作为一种去中心化、不可篡改的技术,保障了搜索数据的安全性和完整性,可搜索属性加密技术可以有效地防止非法用户的访问查询。然而随着数据规模和复杂性的增加,出现了检索效率低、查询结果验证复杂、属性权限分发困难等问题。首先,针对以上问题,分别总结了基于区块链的可搜索加密技术、基于区块链的属性加密技术以及基于区块链的可搜索属性加密技术应用的研究现状。其次,对三者之间的优势和侧重点进行了比较分析。最后,重点总结了基于区块链的可搜索属性加密技术在关键字检索、属性权限管理以及数据完整性验证方面的应用,以及所面临的问题和挑战。希望为实现更安全、高效、去中心化的数据存储与共享提供更加安全的技术应用支持。

边缘计算下差分隐私的应用研究综述

孙剑明, 赵梦鑫

计算机科学. 2024, 51 (6A): 230700089-9. doi:10.11896/jsjkx.230700089

摘要 ( 201 )

PDF(3553KB) ( 347 )

参考文献 | 相关文章 | 多维度评价

为了解决传统云计算模式的延迟和带宽限制,应对物联网和大数据时代的需求,边缘计算开始崭露头角并逐渐受到广泛关注。在边缘计算环境下,用户数据的隐私问题成为了一个重要的研究热点。差分隐私技术有着坚实的数学基础,它作为一种有效的隐私保护算法,已经被广泛应用于边缘计算中,两者的结合有效缓解了隐私保护低和计算成本高的问题。首先介绍了互联网发展带来的问题,其次介绍了边缘计算的基本概念、特点和组成部分,并概括了与传统云计算相比的优势,然后对差分隐私的基本概念和原理进行了概括,进而详细阐述了差分隐私的3种扰动方式和常用的实现机制,最后对边缘计算下差分隐私的应用研究进行了综述,并指出了未来的研究方向。总之,将差分隐私技术应用于边缘计算场景对隐私保护和数据分享都是一种有效保护手段。

融合多源图特征的Kcore-GCN反欺诈算法研究

刘炜, 宋友, 卓佩妍, 仵伟强, 廉鑫

计算机科学. 2024, 51 (6A): 230600040-7. doi:10.11896/jsjkx.230600040

摘要 ( 172 )

PDF(2214KB) ( 264 )

参考文献 | 相关文章 | 多维度评价

金融欺诈行为给社会带来了许多负面影响,针对金融欺诈行为,多种人工智能与金融反欺诈算法被提出并应用于实际反欺诈业务场景,取得了不错的成绩。这些反欺诈算法或从用户个体的角度进行欺诈检测,或从节点与网络的拓扑关系的角度进行欺诈检测,或通过学习节点的图嵌入式表示进行欺诈检测,出发角度较为局限,无法进行完备的欺诈检测分析。针对上述问题,设计了一种基于融合多源图特征的Kcore图卷积神经网络反欺诈算法,该算法的创新性在于能够高效挖掘网络中节点层级的拓扑关系与全局网络层次的拓扑关系来构建宽领域的特征体系,并通过基于Kcore算法的图卷积神经网络完成深层次图结构特征的传播与聚合,最终完成欺诈风险的检测。实验效果表明,该方法相较于相关机器学习算法与图神经网络算法在相关评价指标上均有较大的提升,其中较LightGBM算法有12%的AUC值提升,较GCN算法有6%的AUC值提升。

基于差分隐私的联邦学习方案

孙敏, 丁希宁, 成倩

计算机科学. 2024, 51 (6A): 230600211-6. doi:10.11896/jsjkx.230600211

摘要 ( 412 )

PDF(3117KB) ( 420 )

参考文献 | 相关文章 | 多维度评价

联邦学习的特点之一是进行训练的服务器并不直接接触数据,因此联邦学习本身就具有保护数据安全的特性。但是研究表明,联邦学习在本地数据训练和中心模型聚合等方面均存在隐私泄露的问题。差分隐私是一种加噪技术,通过加入适当噪声达到攻击者区分不出用户信息的目的。文中研究了一种基于本地和中心差分隐私的混合加噪算法(LCDP-FL),该算法能根据各个客户端不同权重、不同隐私需求,为这些客户端提供本地或混合差分隐私保护。而且我们证明该算法能够在尽可能减少计算开支的同时,为用户提供他们所需的隐私保障。在MNIST数据集和CIFAR-10数据集上对该算法进行了测试,并与本地差分隐私(LDP-FL)和中心差分隐私(CDP-FL)等算法进行对比,结果显示该混合算法在精确度、损失率和隐私安全方面均有改进,其算法性能最优。

基于知识蒸馏的差分隐私联邦学习方法

谭智文, 徐茹枝, 王乃玉, 罗丹

计算机科学. 2024, 51 (6A): 230600002-8. doi:10.11896/jsjkx.230600002

摘要 ( 216 )

PDF(3282KB) ( 337 )

参考文献 | 相关文章 | 多维度评价

差分隐私技术作为一种隐私保护方法,在联邦学习领域得到了广泛应用。现有的差分隐私应用于联邦学习的研究,或是未考虑无标签公共数据,或是未考虑客户端之间的数据量差异,限制了其在现实场景的应用。文中提出一种基于知识蒸馏的差分隐私联邦学习方法,引入无标签公共数据集并考虑到客户端之间数据量的差异,为此场景设计了专用的差分隐私方案。首先,按数据量大小将客户端分组为“大数据量客户端”和“一般客户端”,用大数据量客户端的数据训练教师模型,教师模型为公共数据集添加伪标签,然后,公共数据集作为“特殊客户端”与“一般客户端”共同进行联邦训练。采用差分隐私技术保证客户端的数据隐私,由于特殊客户端的数据只有标签涉及隐私,在联邦训练中为其分配比一般客户端更多的隐私预算;限制隐私预算总量,设联邦训练阶段的隐私预算为定值,根据客户端对隐私性的需求和隐私预算平行组合性质,调整伪标签添加阶段的隐私预算。在MNIST数据集和SVHN数据集上的实验表明,在同等的隐私预算消耗下,训练得到了精度比传统方法更高的模型。本方案具有可拓展性,高灵活度的隐私预算分配使其可以满足复杂的隐私需求。

DUWe:动态未知词嵌入方法在Web异常检测中的应用

王丽, 陈刚, 夏明山, 胡皓

计算机科学. 2024, 51 (6A): 230300191-5. doi:10.11896/jsjkx.230300191

摘要 ( 117 )

PDF(2207KB) ( 269 )

参考文献 | 相关文章 | 多维度评价

现有的基于深度学习模型的词嵌入方法用于Web异常检测时,通常将语料库中没有出现的未知词汇(Out of Vocabulary,OOV)设置为unknown,并赋予零或随机向量输入到模型中进行训练,未考虑未知词汇在Web请求语句中的上下文关系。同时,在Web系统代码开发过程中,基于个人习惯并为了增加代码的可读性,程序员设计的请求路径代码往往存在一定的模式。因此,考虑到Web请求的模式和单词语义间的相关性,研究基于Word2vec的动态未知词表示方法DUWe(Dynamic Unknown Word Embedding),该方法通过分析Web请求路径中单词上下文的关系来赋予未知词向量的表示内容。在CSIC-2010和WAF Dataset数据集上的实验评估表明,增加未知词表示方法比仅用Word2vec静态特征提取方法具有更好的性能,同时在准确性、精准率、召回率和F1-Score方面均有提高,在训练时间上最大降低1.14倍。

基于国密SM3和SM4算法的SNMPv3安全机制设计与实现

田昊, 王超

计算机科学. 2024, 51 (6A): 230500209-7. doi:10.11896/jsjkx.230500209

摘要 ( 174 )

PDF(3244KB) ( 354 )

参考文献 | 相关文章 | 多维度评价

随着网络技术的快速发展以及5G技术的日益普及,接入网络的设备呈指数级增加,网络结构日趋复杂,恶意网络攻击频发。如何安全、高效地管理数量庞大、复杂的网络设备正成为网络管理所面临的新挑战。简单网络管理协议SNMPv3版本相比v1和v2,增加了基于用户安全模型,提供了数据机密性、完整性、防重放等安全服务。但SNMPv3依然存在默认认证算法与加密算法强度不高、密码算法未全面支持国家商密算法标准等问题。文中在分析SNMPv3协议现有安全机制的基础上,针对基于用户安全模型的SNMPv3现存问题提出了优化方案,将SM3和SM4国密算法嵌入SNMPv3安全机制,基于SM3和SM4国密算法为SNMP协议设计了HMAC-SM3-192认证协议和PRIV-CBC-SM4加密协议。在未明显增加响应时间的前提下,提升了SNMP消息传输过程中抵御伪装、信息篡改、信息泄露等安全威胁的能力,实现了SNMP协议安全性方面的优化。

通过拉普拉斯平滑梯度提高对抗样本的可迁移性

李文婷, 肖蓉, 杨肖

计算机科学. 2024, 51 (6A): 230800025-6. doi:10.11896/jsjkx.230800025

摘要 ( 164 )

PDF(1915KB) ( 333 )

参考文献 | 相关文章 | 多维度评价

深度神经网络因模型自身结构的脆弱性,容易受对抗样本的攻击。现有的对抗样本生成方法具有较高的白盒攻击率,但在攻击其他DNN模型时可转移性有限。为了提升黑盒迁移攻击成功率,提出了一种利用拉普拉斯平滑梯度的可迁移对抗攻击方法。该方法在基于梯度的黑盒迁移攻击方法上做了改进,先利用拉普拉斯平滑对输入图片的梯度进行平滑,将平滑后的梯度输入利用梯度攻击的攻击方法中继续用于计算,旨在提高对抗样本在不同模型之间的迁移能力。拉普拉斯平滑的优点在于它可以有效地降低噪声和异常值对数据的影响,从而提高数据的可靠性和稳定性。通过在多个模型上进行评估,该方法进一步提高了对抗样本的迁移成功率,最佳的可迁移成功率比基线攻击方法高出2%。结果表明,该方法对于增强对抗攻击算法的迁移性能具有重要意义,为进一步研究和应用提供了新的思路。

基于联邦学习的智能电网AMI入侵检测方法研究

刘东奇, 张琼, 梁皓澜, 张孜栋, 曾祥君

计算机科学. 2024, 51 (6A): 230700077-8. doi:10.11896/jsjkx.230700077

摘要 ( 165 )

PDF(3522KB) ( 360 )

参考文献 | 相关文章 | 多维度评价

高级量测体系(Advanced Metering Infrastructure,AMI)是建设智能电网及泛在电力物联网的关键一环。随着海量终端接入和异构通信网络组件的应用,AMI遭受网络攻击的风险大大增加。针对传统AMI网络攻击入侵检测方法存在主站计算压力过大、抗灾能力弱以及识别精度不足的问题,提出一种基于联邦学习的AMI入侵检测方法。首先,构建面向AMI的联邦学习入侵检测模型,在模型中集成联邦学习框架;然后,设计一种边缘侧的融合决策树的轻量级入侵检测算法,并提出跨台区云边协同的联合训练方法,实现跨台区经验的共享,提升入侵检测性能;最后,基于NSL-KDD数据集进行仿真验证,结果表明,与集中式、联邦学习与神经网络的入侵检测模型相比,所提方法准确率可达99.76%,误报率仅为0.17%。同时减少了检测时间,提高了通信效率,并且保证数据不离开本地,降低了数据隐私泄露的风险。

结合图卷积神经网络和集成方法的推荐系统恶意攻击检测

刘慧, 纪科, 陈贞翔, 孙润元, 马坤, 邬俊

计算机科学. 2024, 51 (6A): 230700003-9. doi:10.11896/jsjkx.230700003

摘要 ( 112 )

PDF(3320KB) ( 399 )

参考文献 | 相关文章 | 多维度评价

推荐系统已被广泛应用于电子商务、社交媒体、信息分享等大多数互联网平台中,有效解决了信息过载问题。然而,这些平台面向所有互联网用户开放,导致不法用户利用系统设计缺陷通过恶意干扰、蓄意攻击等行为非法操纵评分数据,进而影响推荐结果,严重危害推荐服务的安全性。现有的检测方法大多都是基于从评级数据中提取的人工构建特征进行的托攻击检测,难以适应更复杂的共同访问注入攻击,并且人工构建特征费时且区分能力不足,同时攻击行为规模远远小于正常行为,给传统检测方法带来了不平衡数据问题。因此,文中提出堆叠多层图卷积神经网络端到端学习用户和项目之间的多阶交互行为信息得到用户嵌入和项目嵌入,将其作为攻击检测特征,以卷积神经网络作为基分类器实现深度行为特征提取,结合集成方法检测攻击。在真实数据集上的实验结果表明,与流行的推荐系统恶意攻击检测方法相比,所提方法对共同访问注入攻击行为有较好的检测效果并在一定程度上克服了不平衡数据的难题。

无人机辅助边缘计算安全通信能力最大化方案

薛建彬, 豆俊, 王涛, 马玉玲

计算机科学. 2024, 51 (6A): 230800032-7. doi:10.11896/jsjkx.230800032

摘要 ( 189 )

PDF(3137KB) ( 369 )

参考文献 | 相关文章 | 多维度评价

针对无人机辅助移动边缘计算系统下用户信息容易泄露的问题,设计了一种基于非正交多址接入技术(Non-orthogonal Multiple Access,NOMA)的无人机辅助边缘计算系统的安全通信方案。在保证每个地面用户的最小安全计算要求下,通过联合优化信道系数、发射功率、中央处理单元计算频率、本地计算和无人机轨迹来最大化系统的平均安全计算能力。由于窃听者位置的不确定性、多变量的耦合以及问题的非凸性,利用逐次凸逼近和块坐标下降方法来解决该问题。仿真结果表明,与基准方案相比,所提方案在系统安全计算性能方面优于基准方案。

一种改进类提升方案的双彩色图像加密系统

王宾, 李海啸, 陈蓉蓉

计算机科学. 2024, 51 (6A): 230500007-11. doi:10.11896/jsjkx.230500007

摘要 ( 123 )

PDF(7911KB) ( 328 )

参考文献 | 相关文章 | 多维度评价

如今图像信息安全面临着严峻的考验,而图像加密技术是应对这一考验最有效的手段之一。由于提升方案在图像加密中具有更快的加解密速度和良好的安全性,所以越来越多基于提升方案的加密系统被提出。文中提出了一种改进类提升方案的双彩色图像加密系统。首先,将彩色图像分成3个通道:R通道、G通道和B通道。然后,将每个图像分别当成魔方的6个面,使用随机序列控制魔方的旋转,从而达到置乱和加密图像的效果。其次,为了使整个系统具有更高的安全性,将改进类提升方案的更新和预测函数由类感知器网络(Perceptron-Like Network,PLN)代替。与原先运算简单的线性函数相比,PLN具有更加复杂的计算和不可预测性。通过所提结构得到的加密图像具有更高的加密质量,因此可以更好地将图像信息扩散到各个像素之间。大量的实验结果表明,该系统可以很好地抵抗各种攻击,具有很高的安全性;并且本系统对普通图像和密钥都具有很强的敏感性,因此可以应用于实际的图像加密。

基于可编辑医疗联盟链的数据安全管理方案

谭婧颀, 薛凌妍, 黄海平, 陈龙, 李逸轩

计算机科学. 2024, 51 (6A): 240400056-8. doi:10.11896/jsjkx.240400056

摘要 ( 189 )

PDF(3460KB) ( 358 )

参考文献 | 相关文章 | 多维度评价

医疗数据的安全管理是确保患者隐私安全、有效开展医学诊疗与相关研究的关键。然而,现有的医疗数据管理方案大多存在透明度低、共享性差和无法保证患者隐私数据安全性的问题。通过设计一种“主-侧”链结构的可编辑区块链模型,提出了面向医疗联盟链的安全、可追责的医疗数据管理方案。该模型主链保存患者电子病历的最新信息,侧链记录历史修改证明,实现了数据管理的透明性和可追责性。引入变色龙哈希函数、秘密共享和可验证签名技术,只有通过验证的医疗机构的系统管理员才能够参与构建完整陷门,确保了医疗数据修改过程的正确性与安全性。经过安全性分析和相关实验模拟,该方案在计算开销、通信负载方面的性能较好,且在存储开销方面存在优势,表明了该方案的有效性和可行性。

具有对抗鲁棒性的人脸活体检测方法

王春东, 李泉, 付浩然, 浩庆波

计算机科学. 2024, 51 (6A): 230400022-7. doi:10.11896/jsjkx.230400022

摘要 ( 133 )

PDF(2791KB) ( 314 )

参考文献 | 相关文章 | 多维度评价

现有人脸活体检测方法在深度神经网络的支持下已获得优秀的检测能力,但面临对抗样本攻击时仍呈现脆弱性。针对此问题,引入胶囊网络(Capsule Network,CapsNet)提出一种具有对抗鲁棒性的人脸活体检测方法FAS-CapsNet:通过CapsNet及其图像重建机制保留特征间关联,过滤样本中的对抗扰动;根据皮肤与平面介质的反射性质差异,以Retinex算法增强图像光照特征,增大活体与非活体人脸类间距离的同时破坏对抗扰动模式,进而提升模型准确性与鲁棒性。在CASIA-SURF数据集上进行实验可知:FAS-CapsNet对正负样本的检测准确率为87.344%,对比模型中最高准确率为78.917%,说明FAS-CapsNet具备充分的常规活体检测能力。为进一步验证模型鲁棒性,基于CASIA-SURF测试集生成两种对抗样本数据集并进行实验:FAS-CapsNet在两数据集上的检测准确率分别为84.552%和79.042%,较常规检测准确率下降3.197%和9.505%;对比模型在两数据集上的最高准确率分别为74.938%和41.667%,较常规检测下降5.042%和47.201%。可见FAS-CapsNet受对抗扰动影响更小,具有显著的对抗鲁棒性优势。

基于机器学习的异常流量检测模型优化研究

陈向效, 崔鑫, 杜秦, 唐浩耀

计算机科学. 2024, 51 (6A): 230700051-5. doi:10.11896/jsjkx.230700051

摘要 ( 217 )

PDF(2092KB) ( 404 )

参考文献 | 相关文章 | 多维度评价

在软件定义网络(Software Defined Network,SDN)中,异常流量检测方法在实践中存在一些问题,主要体现在误报率高和虚警频繁等方面。为了应对网络中的异常流量攻击,研究人员开始探索机器学习异常流量检测方法。然而,机器学习方法面临着数据集庞大和数据维度高等挑战,这些因素影响了机器学习的效率和准确率,因此需要进行数据降维处理。主成分分析算法(Principal Component Analysis,PCA)作为基于线性变换的降维算法,存在一定的局限性,无法有效估计主成分。为了解决该问题,文中提出了一种改进的降维算法,即聚类高斯核主成分分析(C-means Gaussian Kernel Principal Component Analysis,CGKPCA),它扩展了非线性变换的能力。同时,还针对分类模型进行了改进,提出了改进的堆叠分类模型(Support Vector Machine Stacking,SVMS)。为了验证所提方法的有效性,文中使用开源数据集KDDCPU99和UNSW-NB15进行了实验。实验结果表明,所提出的二分类检测模型在性能指标上明显领先于其他模型。

基于多用户变色龙哈希的可修正联盟链方案设计

康重, 王卯宁, 马小雯, 段美姣

计算机科学. 2024, 51 (6A): 230600004-6. doi:10.11896/jsjkx.230600004

摘要 ( 129 )

PDF(2224KB) ( 290 )

参考文献 | 相关文章 | 多维度评价

因存在缺乏数据监管策略、数据包含可疑或有害信息、数据上链后无法修改等问题,现有的区块链架构容易成为低成本网络犯罪的法外场所,因而限制了其可用性。可修正区块链方案被认为是解决这一问题的有效途径,但如何将这一理念与联盟链的优势相结合是一个尚未解决的技术问题。为此,所提方案扩展了变色龙哈希函数的概念到多用户情形,引入群组公钥,完善了单一用户持有密钥导致的修改权限中心化问题。在此基础上,提出了一种面向联盟链的可修正区块链方案,采用请求修改-修改验证的两阶段模式完成修改功能。在通用模型和随机预言模型下,基于离散对数问题困难假设,分别证明了所提方案是抗碰撞的和多用户安全的。仿真实验和对比分析论证了所提方案的有效性和可用性。

基于联盟链的跨组织数据交换操作一致性模型

耿骞, 揣子昂, 靳健

计算机科学. 2024, 51 (6A): 230800145-9. doi:10.11896/jsjkx.230800145

摘要 ( 129 )

PDF(2960KB) ( 278 )

参考文献 | 相关文章 | 多维度评价

在跨组织的数据共享与交换中,维护较强的操作一致性是实现有效的数据同步的重要技术保障。以区块链技术为基础,提出了一种提高跨组织数据交换操作一致性性能的模型,将联盟链作为写前日志,供数据库回溯未完成同步的数据,在联盟链中增设了指针结构,以降低回溯时长。同时,设计了链上存储请求的数据结构及共识算法,通过设置准入机制验证用户身份,保护数据安全以及用户隐私。最后通过仿真实验验证所提模型的有效性,并探讨了不同参数对相关性能指标的影响。结果表明,在不同的参数设定下,所提模型均能保障跨组织数据交换过程中的强一致性;且与基准模型相比,具有更高的请求执行效率;当链上数据量较大时,指针结构能够进一步提升模型性能。

面向公平性联邦学习的指纹识别算法

王晨卓, 鲁艳蓉, 沈剑

计算机科学. 2024, 51 (6A): 230800043-9. doi:10.11896/jsjkx.230800043

摘要 ( 186 )

PDF(3240KB) ( 324 )

参考文献 | 相关文章 | 多维度评价

现有的指纹识别方法大多是基于机器学习,在对海量数据集中训练时忽视了数据本身的隐私性和异质性,从而导致用户信息泄漏和识别率降低。为在隐私保护下协同优化模型精度,提出了一个全新的基于联邦学习的指纹识别算法(Federated Learning-Fingerprint Recognition,Fed-FR)。首先,通过联邦学习迭代聚合来自各终端的参数,从而提高全局模型的性能;其次,将稀疏表示理论用于低质量指纹图像去噪处理,来增强指纹的纹理结构;再次,针对客户端异构而导致的分配不公问题,提出基于水库抽样的客户端调度策略;最后,在3个真实数据集上进行仿真实验,对Fed-FR的有效性进行对比分析。实验结果表明,Fed-FR精度比局部学习提高5.32%,比联邦平均算法提高8.56%,接近于集中学习的精度;在隐私保护水平、评估准确率及可扩展性等方面具有良好的表现。研究成果首次展现了联邦学习与指纹识别结合的可行性,增强了指纹识别算法的安全性和可扩展性,给联邦学习应用于生物识别技术提供了参考。

基于两阶段算法的多媒体有害信息识别方法

史晓苏, 李欣, 简玲, 倪华健

计算机科学. 2024, 51 (6A): 231000052-6. doi:10.11896/jsjkx.231000052

摘要 ( 120 )

PDF(2662KB) ( 346 )

参考文献 | 相关文章 | 多维度评价

在互联网安全监管和网络违法犯罪打击整治的应用场景中,现有多媒体有害信息识别方法普遍存在运算效率不高、无法准确识别局部敏感信息,以及识别检测局限于单一的网络违法犯罪类型等问题。针对以上问题,文中提出了一种基于两阶段算法的多媒体有害信息识别模型。该模型将信息过滤与内容检测分阶段处理,将场景识别和元素目标检测分任务并行处理,第一阶段采用EfficientNet-B2构建高吞吐的前置过滤模块快速筛选掉80%正常内容的数据;第二阶段基于Meal-V2,Faster RCNN,NetVLAD网络构建3种不同网络结构的模块,适应多维度场景、多特征元素的识别要求。结果表明,模型运算效率在T4卡上达到57FPS,多媒体有害信息的识别准确率、召回率均超过97%;与传统模型相比,在NPDI和自建测试集上识别准确率分别最高提升3.09%和19.26%。

Camellia密码算法S盒的量子电路优化

吕轶, 罗庆斌, 李强, 郑圆梦

计算机科学. 2024, 51 (6A): 230900051-6. doi:10.11896/jsjkx.230900051

摘要 ( 164 )

PDF(3643KB) ( 302 )

参考文献 | 相关文章 | 多维度评价

S盒是Camellia密码算法重要的非线性组件。使用Toffoli门、CNOT门和NOT门构建Camellia密码算法S盒的量子电路。为了降低计算的复杂度,根据S盒的代数表达式,将有限域GF(2⁸)中的乘法求逆运算同构到GF((2⁴)²)的复合域中的运算,构造出Camellia密码算法S盒的量子电路。在优化方面,将仿射矩阵、同构矩阵以及一组CNOT门对应的矩阵先进行乘法操作,再进行综合,使用DORCIS工具优化GF(2⁴)中乘法求逆的量子电路,运用W-Type算法优化矩阵运算的量子电路。最终得到的S盒的量子电路只需使用20 个量子比特,52 个 Toffoli 门、178 个 CNOT 门和 13 个 NOT 门,Toffoli深度为40,电路深度为 130。该量子电路的正确性通过IBM公司的Aer模拟器进行验证。相比于已有的结果,文中使用的量子资源有了进一步的减少。

基于联盟链的细粒度安全访问控制机制

田洪亮, 宪明杰, 葛平

计算机科学. 2024, 51 (6A): 230400080-7. doi:10.11896/jsjkx.230400080

摘要 ( 126 )

PDF(3425KB) ( 303 )

参考文献 | 相关文章 | 多维度评价

针对工业物联网存在数据规模庞大、访问安全性差以及隐私安全的问题,提出了基于联盟区块链并使用零知识令牌返回授权的安全访问控制机制,同时,应用IPFS星际文件系统进行链下存储以拓展区块链的可存储性。通过Hyperledger Fabric平台部署区块链网络并编写智能合约,定义访问过程的形式化表达,以更细粒度的模式实现本地和全局的访问授权,并对访问控制的模型和流程进行详细的阐述。最后,通过实验说明区块链网络对访问授权的延迟情况以及策略生成的平均延迟情况,并对比分析了模型的安全性和有效性。结果表明,所提机制在物联网访问控制方面具有安全性、有效性和低延迟性。

基于可信隐式第三方的机载软件审计方法

岳猛, 朱世博, 洪雪婷, 段冰艳

计算机科学. 2024, 51 (6A): 230400088-6. doi:10.11896/jsjkx.230400088

摘要 ( 114 )

PDF(2266KB) ( 281 )

参考文献 | 相关文章 | 多维度评价

分布式云存储技术为数量日益庞大的机载软件提供了新的分发与存储方式,这意味着航空公司失去了对软件的直接控制,因此机载软件安全成为了航空公司十分关注的问题。为了提高云存储环境下机载软件的安全性,提出了一种基于可信隐式第三方(Trusted Implicit Third Party,TITP)的机载软件审计方法对云上机载软件进行监控与管理,以确保机载软件的完整性。此外,由部署在云端的可信硬件代替用户进行审计工作,解决了可公开验证审计机制中第三方审计者不完全可信的问题,并以日志的方式记录审计结果以供用户查询。运用可信硬件进行完整性验证不仅降低了用户计算成本,而且缩短了用户在线时间。与其他可信隐式第三方审计方法进行实验对比,所提方法在审计计算过程中节省了10%的时间消耗。

一种分散变色龙哈希函数的链上隐私数据编辑机制

黄寿孟, 杨博雄, 杨明

计算机科学. 2024, 51 (6A): 240100157-5. doi:10.11896/jsjkx.240100157

摘要 ( 128 )

PDF(2124KB) ( 281 )

参考文献 | 相关文章 | 多维度评价

随着区块链技术广泛应用于各个领域,数据安全及用户隐私出现了很多未知威胁和挑战。对于恶意携带用户隐私或者携带非法攻击代码的非法交易数据,通过属性策略、变色龙哈希算法,设计了基于多方监控的变色龙哈希碰撞数据编辑机制(DecPRB),该DecPRB机制是在变色龙哈希编辑机制的基础上,优化设计以方便管理的陷门哈希函数,通过计算哈希碰撞实现区块链历史数据编辑,即可将在区块链上公开的那些非法数据(特别是隐私数据或攻击代码)删除,当然在更新编辑过程中,所有修改权限由链上所有节点共同监控。最后通过安全性分析推理出DecPRB机制,既不改变区块链的安全属性,又具有很强的抗攻击能力,再通过仿真实验验证DecPRB机制具有一定的有效性,符合数据安全需求。该DecPRB机制在复杂的分布式网络环境中(特别是分布式的云计算和区块链系统)能有效保护数据安全和隐私问题,对数字经济时代的发展作出一定的贡献。

基于vORAM的前向和后向安全动态可搜索加密方案

邵通, 李川, 薛雷, 刘扬, 赵凝, 陈青

计算机科学. 2024, 51 (6A): 230500098-9. doi:10.11896/jsjkx.230500098

摘要 ( 106 )

PDF(2798KB) ( 302 )

参考文献 | 相关文章 | 多维度评价

为了解决将敏感数据加密存储在云平台所带来的关键字检索问题,引进vORAM提出新的前向和后向安全动态可搜索加密方案——FBDSE-I方案。该方案利用茫然数据结构的历史独立性以及安全删除性,实现了关键词/文件标识符对的直接删除,在保证数据更新安全的同时,简化了动态更新过程。为了实现更加高效的查询操作,进一步提出方案FBDSE-II,利用映射字典结构解耦茫然原语与检索结果,减少查询过程中对vORAM的访问次数。给出了形式化的安全证明,证明了FBDSE-I和FBDSE-II方案在保证前向安全的同时,分别满足Type-I和Type-III后向安全。仿真实验结果显示,相对于同等安全级别的前向和后向安全动态可搜索加密方案,FBDSE-I和FBDSE-II方案具有更高的查询和更新效率,而且数据集合规模越大,优势越显著。

面向物联网的分布式联邦学习加密验证研究

臧洪睿, 杨婷婷, 刘洪波, 马凯

计算机科学. 2024, 51 (6A): 230700217-5. doi:10.11896/jsjkx.230700217

摘要 ( 196 )

PDF(2514KB) ( 303 )

参考文献 | 相关文章 | 多维度评价

人工智能与物联网(Internet of Things,IoT)结合,可以改善物联网中应用的使用体验。在物联网中,数据共享可以改善应用的质量,但是同时也带来了数据安全问题,比如数据在共享过程中存在泄露和无法验证等问题。文中提出一种结合分布式联邦学习和区块链以及具备加密验证的方案,用来保护物联网中共享数据的隐私和数据的有效性。首先,利用联邦学习和区块链将物联网中由直接共享原始数据转化为共享加密的模型参数。接着,提出具备加密验证的方法,在模型聚合阶段对链上参数进行验证和挑选。最后,将所提方法与其他方法进行对比。实验结果表明,所提方法能够有效保证数据隐私并可以实现加密数据的验证,保证最终模型的精度,为物联网中数据高质量共享提供保障。

机器思维的数学原理

朱平, 邹卫明, 吕珀华, 史进, 蒋学涛, 马益荣

计算机科学. 2024, 51 (6A): 230900104-8. doi:10.11896/jsjkx.230900104

摘要 ( 133 )

PDF(2552KB) ( 271 )

参考文献 | 相关文章 | 多维度评价

本研究以构建以人类可以理解的方式寻找解决实际问题的方法与步骤的机器思维机制为目的。数学是人类描述客观世界状态和运行规律的重要思维工具。数学也是机器类人自动求解问题答案、解释运行方法和生成中间步骤的重要工具。客观世界的描述语言表述形式多样、规模巨大且特征稀疏,其语义表示、语义积聚、语义分析、以及机器思维机制的实现方法都是基于用例积累渐进式明晰和完善的。在数学应用题类人自动求解领域,机器思维主要依靠的基本数学概念及其蕴含的计算理论包括集合、比例(分数)、不等关系、枚举和数据归纳与推导(趋势判别)等。从机器思维系统实现的角度,以集合对象及其比例计算的语义渐进积聚和识别为例,讨论了数学原理在机器思维系统中的应用技术路线。最后,用示例介绍了机器自动类人求解一道具体的初等数学应用题的完整过程和中间步骤,展望了机器思维应用不等关系、枚举、数轴、坐标系和数学归纳与推导等数学工具的方法和前景。

基于随机Petri网的民机审定试飞实施流程建模与分析

邓汉年, 周杰, 杨波, 易力力, 傅广, 周鹏

计算机科学. 2024, 51 (6A): 230700050-6. doi:10.11896/jsjkx.230700050

摘要 ( 144 )

PDF(2449KB) ( 264 )

参考文献 | 相关文章 | 多维度评价

审定试飞是民用飞机获取型号合格证书的重要活动,具有高成本、高风险的特点。研究审定试飞的实施流程有利于推动试飞工作有序进行,进而缩短试飞周期及降低试飞成本。目前对试飞流程的研究局限于流程描述与定性分析,缺乏对试飞流程的形式化建模与性能分析,无法检验流程中的关键环节。为解决上述问题,文中研究了审定试飞3个阶段的实施流程,并利用随机Petri网构建了该流程的仿真模型;通过建立与该模型同构的马尔可夫链,对实施流程进行了性能分析,识别出了流程中耗时较多的关键环节,进而分析了关键环节的实施速率对流程平均运行时间的影响。最后通过一个案例验证了模型与方法的可行性。结果表明,制造符合性检查环节与试飞数据处理环节是流程中耗时较多的关键环节,应将其作为流程优化的重点,同时提升上述两个关键环节的实施速率相比提高单环节速率,成本更低且流程运行效率提升幅度更大。

基于LSTM和注意力机制的远程会诊需求预测

翟运开, 乔正文, 乔岩

计算机科学. 2024, 51 (6A): 230800119-7. doi:10.11896/jsjkx.230800119

摘要 ( 156 )

PDF(3169KB) ( 305 )

参考文献 | 相关文章 | 多维度评价

为更准确地预测远程会诊需求量,提高远程会诊资源配置效率,文中引入多元回归分析(Multiple Linear Regression)和注意力机制来优化长短期记忆网络(LSTM)。首先,根据远程会诊需求中存在的假期效应生成假期指标,通过多元回归分析选取显著性高的指标作为模型输入,然后根据长短期记忆网络学习输入指标的内部复杂映射关系,利用注意力机制对指标分配不同权重,最后根据权重和LSTM隐藏层输入预测结果。基于国家远程医疗中心(NTCC)的实际历史会诊数据,研究MLR-Attention-LSTM的预测性能,并比较其与整合移动平均自回归模型、支持向量机、K近邻、BP神经网络和LSTM神经网络5种模型的预测效果。结果表明,优化后的LSTM模型预测精度最高。进一步地,探究假期指标对模型性能的影响,结果表明假期指标的输入可以进一步提高模型的预测精度,验证了MLR-Attention-LSTM和假期相关变量输入在远程会诊需求预测领域的可行性与适用性,为远程医学中心实际应用提供了理论支撑和实践指导。

考虑供应商损失规避性和资金约束的供应链决策

李莉英, 周俊, 汪敏

计算机科学. 2024, 51 (6A): 230800134-7. doi:10.11896/jsjkx.230800134

摘要 ( 103 )

PDF(2504KB) ( 297 )

参考文献 | 相关文章 | 多维度评价

随着市场竞争日益激烈,在产出不确定的情况下,供应商资金不足尤为常见。基于此,构建了一个以风险中性制造商为领导者,以损失规避供应商为跟随者的Stackelberg博弈模型。在银行融资和制造商预付款融资两种模式下,分别给出了损失规避供应商的最优生产投入量决策和制造商的最优损失分担决策。通过理论和算例分析表明:当各参数在一定范围内取不同值时,供应商和制造商可能倾向于选择不同的融资模式;在预付款融资模式下,供应商为最大化损失规避,将采取更加保守的生产策略,此时,制造商会通过承担更多的损失分担比例来激励供应商增加生产投入量。

基于中继保障的分布式海战补给路径优化

曾祥兵, 曾斌, 李厚朴

计算机科学. 2024, 51 (6A): 230600113-9. doi:10.11896/jsjkx.230600113

摘要 ( 133 )

PDF(2468KB) ( 269 )

参考文献 | 相关文章 | 多维度评价

分布式海战是未来战争形态发展的必然趋势。与传统海战样式相比,分布式海战作战部署更加灵活,作战区域更广。分布式海战条件下的后勤保障区域分布范围广、保障半径大、分散程度高,传统伴随保障方式难以适应战争形态发展。依托中继保障基地进行递进保障,并运用补给舰编队进行物资转运的补给模式,更加适合分布式海战特点。考虑复杂多变的海洋天气对远距离物资投送带来的极大影响,首先基于不同地理位置的历史天气信息模拟有效波高,然后根据有效波高测算天气因素对舰船航速及补给开销的影响程度,最后触发优化模型与仿真模型之间的反馈并得到优化方案。将优化方案与未触发仿真模型的理想优化结果进行比较,以验证不同策略的性能表现,得到契合实际应用环境的优化方案,从而提高最优路径的鲁棒性,为分布式海战物资补给提供较好的决策支撑。

融合媒体信息和信号分解的股票市场深度学习预测

刘广, 易鸿

计算机科学. 2024, 51 (6A): 230600102-12. doi:10.11896/jsjkx.230600102

摘要 ( 154 )

PDF(6029KB) ( 321 )

参考文献 | 相关文章 | 多维度评价

对股票市场未来回报和风险的精确预测不仅能够帮助理性投资者更加合理有效地进行投资,也能够为政策制定者和投资者提供有用的指导。利用金融新闻标题文本,通过词嵌入模型和机器学习等文本分析方法,构建考虑新闻累积效应的投资者时闻累积情绪指数表征投资者情绪;以上证指数为例,采用变分模式分解(VMD)方法将指数波动数据分解为各种内在固有模式进行实证分析。最后,引入双向门控循环单元(BiGRU)作为深度学习模型进行股票预测。结果表明,投资者情绪指数显著影响上证指数波动,并且积极情绪和消极情绪的影响是不对称的;考量投资者情绪指标进行信号分解,能够有效提高股票的预测性能,相对于单纯分析股票时间序列的 BiGRU预测模型,VMD-BiGRU模型的MAE,RMSE,RMSPE,MAPE等指标降低超过30%;在基准场景下,VMD-BiGRU模型性能优于多个计量经济模型和机器学习模型,对于收益率和波动率预测的MAE,RMSE,RMSPE,MAPE等指标普遍降低超过40%;模型在五粮液、工商银行、科大讯飞3只个股的推广中保持着同样稳定精确的预测效果。

基于BERT和CNN的药物不良反应个例报道文献分类方法

孟祥福, 任全莹, 杨东燊, 李可千, 姚克宇, 朱彦

计算机科学. 2024, 51 (6A): 230400049-6. doi:10.11896/jsjkx.230400049

摘要 ( 177 )

PDF(2512KB) ( 285 )

参考文献 | 相关文章 | 多维度评价

在临床上,药物不良反应导致的死亡和用药不当造成的住院及门诊费急剧升高,成为临床安全合理用药面临的主要问题之一。目前对药物不良反应的回顾性分析和文献分析多以公开发表的文献资料为依据。学术文献作为重要的数据来源之一,如何自动批量地对其进行数据处理尤为重要。针对医药文本独特的表述方式,基于BERT及其组合模型进行文本分类技术比对实验,建立对药物不良反应个例报道文献数据进行高效快速分类的方法,进而分辨出药物不良反应的类型,有效预警药害事件。实验结果表明,使用BERT模型的分类准确率达到99.75%,其可以准确高效地对药物不良反应个例报道文献进行分类,在辅助医疗、构建医学文本结构化数据等方面均具有重要的价值和意义,进而能够更好地维护公众健康。

基于服装个性化智能定制的三维人体测量系统物-像结构算法的研究

王悦, 任军, 马飞, 吴龙

计算机科学. 2024, 51 (6A): 230600233-5. doi:10.11896/jsjkx.230600233

摘要 ( 140 )

PDF(3099KB) ( 262 )

参考文献 | 相关文章 | 多维度评价

目前,我国基于服装个性化智能量身定制的理念日趋完善。但是,在消费者目标尺寸自动获取方面仍然缺乏实用的设备和技术,成为了大多数企业个性化智能定制发展的一个瓶颈,其根本原因是缺少实用性强的个性化智能定制系统。人体动态测量与其他工业产品精密测量相比具有自身独有的特殊性和困难。在探讨了现有的光学类基于个性化智能定制系统的现状的前提下,针对目前存在的激光三维人体扫描测量系统普遍存在硬件设备庞大、结构复杂的问题,对文中提出的基于个性化智能定制系统进行了原理设计,建立了系统的物-像结构算法的数学模型。该算法采用了扫描单元旋转的测量方式,使系统能够在垂直方向上获得较大的测量范围,目的是使系统采用较小的硬件获取满意的三维人体空间坐标,有利于节省竖直空间、减小体积。该算法已成功应用于基于服装个性化智能定制系统。为了验证本算法的精度,设计了与法国力克系统的三维人台对比扫描实验,实验数据验证了本系统结构算法的精度、工程实用性和可靠性。

基于SAMNV3的滚动轴承智能故障诊断方法

张兰昕, 向玲, 李显泽, 陈锦鹏

计算机科学. 2024, 51 (6A): 230700167-6. doi:10.11896/jsjkx.230700167

摘要 ( 116 )

PDF(3953KB) ( 292 )

参考文献 | 相关文章 | 多维度评价

滚动轴承是机械设备的关键部件,为了对滚动轴承的故障类别进行有效识别,提出了一种融合自注意力机制(Self-Attention,SA)和轻量级网络MobileNetV3的SAMNV3滚动轴承智能故障诊断模型。利用该模型中自注意力机制对特征进行自适应加权的优点以及轻量级网络MobileNetV3体积较小的优点,通过直接将两个不同数据集的原始振动信号输入SAMNV3模型中,进行故障的特征提取与识别分类,从而实现端到端的滚动轴承智能故障诊断。在两种不同的数据集上进行验证,结果表明该模型具有较高的准确率和较低的计算复杂度,可以有效提高滚动轴承故障诊断的准确性和可靠性。

考虑多种攻击策略的国防工程电力系统网架生存性评估

李飞, 陈童

计算机科学. 2024, 51 (6A): 230700171-8. doi:10.11896/jsjkx.230700171

摘要 ( 111 )

PDF(3085KB) ( 297 )

参考文献 | 相关文章 | 多维度评价

针对战时国防工程电力系统网架技术性能评估问题,尤其是生存性指标量化评估问题,提出了国防工程电力系统网架生存性多指标综合评价方法,从抗毁性、安全性和恢复性3个维度衡量国防工程电力系统网架生存性,并考虑敌方可能采取的多种攻击策略,得到国防工程电力系统网架生存性量化指标随等效攻击波次变化曲线,可对国防工程电力系统网架的运行和改进决策提供分析方法和工具;并采用该方法对某国防工程电力系统网架进行仿真实验,实验结果表明,该方法可有效评估多种攻击策略下的国防工程电力系统网架的生存性,网架结构信息保密和网架防护等级对国防工程电力系统网架生存性有较大影响。

基于CRF的中文语法错误诊断系统的实现与应用

李斌, 王浩畅

计算机科学. 2024, 51 (6A): 230900073-6. doi:10.11896/jsjkx.230900073

摘要 ( 111 )

PDF(2223KB) ( 310 )

参考文献 | 相关文章 | 多维度评价

随着中国国际影响力的提高和汉语国际地位的提升,将中文作为第二语言学习的外国人数量逐年增加,中文已成为世界上最为流行的语言之一。基于此,中文语法错误诊断的研究备受关注。首先,从中文语法错误诊断的定义出发,总结目前的研究现状。其次,通过对各种中文语法错误诊断方法的分析,构建了基于条件随机场的中文语法错误诊断系统,探究中文语法自动检错系统及其具体应用流程,以帮助中文学习者提高学习效率。在CGED2016数据集上的实验结果表明,该系统在检测层和识别层上的性能较好,在位置层上还需要改进。

基于自适应修正模型的飞行器外流场三维计算方法

彭革, 徐兴贵, 李忠武, 任维贺, 李康, 郑国宪, 邓红艳

计算机科学. 2024, 51 (6A): 230900053-9. doi:10.11896/jsjkx.230900053

摘要 ( 126 )

PDF(7181KB) ( 283 )

参考文献 | 相关文章 | 多维度评价

目前飞行器外流场仿真方法中存在流体可压缩性判断依赖经验知识以及目标外流场三维仿真缺乏封闭约束条件的问题。对此,提出一种基于自适应修正模型的三维外流场数值计算方法。根据飞行器外流场变异系数先验知识,采用加权平均N-S方程表示可压缩流体物理量分布,同时利用膨胀压缩修正和激波不定项修正两种策略自适应地修正k-ε湍流模型的可压缩性约束条件,并采用壁面函数对近壁区进行近似计算修正约束条件。以某型号无人机外流场分布三维建模仿真实验,结果表明:当飞行器速度达到1.5马赫时,可压缩修正模型出现边界约束条件临界值,所提自适应可压缩修正算法能有效判断气体可压缩性的变化并提升流体分布计算的准确性。

一个面向短波通信的LHOG话音检测方法

白洁, 田瑞丽, 任一夫, 员建厦

计算机科学. 2024, 51 (6A): 230600115-5. doi:10.11896/jsjkx.230600115

摘要 ( 110 )

PDF(2268KB) ( 262 )

参考文献 | 相关文章 | 多维度评价

噪声环境下语音检测准确率偏低是短波通话面临的公开挑战。当前已有方法应用有限,其根源在于难以可靠地在噪音环境下提取准确且高效的语音特征。针对上述问题,提出了一个面向短波通信的低秩方向梯度直方图(Low-rank Histogram of Oriented Gradient,LHOG)话音检测方法。首先,对目标音频源数据进行预处理,实现噪声环境下语音信息的可视化表征;然后,在HOG特征提取器中嵌入低秩化结构,缓解特征中的冗余信息,并降低噪声干扰,从而获得准确且高效的特征;最后,通过常用的SVM分类模型便可在噪声环境中准确快速地区分话音和噪声。测试结果表明,该方法的准确率达到了95.12%,误报率仅为0.96%,漏报率为13.14%。与现有主流方法的对比实验证明,该方法话音检测准确率高,资源占用少,能够有效提高短波通信侦控效率。

面向产线AI质检的少样本评测方法研究和验证

焦若丹, 高东辉, 黄艳华, 刘硕, 段宣翡, 王蕊, 刘伟东

计算机科学. 2024, 51 (6A): 230700086-8. doi:10.11896/jsjkx.230700086

摘要 ( 145 )

PDF(3863KB) ( 290 )

参考文献 | 相关文章 | 多维度评价

随着工业4.0时代的到来,制造业与人工智能的深度融合已成为了业界的重要发展趋势,工业质检是其中的重要突破口,但目前业界缺乏对工业质检产品进行评估的标准方法,各质检产品的性能往往不透明,不利于优化迭代及规模推广。针对上述问题,提出了一种面向工业界产线应用需求的AI工业质检算法评测方法,可在工业领域样本数量少且不均衡的情况下,面向产线落地应用需求,对AI工业质检产品及其竞品进行对标评估。该评测方法通过交叉验证法构建数据集,从而避免数据集规模小且不均衡导致的评测结果波动较大的问题,通过灰盒测试法避免数据集来源单一导致的评测结果不客观问题,并根据产线实际生产需求制定相关评估指标,可真实反映产线应用场景下质检产品检测性能。将上述方法应用于光伏电池片EL检测产品的对标评测中进行验证,结果表明该评测方法具备可行性,且能客观反映各产品的真实性能。最后,基于对评测结果的分析对比,为AI工业质检产品的优化提供了一些建议。

基于改进遗传算法的家庭用电调度优化方法

黄飞, 李永福, 高杨, 夏磊, 廖庆龙, 戴健, 向洪

计算机科学. 2024, 51 (6A): 230600096-6. doi:10.11896/jsjkx.230600096

摘要 ( 154 )

PDF(2153KB) ( 315 )

参考文献 | 相关文章 | 多维度评价

用电高峰期的用电需求给电力系统带来了巨大压力,因此优化家庭用电调度变得尤为重要。针对用电高峰期用户端存在的用电经济性及舒适度不够的问题,提出了一种基于改进遗传算法的家庭用电调度优化方法。首先以分时电价为基础,建立综合考虑用电经济性与用户满意度的家用电器调度模型,然后对不同类型的电器采取不同的编码方式来替代传统遗传算法的单一编码,并用带惩罚函数的适应度函数来约束各个电器用电任务所需时长等,以对传统遗传算法进行改进和用电行为优化。结果表明,所提算法可有效地依据分时电价实现用电负荷调度优化,在满足用户用电舒适度情况下为用户提供经济性的用电方案,且复杂度较低,能有效解决用电高峰期的用电经济性和舒适度问题。

基于域对抗统计特性增强的跨域故障诊断方法

朱俞豪, 张淞钊, 张永

计算机科学. 2024, 51 (6A): 230700196-6. doi:10.11896/jsjkx.230700196

摘要 ( 144 )

PDF(3126KB) ( 328 )

参考文献 | 相关文章 | 多维度评价

故障诊断对于保障大型机械设备安全稳定运行具有十分重要的意义,但获得的数据存在严重标签缺失或缺少的问题,且不同工况下的数据特征分布显著不同。传统机器学习或微调的方法存在特征提取模式单一、视角固定的局限性,使得同类不同域的特征难以对齐。针对以上问题,文中提出了一种基于域对抗统计特性增强的跨域故障诊断方法DASEM(Domain-Adversarial Statistical Enhancement Model)。该方法采用直推式深度迁移学习技术,在域对抗框架下增强全局统计特性的表示,并与局部结构模式融合,构建双路径特征提取器。同时,利用域标签和数据结构之间的平衡关系来描述域对抗的表现形式,并通过类标签输出故障诊断结果。在西储大学轴承数据集和江南大学轴承数据集上的实验结果显示,DASEM在各个跨域任务上的平均精度分别达到了94.90%和93.15%,证明了该方法的有效性。

改进NDO的板球系统自适应滑模抗扰控制

杨立炜, 李萍, 夏国锋, 王涛

计算机科学. 2024, 51 (6A): 230700229-5. doi:10.11896/jsjkx.230700229

摘要 ( 115 )

PDF(2736KB) ( 279 )

参考文献 | 相关文章 | 多维度评价

为解决板球系统因受到外部负载扰动、摩擦力、交叉耦合干扰等不确定性扰动而跟踪精度不高的问题,提出一种基于改进的非线性干扰观测器(NDO)和非线性信息增益滑模控制策略。利用预设性能函数(PPF)对误差的变换技术,将误差限定在规定范围内,建立改进的NDO来估计不确定性扰动。运用精确的估计值来设计滑模控制器,滑模面包含一个修正项,可以降低扰动的影响,从而提高控制精度,并采用非线性信息增益设计自适应切换项增益,降低抖振的影响。最后,仿真表明改进的NDO能有效地估计扰动,改善了动态品质,所提控制方案提高了传统的NDO的控制精度和抗扰能力。

基于XGBoost的电网物资供应商履约风险预测

李金霞, 卞华星, 温富国, 胡天牧, 秦诗涵, 吴涵, 马晖

计算机科学. 2024, 51 (6A): 230400115-9. doi:10.11896/jsjkx.230400115

摘要 ( 163 )

PDF(3670KB) ( 308 )

参考文献 | 相关文章 | 多维度评价

电网物资供应商履约质量是电网安全稳定运行的基础,供应商履约涉及环节众多且风险因素复杂,使得当前对其研究较为匮乏且大多停留在理论业务分析层面。针对这一问题,提出基于XGBoost(Extreme Gradient Boosting)的供应商履约风险预测模型,充分考虑业务全流程中的各种风险因素,综合内部供应链运行、知识图谱数据以及外部天眼查、疫情等数据,基于特征工程构造了191个风险特征进行初始训练,在模型优化后对筛选出的49个特征再次训练,兼顾实际业务中的预测准确性和特征可解释性要求,采用SHAP(SHapley Additive exPlanations)值方法进行模型解释。实验结果表明,对比其他3种主流机器学习算法,所提模型准确率、精确率、KS值分别高达93.05%,94.45%,45.38%,进而验证了XGBoost算法在履约风险预测中的可行性和优越性。该模型可应用到电网物资供应链中,进一步指导业务应用。

计及风电的发电商报价多智能体模型

黄飞虎, 李沛东, 彭舰, 董石磊, 赵红磊, 宋卫平, 李强

计算机科学. 2024, 51 (6A): 230600179-8. doi:10.11896/jsjkx.230600179

摘要 ( 143 )

PDF(2858KB) ( 296 )

参考文献 | 相关文章 | 多维度评价

新型电力系统背景下,新能源发电商的报价问题一直是电力现货市场中的研究热点。相比传统能源,风电出力受外界不确定性因素的影响较大,给风力发电商求解最优报价带来了挑战。为此,基于多智能体强化学习算法WoLF-PHC构建了计及风电的发电商报价策略模型。模型中,考虑了风电、火电和水电3种能源参与的现货市场,每一个发电商抽象为一个智能体,且基于随机约束规划算法建模风电智能体的收益函数;对于智能体的报价策略模型,将D3QN与WoLF-PHC算法结合,使模型能够满足报价时智能体状态空间复杂的情况;此外,对于交互环境的建模,提出利用DDPM扩散模型生成风电出力数据,优化风电出清场景的仿真。最后,基于3节点的电力仿真系统开展模拟实验,实验结果表明,提出的风电收益函数建模、WoLF-PHC改进、风电出力生成等技术是可行的,能有效解决风电参与竞价的现货市场报价问题,并且能够在较少的迭代次数后学习到较优的策略。

动态路网下城市交通事故风险预测模型研究与实现

董婉青, 赵子榕, 廖惠敏, 肖晖, 张晓亮

计算机科学. 2024, 51 (6A): 230500118-10. doi:10.11896/jsjkx.230500118

摘要 ( 171 )

PDF(3110KB) ( 326 )

参考文献 | 相关文章 | 多维度评价

通过图卷积神经网络对交通事故进行风险预测是交通领域的研究热点。然而,现有的使用图卷积神经网络对交通事故进行风险预测的研究存在着缺乏语义邻接性的构造、无法进行图权重的自适应学习的问题。针对以上问题,文中基于多源交通大数据,构建了数据驱动的多粒度、多视角的时空拓扑图,实现了交通网络中时空关联性和依赖性的精准建模。图上的结点从时间和空间两个维度对路段结点的交通状态进行综合描述,边则从地理邻接性和语义邻接性两个视角表现了路段之间的抽象邻接关系。在时空拓扑图的基础上,文中设计了基于动态时空图网络的交通事故风险预测模型,实现了路段级交通事故风险的准确预测。该模型引入了具有多头注意力机制的空间图网络层对空间关联性进行学习,同时采用了基于一维扩张卷积的时间学习单元捕获短时依赖性与长时周期性。在北京地区的实际交通数据集上进行大规模实验,所提方法的召回率达到0.899,F1-Score达到0.860,其他指标与主流方法相比也均有所提升。

基于非线性交通流模型的交通子区边界控制策略研究

王晓龙

计算机科学. 2024, 51 (6A): 230900016-7. doi:10.11896/jsjkx.230900016

摘要 ( 139 )

PDF(2523KB) ( 273 )

参考文献 | 相关文章 | 多维度评价

城市交通流具有复杂的非线性动态特征,用简化的线性交通流模型无法准确描述交通流的非线性特征。因此,在考虑扰动对子区边界控制影响的基础上,首先建立了考虑扰动的非线性城市宏观交通流模型,该模型能够更好地描述实际交通流的运行情况。其次,结合城市交通流运行的周期性特点,设计了基于迭代学习控制的子区边界控制策略,并利用Lipschitz条件和偏导数分析了迭代学习控制律的收敛性。最后,通过仿真案例验证了基于非线性交通流模型的交通子区边界控制策略的有效性。