1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2024年第5期, 刊出日期:2024-05-15
  
封面下载
目录
第51卷第5期目录
计算机科学. 2024, 51 (5): 0-0. 
摘要 ( 184 )   PDF(295KB) ( 289 )   
相关文章 | 多维度评价
学科前沿
智能铁路5G安全技术与策略综述
李盼盼, 吴昊, 刘佳佳, 段莉, 卢云龙
计算机科学. 2024, 51 (5): 1-11.  doi:10.11896/jsjkx.231000104
摘要 ( 345 )   PDF(2600KB) ( 474 )   
参考文献 | 相关文章 | 多维度评价
数字技术正在重塑各行各业,这是行业发展的必经之路。5G等数字服务技术在为铁路等行业赋能的同时,也带来了一些安全风险。安全是一切服务的先决条件。为促进5G数字服务在智能铁路的创新应用,首先从基站空口、通信、数据、系统、终端和公专网融合应用几个角度,系统梳理了智能铁路5G通信网络面临的安全风险与挑战。然后针对大带宽、高可靠、低时延的新业务场景及网络切片、边缘计算等新技术和大规模异构新型终端以及面向铁路的智能新应用,全面分析了智能铁路5G服务的安全新需求,总结了密码算法、空口安全、隐私、统一认证及漫游等方面的5G安全增强新特性。在此基础上,给出智能铁路5G通信网络在安全认证、物理层安全、终端安全、切片安全、边缘计算安全方面需关注的重点。针对5G专网部署方式,给出基础设施、通信安全、安全管理数据安全、内生安全防御体系方面的建议。
网络空间用户身份对齐技术研究及应用综述
王庚润
计算机科学. 2024, 51 (5): 12-20.  doi:10.11896/jsjkx.230300172
摘要 ( 257 )   PDF(2105KB) ( 317 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着移动互联网技术的发展和用户需求的增加,网络空间中各种虚拟账号越来越多,同一用户在不同应用甚至同一平台拥有多个账号。同时,由于网络空间的虚拟性导致用户的虚拟身份与真实社会身份之间的关联通常较弱,网络空间违法用户存在发现难和取证难的问题。因此,在服务推荐和调查取证等需求的推动下,以网络空间用户虚拟身份聚合和虚实身份映射为主要研究内容的用户身份对齐技术得到了快速发展。为此,对网络空间用户身份对齐技术进行了梳理,首先对该技术解决的科学问题进行了阐述;其次介绍了该技术所用到的用户身份典型特征和涉及的相关技术;然后对可供研究的数据集与验证标准进行介绍;最后对所提技术面向的应用场景进行了详细分析,并基于此讨论了用户身份对齐技术未来的研究方向以及面临的挑战。
基于多属性综合评价的院校竞赛评估模型
邢存远, 张洁, 金莹
计算机科学. 2024, 51 (5): 21-26.  doi:10.11896/jsjkx.230200202
摘要 ( 157 )   PDF(2929KB) ( 250 )   
参考文献 | 相关文章 | 多维度评价
我国普通高校大学生竞赛正处于蓬勃发展期,赛事的举办和参与都呈现出积极向上的态势。大学生学科竞赛能够反映参赛院校的学科发展水平和教学水平,而基于竞赛数据对院校水平进行分析和比较也能够在一定程度上促进院校对竞赛的重视和参与度。在之前的研究和实际应用中,学校的竞赛水平评估大多局限在奖项得分的堆叠上。这种基于“唯奖项”论的模型因为忽略了院校自身发展水平等因素而存在片面性。在这项工作中,参赛院校的竞赛水平可以用参赛积极性、参赛优异度和获奖稳定性3个指标刻画并构建评估模型;通过最大化院校间得分差异确定指标的最优权重,从而获取院校的参赛得分并进行比较和分析。此外,根据学科竞赛的特点,院校在竞赛的不同赛道上的不同表现可以作为更加细化的特征。通过t-SNE降维、可视化与聚类分析,参赛高校被划分成4种类型。对于不同类型的高校,文中分别提供了提高比赛表现的针对性建议。江苏省大学生计算机设计大赛举办至今的数据被用于验证模型的合理性。
数据库&大数据&数据科学
ST-WaveMLP:面向交通流量预测的时空全局感知网络模型
包锴楠, 张钧波, 宋礼, 李天瑞
计算机科学. 2024, 51 (5): 27-34.  doi:10.11896/jsjkx.230100086
摘要 ( 188 )   PDF(3240KB) ( 292 )   
参考文献 | 相关文章 | 多维度评价
交通流量预测在智能交通系统中起着至关重要的作用。精准的交通流量预测不仅能帮助城市管理者进行更好的交通管理,也能帮助人们制定合适的出行计划。然而精准预测交通流量颇具挑战性,主要难点在于如何捕获交通流量数据中复杂的时空依赖性。近年来,深度学习方法已被成功应用于网格交通流量预测,主要采用深度卷积神经网络来捕获时空依赖性。但是卷积神经网络主要关注数据中空间特征的提取与整合,难以充分挖掘其中复杂的时空依赖性,而且单层卷积网络只能捕获局部空间依赖,因此,要想捕获全局空间依赖就需要对超多层的卷积网络进行堆叠,这将使整个网络模型训练收敛速度变慢。为了解决些问题,提出了一种面向交通流量预测的全局感知时空网络模型ST-WaveMLP,主要使用以多层感知机(MLP)为基础的可重复结构ST-WaveBlock来捕获相关的时空依赖。ST-WaveBlock中包含了捕获全局空间依赖和局部时间依赖的模块(SGAC),以及用于捕获局部空间依赖和全局时间依赖的模块(SLAC)。ST-WaveBlock具有较强的时空表征学习能力,通常仅用2~4个ST-WaveBlock堆叠就能有效捕获数据中的时空依赖性。最后,在4个实际交通流量数据集上进行实验验证,结果表明ST-WaveMLP具有更好的收敛性以及更高的预测精度,相较于之前最好的方法,所提方法预测精度的提升最高可达9.57%,模型收敛速度的提升最高可达30.6%。
基于对抗策略类别特定的多样性时间序列shapelets提取
罗颖, 万源, 王礼勤
计算机科学. 2024, 51 (5): 35-44.  doi:10.11896/jsjkx.230200074
摘要 ( 91 )   PDF(2780KB) ( 126 )   
参考文献 | 相关文章 | 多维度评价
在时间序列分类任务中,通过提取时间序列的shapelets进行分类的方法因分类准确率高且具有良好的可解释性而受到广泛关注。针对现有方法学习到的shapelets是所有类共享,可以区分大多数类但不能准确地区分某一类和其他类,以及使用对抗策略的模型生成的shapelets存在多样性不足等问题,提出了一种基于对抗策略类别特定的多样性时间序列shapelets提取方法。该方法将类别信息嵌入时间序列,采用多生成器模块对抗地生成多个有差别的类别特定shapelets,再通过施加差异约束来提高shapelets的多样性,最后使用shapelet转换得到的特征对时间序列进行分类。在36个时间序列数据集上与5种基于shapelets的算法和11种先进的分类算法进行实验对比,实验结果表明,所提方法分别在36个数据集中的26个和20个数据集上取得了最优结果,且均取得了最高的平均秩,平均分类准确率相比其他方法最少提高了2.4%,最多提高了17.8%。消融性分析以及可视化分析验证了多样性和类别特定的思路在时间序列分类上的有效性。
融入时间信息的预训练序列推荐方法
陈稳中, 陈红梅, 周丽华, 方圆
计算机科学. 2024, 51 (5): 45-53.  doi:10.11896/jsjkx.230200049
摘要 ( 97 )   PDF(2607KB) ( 133 )   
参考文献 | 相关文章 | 多维度评价
序列推荐旨在根据用户与项目的历史交互序列,学习用户动态偏好,为用户推荐后续可能感兴趣的项目。基于预训练模型在适应下游任务方面具有优势,预训练机制在序列推荐中备受关注。现有序列推荐预训练方法忽略了现实中时间对用户交互行为的影响,为了更好地捕获用户与项目交互的时间语义,提出了融入时间信息的预训练序列推荐模型TPTS-Rec(Time-aware Pre-Training method for Sequence Recommendation)。首先,在嵌入层引入时间嵌入矩阵以获取用户交互项目与时间的关联信息。然后,在自注意力层采用同一时间点采样的方法以学习项目间的时间关联信息。最后,在微调阶段从时间维度扩增用户交互序列长度以缓解数据稀疏性问题。在真实数据集上的对比实验结果表明,与基线模型相比,所提模型TPTS-Rec的推荐效果有显著提升。
结合图对比学习的多图神经网络会话推荐方法
卢敏, 原子婷
计算机科学. 2024, 51 (5): 54-61.  doi:10.11896/jsjkx.230300092
摘要 ( 97 )   PDF(2737KB) ( 145 )   
参考文献 | 相关文章 | 多维度评价
会话推荐根据匿名用户短期内的交互数据预测下一个交互物品。针对会话中物品少、物品长尾分布等特性,现有基于图对比学习的会话推荐模型提出对会话内物品采用随机裁剪、扰动等方式构造正负样本。然而,上述随机退出策略进一步缩减较短会话中的可用物品,使得会话更加稀疏,引起会话兴趣学习偏差。为此,提出了结合图对比学习的多图神经网络会话推荐方法。其核心思想是:在物品局部图、物品全局图等上提取融入物品局部和全局的高阶邻域物品表示,并生成物品级的会话表示,然后设计会话-会话图并学习会话级的会话表示,最后递归利用不同级别会话兴趣生成正负样本对,通过对比学习机制增强会话兴趣区分性。与退出策略相比,所提模型保留了完整的会话信息,实现了真正的数据扩充。在两个基准数据集上进行了大量实验,结果表明,该算法的推荐性能远优于主流基线方法。
基于双域稀疏Transformer的变电站设备故障预警方法
张建亮, 李洋, 朱春山, 薛泓林, 马军伟, 张丽霞, 毕胜
计算机科学. 2024, 51 (5): 62-69.  doi:10.11896/jsjkx.230300001
摘要 ( 117 )   PDF(2800KB) ( 116 )   
参考文献 | 相关文章 | 多维度评价
利用变电站电气设备运行时产生的时间序列数据,可以构建其未来运行状态的预测模型,从而提前发现异常数据,排除故障隐患,提升变电站的稳定性和可靠运行能力。Transformer模型是一种新兴的序列化数据处理模型,在面对较长序列时更具优势,可以满足故障预警前瞻性的需求。然而Transformer的模型结构使其具有较高的计算复杂度与空间占用率,难以直接应用到故障预警任务中。据此提出了一种基于时间序列预测的变压器设备故障预警方法,通过改进Transformer模型实现对设备运行数据的建模。该模型使用双塔式的编码器结构提取序列在频域和时域的特征,将时间特征数据和空间特征数据进行多维数据融合,从而提取更细致的信息。其次,用稀疏化处理的注意力机制代替标准的注意力机制,降低Transformer的计算复杂度和空间占用率,以满足实时预警的需求。在ETT变压器设备数据集上通过实验证明了所提模型的优越性,以及所改进的模块的必要性。相较于其他方法,该模型在多数预测任务中的MSE与MAE指数都达到了最优,尤其在长序列预测任务中表现出了更佳的性能,且预测速度更快。
大图中多样化Top-k模式挖掘算法研究
何宇昂, 王欣, 沈玲珍
计算机科学. 2024, 51 (5): 70-84.  doi:10.11896/jsjkx.230300003
摘要 ( 76 )   PDF(5498KB) ( 105 )   
参考文献 | 相关文章 | 多维度评价
频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据挖掘领域的一项重要任务。该任务的目标是从图数据中找到出现频次大于给定阈值的所有模式。近年来,随着社交网络等大规模图数据的涌现,单一大图上的FPM问题受到广泛关注,并得到了较为充分的研究,取得了一系列研究成果。然而,已有技术大都存在着计算成本高、挖掘结果理解困难以及并行计算难等问题。针对上述问题,文中提出了一种从大规模图数据中挖掘多样化top-k模式的方法。首先设计了一个多样化函数,用于度量模式集合的多样性;随后设计了一种面向分布式图数据,具有提前终止特性的分布式挖掘算法DisTopk,以实现多样化top-k模式高效挖掘。在真实图数据和合成图数据上进行了大量实验,结果表明,与传统分布式挖掘算法相比,DisTopk算法能更高效地挖掘多样化top-k模式。
计算机图形学&多媒体
基于跨模态信息过滤的视觉问答网络
何世阳, 王朝晖, 龚声蓉, 钟珊
计算机科学. 2024, 51 (5): 85-91.  doi:10.11896/jsjkx.230300202
摘要 ( 94 )   PDF(3124KB) ( 112 )   
参考文献 | 相关文章 | 多维度评价
视觉问答作为多模态任务,瓶颈在于需要解决不同模态间的融合问题,这不仅需要充分理解图像中的视觉和文本,还需具备对齐跨模态表示的能力。注意力机制的引入为多模态融合提供了有效的路径,然而先前的方法通常将提取的图像特征直接进行注意力计算,忽略了图像特征中含有噪声和不正确的信息这一问题,且多数方法局限于模态间的浅层交互,未曾考虑模态间的深层语义信息。为解决这一问题,提出了一个跨模态信息过滤网络,即首先以问题特征为监督信号,通过设计的信息过滤模块来过滤图像特征信息,使之更好地契合问题表征;随后将图像特征和问题特征送入跨模态交互层,在自注意力和引导注意力的作用下分别建模模态内和模态间的关系,以获取更细粒度的多模态特征。在VQA2.0数据集上进行了广泛的实验,实验结果表明,信息过滤模块的引入有效提升了模型准确率,在 test-std上的整体精度达到了71.51%,相比大多数先进的方法具有良好的性能。
一种多阶段的黑白影像智能色彩修复算法
宋建锋, 张文英, 韩露, 胡国正, 苗启广
计算机科学. 2024, 51 (5): 92-99.  doi:10.11896/jsjkx.231100067
摘要 ( 76 )   PDF(6127KB) ( 132 )   
参考文献 | 相关文章 | 多维度评价
针对黑白电影的上色过程中,自动上色模型只生成一种结果导致上色结果单一、基于参考示例上色方法需要用户指定参考图像、参考图像的高要求会耗费大量人力的问题,提出了一种多阶段的黑白影像智能色彩修复算法(A Multi-Stage Intelligent Color Restoration Algorithm for Black-and-White Movies,MSICRA)。首先,使用VGG19网络将电影分割为多个场景片段;其次,将每个场景片段逐帧切割,将每帧图像的边缘强度和灰度差作为图像清晰度评判指标,筛选出每个场景中清晰度位于[0.95,1]区间的图像;然后,选择筛选出的图像中的第一张,使用不同的渲染因子值进行上色,利用饱和度进行上色效果的评估,选择合适的渲染因子值对筛选出的图像上色;最后,利用上色前和上色后图像之间的均方误差选择上色质量较好的图像作为该场景片段上色的参考图像。实验结果表明,所提算法在黑白电影《雷锋》和《永不消逝的电波》的PSNR上分别提高了1.32%和2.15%,SSIM分别提高了1.84%和1.04%。该算法不仅可以实现全自动上色,而且颜色真实,符合人们的认知。
集成全尺度融合和循环注意力的医学图像分割网络
单昕昕, 李凯, 文颖
计算机科学. 2024, 51 (5): 100-107.  doi:10.11896/jsjkx.230400114
摘要 ( 129 )   PDF(2701KB) ( 161 )   
参考文献 | 相关文章 | 多维度评价
深度学习中的编解码网络在图像特征提取和分层特征融合方面具有卓越的性能,常被用于医学图像分割。但是,目前主流的编解码网络分割方法仍面临编码和解码阶段单一网络挖掘的图像特征信息不足,以及仅使用简单的跳跃连接而无法充分利用全尺度特征包含的粗粒度信息和细粒度信息等问题。为了解决上述问题,提出了一种集成全尺度融合和循环注意力的医学图像分割网络。首先,在U-Net编码器中加入了结合多层感知机(MLP)的卷积MLP模块来提取图像的全局特征信息,用于扩大编码器的特征感受野。其次,通过全尺度特征融合模块使得各尺度跳跃连接特征进行粗粒度信息和细粒度信息的有效融合,减小各尺度跳跃连接特征间的语义差异,突出图像的关键特征信息。最后,解码器通过提出的结合循环神经网络(RNN)和注意力机制的循环注意力解码模块(RADU)来逐级精细化图像特征信息,加强特征提取的同时避免信息冗余,并得到高精度分割结果。在4个数据集上将所提方法与主流较优的方法进行比较,所提方法在像素精度和骰子相似系数两个指标上的图像分割精度均有提高。因此,所提出的用于医学图像分割的编解码网络利用全尺度特征融合模块和循环注意力解码模块,能够获得较优异的高精度分割结果,并且模型具有良好的噪声鲁棒性和抗干扰能力。
基于Transformer紧凑编码的局部近重复视频检测算法
王萍, 余圳煌, 鲁磊
计算机科学. 2024, 51 (5): 108-116.  doi:10.11896/jsjkx.230300232
摘要 ( 101 )   PDF(3545KB) ( 111 )   
参考文献 | 相关文章 | 多维度评价
针对现有局部近重复视频检测算法特征存储消耗大、整体查询效率低、提取特征时并未考虑近重复帧之间细微的语义差异等问题,文中提出了一种基于Transformer紧凑编码的局部近重复视频检测算法。首先,提出了一个基于Transformer的特征编码器,其学习了大量近重复帧之间细微的语义差异,可以在编码帧特征时对各个区域特征图引入自注意力机制,在有效降低帧特征维度的同时也提高了编码后特征的表示性。该特征编码器通过孪生网络训练得到,该网络不需要负样本就可以有效学习近重复帧之间的相似语义信息,因此无需沉重和困难的难负样本标注工作,使得训练过程更加简易和高效。其次,提出了一个基于视频自相似度矩阵的关键帧提取方法,可以从视频中提取丰富但不冗余的关键帧,从而使关键帧特征序列能够更全面地描述原视频内容,提升算法的性能,同时也大幅减少了存储和计算冗余关键帧带来的开销。最后,基于关键帧的低维紧凑编码特征,采用基于图网络的时间对齐算法,实现局部近重复视频片段的检测和定位。该算法在公开的局部近重复视频检测数据集VCDB上取得了优于现有算法的实验性能。
基于渐进式多尺度Transformer的图像去雾算法
周宇, 陈志华, 盛斌, 梁磊
计算机科学. 2024, 51 (5): 117-124.  doi:10.11896/jsjkx.230300049
摘要 ( 97 )   PDF(4574KB) ( 120 )   
参考文献 | 相关文章 | 多维度评价
现有的去雾方法难以在复原图像细节的同时保持全局信息。为了解决此问题,文中提出了一种基于渐进式多尺度Transformer(Multi Scale Progressive Transformer,MSP-Transformer)的图像去雾算法。该模型能够有效提取和利用不同尺度的雾相关特征,实现了特征和图像的多尺度学习和融合,渐进式地从有雾图像中复原清晰图像。所提出的MSP-Transformer分为编码、解码和复原3个阶段。在编码阶段,利用基于Transformer模块的编码器将输入图像分解为不同尺度的雾图像特征,以全面表征真实有雾图像的信息损失。在解码阶段,考虑到有雾图像的不同区域存在不同尺度的信息丢失,设计了一个包含多尺度注意力机制的特征聚合模块,利用通道注意力和多尺度空间注意力来融合不同尺度的特征信息。复原阶段包含了复原模块和融合模块,首先基于多尺度特征融合的复原模块聚合不同尺度的雾相关特征以增加不同尺度特征的联系,并在每个尺度复原出清晰的无雾图像,然后将每个尺度的复原图像送入融合模块以获得最终的去雾结果。定性和定量的实验结果表明,所提出的MSP-Transformer在真实图像和合成数据集上能够实现雾的有效去除,具有良好的鲁棒性。在公开的RESIDE数据集上与11种去雾方法进行定量和定性比较,MSP-Transformer取得了最高的PSNR(39.53db)和SSIM(0.9954),并获得了良好的视觉效果。此外,消融实验也证明了MSP-Transformer中所提出的模块的有效性。
基于特征注意力提纯的显著性目标检测模型
白雪飞, 申悟呈, 王文剑
计算机科学. 2024, 51 (5): 125-133.  doi:10.11896/jsjkx.230300018
摘要 ( 72 )   PDF(3368KB) ( 107 )   
参考文献 | 相关文章 | 多维度评价
近年来,显著性目标检测技术取得了巨大进展,其中如何选择并有效集成多尺度特征扮演了重要角色。针对现有特征集成方法可能导致的信息冗余问题,提出了一种基于特征注意力提纯的显著性检测模型。首先,在解码器中采用一个全局特征注意力引导模块(GAGM)对带有语义信息的深层特征进行注意力机制处理,得到全局上下文信息;然后,通过全局引导流将其送入解码器各层进行监督训练;最后,利用多尺度特征融合模块(FAM)对编码器提取出的多尺度特征与全局上下文信息进行有效集成,并在网格状特征提纯模块(MFPM)中进行进一步细化,以生成清晰、完整的显著图。在5个公开数据集上进行实验,结果表明,所提模型优于现有的其他显著性检测方法,并且处理速度快,当处理 320 × 320 尺寸的图像时,能以 30 帧以上的速度运行。
基于多尺度注意力的遥感影像建筑物提取研究
赫晓慧, 周涛, 李盼乐, 常静, 李加冕
计算机科学. 2024, 51 (5): 134-142.  doi:10.11896/jsjkx.230200134
摘要 ( 70 )   PDF(6283KB) ( 105 )   
参考文献 | 相关文章 | 多维度评价
基于深度学习的遥感影像建筑物提取方法具有覆盖范围广、运算效率高的特点,在城市建设、灾害防治等方面有着重要的实际意义。主流方法大多采用多尺度特征融合的方式使神经网络能够学习到更丰富的语义信息,然而由于受到多尺度特征的复杂性以及其他类别地物的干扰,该类方法往往存在着目标漏检与噪声密集的问题。对此,文中设计并实现了一种结合注意力机制的特征解译模型MGA-ResNet50(MGAR)。该方法的核心在于利用多头注意力对高等级语义信息进行分层加权处理,以提取出表征效果较好的最优特征组合;而后使用门控结构将每维特征图与对应编码端的低级语义信息融合,来解决局部建筑物细节信息丢失的问题。在Massachusetts Building,WHU Building等公开数据集上的实验结果表明,与RAPNet,GAMNet,GSM等较为先进的多尺度特征融合方法相比,所提算法能够取得更高的F1与IoU指标。
基于多尺度视觉感知特征融合的显著目标检测方法
吴小琴, 周文俊, 左承林, 王一帆, 彭博
计算机科学. 2024, 51 (5): 143-150.  doi:10.11896/jsjkx.230100132
摘要 ( 112 )   PDF(4634KB) ( 151 )   
参考文献 | 相关文章 | 多维度评价
显著性物体检测具有重要的理论研究意义和实际应用价值,已在许多计算机视觉应用中发挥了重要作用,如视觉追踪、图像分割、物体识别等。然而,自然环境下显著目标的类别未知、尺度多变依然是物体检测面临的一大挑战,影响着显著目标的检测效果。因此,提出了一种基于多尺度视觉感知特征融合的显著目标检测方法。首先,基于视觉感知显著目标的特性,设计并提取多个图像感知特征。其次,图像感知特征采用多尺度自适应方式,获取特征显著图。然后,将各个显著特征图融合,获得最终的显著目标。该方法基于不同图像感知特征的特点,自适应提取显著目标,能够适应多变的检测目标与复杂的检测环境。实验结果表明,在受自然环境中背景干扰的情况下,该方法能有效检测出未知类别和不同尺度的显著目标。
基于双平滑函数秩近似和群稀疏的高光谱图像恢复模型
姜斌, 叶军, 张历洪, 司伟纳
计算机科学. 2024, 51 (5): 151-161.  doi:10.11896/jsjkx.230200044
摘要 ( 55 )   PDF(6236KB) ( 93 )   
参考文献 | 相关文章 | 多维度评价
高光谱图像(HSI)具有良好的光谱识别能力,被广泛地应用于各种领域。然而,HSI在成像过程中易受到混合噪声的污染,会严重削弱后续任务的准确性,如何高质量地恢复HSI是需要解决的首要问题。目前,基于低秩先验和全变分正则化结合的HSI去噪方法取得了较好的性能,但这些方法一方面忽略了高强度条纹噪声在空间结构和光谱分布上的特征,使得噪声无法完全去除,另一方面没有考虑HSI差分图像低秩子空间的信息,不能挖掘潜在的局部空间光滑结构。为此,提出了一种基于双平滑函数秩近似和群稀疏的HSI恢复模型。首先,利用双平滑函数秩近似模型探索干净HSI和条纹噪声的低秩结构,去除结构化条纹噪声等高强度混合噪声。其次,将基于E3DTV的群稀疏正则化融入双平滑函数秩近似模型中,充分挖掘HSI差分图像的稀疏先验信息,进一步提升图像在空间恢复和光谱特征保留方面的性能。最后,设计了交替方向乘子法(ADMM)求解所提出的BSRAGS模型。仿真和真实数据实验均表明,所提模型能够有效提高图像恢复质量。
基于边卷积与瓶颈注意力的点云三维目标检测
简英杰, 杨文霞, 方玺, 韩欢
计算机科学. 2024, 51 (5): 162-171.  doi:10.11896/jsjkx.230300113
摘要 ( 83 )   PDF(3474KB) ( 88 )   
参考文献 | 相关文章 | 多维度评价
点云数据的高度稀疏特性使当前大部分基于点云的三维目标检测算法对点云的局部特征学习不足,且点云数据包含的部分无效信息会干扰目标检测。针对以上问题,提出了一种基于边卷积与瓶颈注意力的三维目标检测模型。首先,构建多层边卷积(Edge Convolution,EdgeConv),针对点云中的每个点,通过寻找特征空间上与其最接近的K个点,以构建K-近邻图结构,并学习点云的多尺度局部特征;其次,设计适用于三维点云数据的瓶颈注意力模块(Bottleneck Attention Module,BAM),每个BAM包括一个通道注意力模块和一个空间注意力模块,用于增强对目标检测有价值的点云信息,提升网络模型的表征能力。网络以VoteNet为基线,多层边卷积和BAM模块依次加入PointNet++网络和投票模块之间。模型在SUN RGB-D和ScanNetV2公共数据集上进行实验,并与13个当前先进的三维目标检测算法进行对比。实验结果表明,对于SUN RGB-D数据集,所提模型在交并比(Intersection over Union,IoU)为0.5时的平均精确率mAP@0.5达到了最高,并在床、椅子、办公桌等6个对象类别(共10个类别)达到最优准确率(AP@0.25);对于ScanNetV2数据集,模型的mAP@0.25和mAP@0.5均达到最优,并在椅子、沙发、照片等10个对象类别(共18个类别)达到了最优准确率(AP@0.25)。与基线VoteNet相比,所提模型在两个数据集上的mAP@0.25分别提升了6.5%和12.9%,消融实验证明了所加入的边卷积模块和瓶颈注意力模块的有效性。
人工智能
基于文本及历史数据的多标签专利分类算法研究
徐雪洁, 王宝会
计算机科学. 2024, 51 (5): 172-178.  doi:10.11896/jsjkx.230200199
摘要 ( 94 )   PDF(2857KB) ( 133 )   
参考文献 | 相关文章 | 多维度评价
专利分类是专利数据挖掘领域一项非常重要的任务,该任务的目标是为给定专利文献分配若干个国际专利分类(IPC)号,近几年针对该任务的很多研究都集中在通过挖掘专利文本表示对IPC分类体系中部级或大类级分类号的多分类预测。而实际场景中,一篇专利往往有多个分类号,是一种多标签分类任务,且除了专利的文本内容外,每个专利都有对应的专利权组织,专利权组织的历史专利申请行为会有一定的业务倾向,这种申请行为的偏好表示能有效提高专利分类准确度。然而,目前专利分类的相关研究中并没有充分利用到专利的历史数据,针对IPC体系小类的多标签分类问题,提出了一个综合考虑专利内容的专利自动分类模型。首先用BERT预训练语言模型初始化专利文本表示,再利用Text-CNN捕捉局部特征获得将其输出作为专利文本的最终表示;其次,通过Bi-LSTM对历史专利文本及专利标签进行双通道聚合,学习该组织的历史专利申请行为表示;最后,将专利的文本表示与历史专利申请行为表示进行融合后做预测。在真实专利数据集上,将所提模型与基于专利文本挖掘的不同基线进行了对比实验,结果表明基于专利文本和历史数据建模的深度学习分类算法在精确度上有很大的提升。
基于智能规划的多智能体强化学习算法
辛沅霞, 华道阳, 张犁
计算机科学. 2024, 51 (5): 179-192.  doi:10.11896/jsjkx.230800099
摘要 ( 92 )   PDF(9040KB) ( 121 )   
参考文献 | 相关文章 | 多维度评价
目前深度强化学习算法在不同应用领域中已经取得诸多成果,然而在多智能体任务领域中,往往面临大规模的具有稀疏奖励的非稳态环境,低探索效率问题仍是一大挑战。由于智能规划能够根据任务的初始状态和目标状态快速制定出决策方案,该方案能够作为各智能体的初始策略,并为其探索过程提供有效指导,因此尝试将智能规划与多智能体强化学习进行结合求解,并且提出统一模型UniMP(a Unified model for Multi-agent Reinforcement Learning and AI Planning)。在此基础上,设计并建立相应的问题求解机制。首先,将多智能体强化学习任务转化为智能决策任务;其次,对其执行启发式搜索,以得到一组宏观目标,进而指导强化学习的训练,使得各智能体能够进行更加高效的探索。在多智能体即时战略对抗场景StarCraft II的各地图以及RMAICS战车模拟对战环境下进行实验,结果表明累计奖励值和胜率均有显著提升,从而验证了统一模型的可行性、求解机制的有效性以及所提算法灵活应对强化学习环境突发情况的能力。
面向前提选择的新型图约简表示与图神经网络模型
兰咏琪, 何星星, 李莹芳, 李天瑞
计算机科学. 2024, 51 (5): 193-199.  doi:10.11896/jsjkx.230300193
摘要 ( 77 )   PDF(1988KB) ( 75 )   
参考文献 | 相关文章 | 多维度评价
自动定理证明器在证明问题时其搜索空间通常会呈现爆炸式增长,前提选择为该问题提供了新的解决思路。针对现有前提选择方法中逻辑公式图、图神经网络模型难以捕捉到公式图潜在信息的问题,提出了一种基于删除重复量词的简化逻辑公式图表示和具有注意力机制的项游走图神经网络模型,充分利用逻辑公式的语法和语义信息提高前提选择问题的分类精度。首先,将一阶逻辑猜想和前提公式转化为基于删除重复量词的简化一阶逻辑公式图;其次,利用消息传递图神经网络对节点和节点的项游走特征信息进行聚合和更新,随后使用注意力机制为图上的节点分配权重,进而调整图节点嵌入信息;最后,将前提图向量和猜想图向量拼接并输入二元分类器中实现前提分类。实验结果表明,所提方法在MPTP数据集和CNF数据集上的准确率分别达到了88.61%和84.74%,超越现有最优的前提选择方法。
结合句法增强与图注意力网络的方面级情感分类
张泽宝, 余翰男, 王勇, 潘海为
计算机科学. 2024, 51 (5): 200-207.  doi:10.11896/jsjkx.230200189
摘要 ( 84 )   PDF(2230KB) ( 109 )   
参考文献 | 相关文章 | 多维度评价
方面级情感分类旨在识别给定特定方面文本的情感极性,在本领域中,将图神经网络与句法依赖解析相结合是当下热门的研究方向之一,此类方法通过句法解析捕捉句子中词与词之间的关系,依此构建图结构,输入图神经网络中得到情感极性。若句法解析器出现解析错误,将会对以图为基础的图神经网络模型产生巨大影响。为了增强解析器生成的句法依赖树的解析结果,文中提出了一种句法增强图注意力网络,该网络通过融合多个解析器的解析结果,提高句法依赖解析精度,得到更精准的依赖关系句法图;在图注意力网络中使用密集连接机制捕获更丰富的特征,更适配于增强后的句法图,同时引入方面注意力机制捕获方面语义特征。实验结果验证了句法增强方法的有效性,在3个基准数据集上的分类准确度都有所提高,在方面级情感分析领域具有较好的表现。
基于跨层级多视角特征的多语言事件探测
张志远, 张维彦, 宋雨秋, 阮彤
计算机科学. 2024, 51 (5): 208-215.  doi:10.11896/jsjkx.230200131
摘要 ( 81 )   PDF(2890KB) ( 69 )   
参考文献 | 相关文章 | 多维度评价
多语言事件探测任务的目标是将多种语言的新闻文档集合组织成不同的关键事件,其中每个事件可以包含不同语言的新闻文档。该任务有助于各种下游任务应用,如多语言知识图谱构建、事件推理、信息检索等。目前,多语言事件探测主要分为先翻译再事件探测与先单语言检测再跨多种语言对齐两种方法,前者依赖翻译的效果,后者需要为每种语言单独训练模型。为此,提出了一种名为基于跨层级多视角特征融合的多语言事件探测方法,端到端地进行多语言事件探测任务。该方法从不同层级利用文档的多视角特征,获得了高可靠性的多语言事件探测结果并提升了低资源语言事件探测的泛化性能。在9种语言混合的新闻数据集上进行的实验表明,所提方法的BCubed F1值提升了4.63%。
基于深度多视图网络的政务事件分拨方法
李子琛, 易修文, 陈顺, 张钧波, 李天瑞
计算机科学. 2024, 51 (5): 216-222.  doi:10.11896/jsjkx.230300034
摘要 ( 65 )   PDF(2112KB) ( 83 )   
参考文献 | 相关文章 | 多维度评价
12345政务服务便民热线是由各地市政府设立的专门受理热线事项的公共服务平台。随着政府信息化进程的推进,12345热线作为市民与政府交流纽带的重要性大大提高,并对事件处置的效率提出了更高的要求。针对传统事件分拨方法主要依赖于分拨人员人工操作、速度较慢、准确率不高,且需要消耗大量人力资源的问题,文中提出了一种基于深度多视图网络的政务事件分拨方法。首先,通过自监督学习训练带权重的图卷积神经网络,从历史记录中抽取事件归口-分拨部门的分拨行为特征作为事件的归口视图。其次,使用经过政务领域语料微调的BERT模型,提取事件描述与事件标题的语义特征,得到事件的语义视图。然后,使用基于交叉注意力机制的残差网络,将事件的两种视图融合,得到事件的融合表征。最后,将融合表征输入分类器,得到事件分拨的结果。在南通市12345热线的数据集上进行实验,结果表明,所提方法在各项指标上均优于其他基线方法,能够有效提高事件分拨的效率。
基于自适应上下文匹配网络的小样本知识图谱补全
杨旭华, 张炼, 叶蕾
计算机科学. 2024, 51 (5): 223-231.  doi:10.11896/jsjkx.230200012
摘要 ( 120 )   PDF(2277KB) ( 105 )   
参考文献 | 相关文章 | 多维度评价
知识图谱在构建过程中需要面对繁杂的现实世界信息,无法建模所有知识,因此需要补全。真实的知识图谱中很多类型的关系通常只有少量的训练实体样本对。因此,如何进行小样本知识图谱补全是一个十分有价值的问题。目前基于嵌入的方法一般通过注意力机制等方法聚合实体上下文信息,通过学习关系嵌入的方式来补全知识图谱,仅考虑关系层面的匹配程度,虽然能够预测未知关系,但往往准确度不高。针对小样本知识图谱补全问题,提出了一个自适应上下文匹配网络(Adaptive Context Matching Network,ACMN)。首先提出一个共性邻居感知编码器,聚合参考集实体上下文,即一跳邻居实体,获得共性邻居感知编码;接着提出一个任务相关实体编码器,挖掘任务实体上下文与共性上下文的相似度信息,区分一跳邻居对当前任务的贡献,增强实体表征;然后提出一个上下文关系编码器获得动态关系表征;最后通过加权求和综合考虑实体上下文和关系的匹配程度,完成补全。ACMN从实体上下文相似度和关系匹配程度两个方面综合评价查询三元组是否成立,能够在小样本的背景下有效提高预测准确性。在两个公共数据集上和其他8个广泛使用的算法进行比较,ACMN在不同规模的小样本情况下,取得了目前最好的补全结果。
求解不可分离非凸非光滑问题的线性惯性ADMM算法
刘洋, 刘康, 王永全
计算机科学. 2024, 51 (5): 232-241.  doi:10.11896/jsjkx.240200027
摘要 ( 76 )   PDF(2175KB) ( 86 )   
参考文献 | 相关文章 | 多维度评价
针对目标函数中包含耦合函数H(x,y)的非凸非光滑极小化问题,提出了一种线性惯性交替乘子方向法(Linear Inertial Alternating Direction Method of Multipliers,LIADMM)。为了方便子问题的求解,对目标函数中的耦合函数H(x,y)进行线性化处理,并在x-子问题中引入惯性效应。在适当的假设条件下,建立了算法的全局收敛性;同时引入满足 Kurdyka-Łojasiewicz 不等式的辅助函数,验证了算法的强收敛性。通过两个数值实验表明,引入惯性效应的算法比没有惯性效应的算法收敛性能更好。
基于平均一致协议的分布式自适应多智能体聚集控制
谢光强, 钟必为, 李杨
计算机科学. 2024, 51 (5): 242-249.  doi:10.11896/jsjkx.230300159
摘要 ( 62 )   PDF(3960KB) ( 79 )   
参考文献 | 相关文章 | 多维度评价
分布式聚集控制问题是多智能体协同控制中的一个重要问题。由于智能体的可移动性和感知能力有限,传统的分布式聚集算法难以保证连通性,从而聚集成多个簇群。此外,去中心化的大规模聚集控制给获取全局聚集点带来了巨大的挑战。针对连通性保护问题,基于平均一致协议与约束集,提出了一个带有连通性约束的多智能体聚集协议(Multi-Agent Rendezvous Protocol with Connectivity constraints,MARP-CC)。然后针对聚集点无法预测的问题,提出了位置合成(Location Synthesis Strategy,LSS)和位置重定向(Location Redirection Strategy,LRS)两种控制策略。智能体根据当前连通情况,自适应选择最优的控制策略进行迭代。结合这两种控制策略,提出了带连通性约束的分布式自适应多智能体聚集算法(Distributed Adaptive Multi-Agent Rendezvous algorithm with Connectivity Constraints,DAMAR-CC)。对算法的收敛性和连通性进行了分析,并通过大量的仿真说明了DAMAR-CC可以引导智能体稳定地聚集在初始拓扑的几何中心。
融合语义解释和DeBERTa的极短文本层次分类
陈昊飏, 张雷
计算机科学. 2024, 51 (5): 250-257.  doi:10.11896/jsjkx.231100134
摘要 ( 74 )   PDF(1593KB) ( 112 )   
参考文献 | 相关文章 | 多维度评价
文本层次分类在社交评论主题分类、搜索词分类等场景中有重要应用,这些场景的数据往往具有极短文本特征,体现在信息的稀疏性、敏感性等中,这对模型特征表示和分类性能带来了很大挑战,而层次标签空间的复杂性和关联性使得难度进一步加剧。基于此,提出了一种融合语义解释和DeBERTa模型的方法,该方法的核心思想在于:引入具体语境下各个字词或词组的语义解释,补充优化模型获取的内容信息;结合DeBERTa模型的注意力解耦机制与增强掩码解码器,以更好地把握位置信息、提高特征提取能力。所提方法首先对训练文本进行语法分词、词性标注,再构造GlossDeBERTa模型进行高准确率的语义消歧,获得语义解释序列;然后利用SimCSE框架使解释序列向量化,以更好地表征解释序列中的句子信息;最后训练文本经过DeBERTa模型神经网络后,得到原始文本的特征向量表示,再与解释序列中的对应特征向量相加,传入多分类器。实验遴选短文本层次分类数据集TREC中的极短文本部分,并进行数据扩充,最终得到的数据集平均长度为12词。多组对比实验表明,所提出的融合语义解释的DeBERTa模型性能最为优秀,在验证集和测试集上的Accuracy值、F1-micro值、F1-macro值相比其他算法模型有较大的提升,能够很好地应对极短文本层次分类任务。
基于提示学习的生成式医疗对话理解方法
柳俊, 阮彤, 张欢欢
计算机科学. 2024, 51 (5): 258-266.  doi:10.11896/jsjkx.230300007
摘要 ( 80 )   PDF(1769KB) ( 92 )   
参考文献 | 相关文章 | 多维度评价
任务型对话系统中的对话理解模块的目标是将用户输入的自然语言转换成结构化的形式,但在面向诊断的医疗对话系统中,现有方法存在如下问题:1)无法支持精准医疗所需的信息粒度,如给出某一症状的严重程度;2)难以同时满足医疗领域中多样化的槽值表示形式,如“症状”等可能含有非连续与嵌套实体的抽取型槽以及“否定”等分类型槽。文中提出了一种基于提示学习的多层次生成式医疗对话理解方法。针对问题1),用多层次槽结构替代当前对话理解任务中单层的槽结构,以表示更细粒度的信息,之后采用一种基于对话风格提示的生成式方法,利用提示字符模拟医患对话,从多轮交互中获得多层次信息。针对问题2),提出在推理过程中使用一种受限的解码策略,使模型能够以统一的方式处理意图识别与分类型和抽取型的槽填充任务,避免复杂的建模。此外,针对医疗领域缺少标注数据的问题,提出了一种两阶段训练策略,以充分利用大规模的无标注医疗对话语料来提升性能。针对含有多层次槽结构的医疗对话理解任务标注并发布了一个数据集,包含4 722条对话,涉及17种意图与74种槽。实验结果表明,所提方法能够有效解析医疗对话中的各种复杂实体,相比已有的生成方法,其性能高出2.18%,而在小样本的场景下两阶段训练最高能提高模型5.23%的性能。
计算机网络
基于混合式特征选择的辐射源个体识别
顾楚梅, 曹建军, 王保卫, 徐雨芯
计算机科学. 2024, 51 (5): 267-276.  doi:10.11896/jsjkx.230300216
摘要 ( 64 )   PDF(2474KB) ( 79 )   
参考文献 | 相关文章 | 多维度评价
为提高辐射源个体识别的准确率和运算效率,提出了一种基于混合式特征选择的辐射源个体识别。封装式特征选择方法分类正确率高,但计算复杂度高,处理高维数据时效率低。嵌入式特征选择方法计算复杂度低,但依赖于特定分类器。针对上述问题,综合封装式和嵌入式特征选择方法的特点,首先对信号数据使用3种嵌入式方法(随机森林、XGBoost和Ligh-tGBM)初选特征,分别得到随机森林子集、XGBoost子集和LightGBM子集。然后使用封装式方法对初选后得到的子集进行第二次降维,其中搜索策略分别使用序列后向搜索策略和蚁群优化算法,分类算法使用LightGBM。混合式方法共得到6种特征选择模型,通过对比各个模型得到的分类正确率和最优子集中的特征个数,确定最佳混合式特征选择模型。
基于迁移学习的动态环境室内定位方法研究
王佳昊, 付一夫, 冯海男, 任昱衡
计算机科学. 2024, 51 (5): 277-283.  doi:10.11896/jsjkx.230300137
摘要 ( 66 )   PDF(2601KB) ( 105 )   
参考文献 | 相关文章 | 多维度评价
随着智能家居应用的不断深化,基于Wi-Fi信号的室内定位技术也受到了广泛关注。在实际应用中,大多数室内定位算法采集得到的训练数据和测试数据通常并非来自于同一理想环境,各种环境条件变化以及信号漂移导致采集得到的训练数据和测试数据间的概率分布不同。传统定位模型在面对不同分布的训练数据和测试数据时无法保证具有良好的定位精度,常出现算法定位精度大幅降低,甚至算法不可用等问题。面对这一难点,迁移学习中的域适应方法作为一种可以有效解决训练样本和测试样本概率分布不一致的学习问题被广泛应用于室内定位领域。文中结合域适应学习和机器学习算法,提出了一种基于特征迁移的室内定位算法(Transfer Learning Location Algorithm Based on Global and Local Metrics Adaptation,TL-GLMA)。TL-GLMA在定位阶段通过特征迁移方式将两域原始数据映射至高维空间,从而在最小化两域数据的分布差异的同时保留两域数据内部的局部几何属性,并利用映射后的独立同分布数据训练分类器,从而实现目标定位。实验结果表明,TL-GLMA能够有效减少环境变化带来的干扰,提升定位精度。
面向内生安全交换机的段路由带内遥测方法
顾周超, 程光, 赵玉宇
计算机科学. 2024, 51 (5): 284-292.  doi:10.11896/jsjkx.230400030
摘要 ( 80 )   PDF(3809KB) ( 87 )   
参考文献 | 相关文章 | 多维度评价
近年来,网络技术的发展日新月异,基础设备及其所提供的网络服务也日益复杂。传统的网络管理和监控手段面临严峻的挑战。国内外研究人员提出段路由(Segment Routing,SR)和带内网络遥测(In-band Network Telemetry,INT)等技术来进行实时性更高、更细粒度的网络测量。然而,在流量迅速增长的网络环境下,带内网络遥测技术在实际使用中仍然存在着灵活部署、动态部署、高效部署等诸多难题。首先,传统INT技术缺乏合适的载体,数据包的开销随遥测路径长度线性增加,从而导致遥测监控的性能瓶颈问题。针对传统带内网络遥测系统比特开销大、难以高效部署的问题,提出了基于SRv6(Segment Routing IPv6,SRv6)的带内网络遥测方法(SRv6_Based INT),通过研究减小INT和SR的开销,将两者无缝结合以实现轻量级的遥测。在本项工作中,通过设计INT的元数据,使其长度等于SRv6中的Segment字段,然后在每一跳中根据监控服务器下发的流表将SID修改成相应的INT元数据。该方法充分结合了两项技术的优点,并将开销控制在合理的范围,优于传统的带内网络遥测方法。
COURIER:基于非抢占式优先排队和优先经验重放DRL的边缘计算任务调度与卸载方法
杨秀文, 崔允贺, 钱清, 郭春, 申国伟
计算机科学. 2024, 51 (5): 293-305.  doi:10.11896/jsjkx.230200121
摘要 ( 78 )   PDF(4567KB) ( 98 )   
参考文献 | 相关文章 | 多维度评价
边缘计算(Edge Computing,EC)将计算、存储等资源部署在网络边缘,以满足业务对时延和能耗的要求。计算卸载是EC中的关键技术之一。现有的计算卸载方法在估计任务排队时延时使用M/M/1/∞/∞/FCFS或M/M/n/∞/∞/FCFS排队模型,未考虑高时延敏感型任务的优先执行问题,使得一些对时延要求不敏感的计算任务长期占用计算资源,导致系统的时延开销过大。此外,现有的经验重放方法大多采用随机采样方式,该方式不能区分经验的优劣,造成经验利用率低,神经网络收敛速度慢。基于确定性策略深度强化学习(Deep Reinforcement Learning,DRL)的计算卸载方法存在智能体对环境的探索能力弱和鲁棒性低等问题,降低了求解计算卸载问题的精度。为解决以上问题,考虑边缘计算中多任务移动设备、多边缘服务器的计算卸载场景,以最小化系统时延和能耗联合开销为目标,研究任务调度与卸载决策问题,并提出了基于非抢占式优先排队和优先经验重放DRL的计算卸载方法(Computation Offloading qUeuing pRioritIzed Experience Replay DRL,COURIER)。COURIER针对任务调度问题,设计了非抢占式优先排队模型(M/M/n/∞/∞/NPR)以优化任务的排队时延;针对卸载决策问题,基于软演员-评论家(Soft Actor Critic,SAC)提出了优先经验重放SAC的卸载决策机制,该机制在目标函数中加入信息熵,使智能体采取随机策略,同时优化机制中的经验采样方式以加快网络的收敛速度。仿真实验结果表明,COURIER能有效降低EC系统时延和能耗联合开销。
基于多尺度FCN和GRU的雷达有源干扰识别
洪梯境, 刘登峰, 刘以安
计算机科学. 2024, 51 (5): 306-312.  doi:10.11896/jsjkx.230300062
摘要 ( 58 )   PDF(1978KB) ( 81 )   
参考文献 | 相关文章 | 多维度评价
雷达在现代电子战中发挥着至关重要的作用,随着电子对抗与电子反对抗的较量愈演愈烈,复杂电磁环境下,雷达有源干扰的人工提取特征困难以及低干噪比下的识别率较低的问题亟需解决。针对该问题,文中提出了一种基于多尺度全卷积网络(Multiscale and Fully Convolutional Neural Network,MFCN)和门控循环网络(Gated Recurrent Unit,GRU)并联的干扰识别算法。这是一种端对端的深度神经网络模型,其输入干扰信号的原始时域序列,不需要对数据进行复杂的预处理,即可提取信号在时间和空间上的融合特征,并能对不同干噪比下的干扰信号进行分类识别。仿真结果表明,随着干噪比的逐渐增加,网络的识别准确率也逐渐提升;在-10~10 dB的全干噪比范围内,网络的整体识别率为99.4%,干噪比为-6 dB以上时识别准确率接近100%,与单纯的多尺度全卷积网络、门控循环网络和其他经典模型相比具有更高的识别准确率,且能够适应的干噪比的下限更低。
基于云边协同子类蒸馏的卷积神经网络模型压缩方法
孙婧, 王晓霞
计算机科学. 2024, 51 (5): 313-320.  doi:10.11896/jsjkx.240100038
摘要 ( 72 )   PDF(2376KB) ( 93 )   
参考文献 | 相关文章 | 多维度评价
当前卷积神经网络模型的训练和分发流程中,云端拥有充足的计算资源和数据集,但难以应对边缘场景中碎片化的需求。边缘侧能够直接进行模型的训练和推理,但难以直接使用云端按照统一规则训练的卷积神经网络模型。针对在边缘侧资源受限的情况下,卷积神经网络算法进行模型压缩的训练和推理有效性低的问题,首先,提出了一种基于云边协同的模型分发和训练框架,该框架可以结合云端和边缘侧各自的优势进行模型再训练,满足边缘对指定识别目标、指定硬件资源和指定精度的需求。其次,基于云边协同框架训练的思路,对知识蒸馏技术进行改进,提出了新的基于Logits和基于Channels两种子类知识蒸馏方法(SLKD和SCKD),云服务端先提供具有多目标识别的模型,而后通过子类知识蒸馏的方法,在边缘侧将模型重新训练为一个可以在资源受限的场景下部署的轻量化模型。最后,在CIFAR-10公共数据集上,对联合训练框架的有效性和两种子类蒸馏算法进行了验证。实验结果表明,在压缩比为50%的情况下,相比具有全部分类的模型,所提模型推理准确率得到了显著的提升(10%~11%);相比模型的重新训练,通过知识蒸馏方法训练出的模型精度也有显著提高,并且压缩比率越高,模型精度提升越明显。
信息安全
抗JPEG压缩的自适应图像隐写算法
张静涵, 陈文
计算机科学. 2024, 51 (5): 321-330.  doi:10.11896/jsjkx.231000036
摘要 ( 87 )   PDF(3310KB) ( 126 )   
参考文献 | 相关文章 | 多维度评价
现有的网络通信系统在传输图像时往往会对图像进行JPEG压缩以节约通信开销。然而,传统的图像隐写技术缺乏抗JPEG压缩的能力,系统对含密图像进行有损压缩后,容易导致秘密信息被破坏而无法被正确提取。因此,设计安全、鲁棒的图像隐写技术具有重要的实际应用价值。文中提出了一种抗JPEG压缩的自适应图像鲁棒隐写算法。首先,分析了JPEG压缩对载体图像造成的信息损失,确定了在JPEG压缩前后保持稳定的纹理特征作为秘密信息的鲁棒嵌入域。其次,以此为基础,提出了一种基于图像分块纹理特征自适应调整的秘密信息量化嵌入方法,将秘密信息嵌入到抗压缩变换能力较强的图像块纹理均值特征中。最后,利用错误反馈机制对生成的含密图像进行调整,直到秘密信息提取错误率达到期望值,最终生成抗JPEG压缩的鲁棒含密图像。在 BossBase1.01 图像库上进行对比实验,结果表明,文中提出的抗JPEG压缩鲁棒隐写方法在经过JPEG压缩后,具有较强的抗压缩性和抗检测性,并保持了较高的图像质量。相比传统最低位(least significant bit,LSB)隐写、基于Catalan变换的图像隐写(Catalan based Steganography,CBS)、基于神经网络的图像隐写FNNS(Fixed Neural NetworkSteganography)和基于自编码器的鲁棒图像隐写RoSteALS(Robust Steganography using Autoencoder Latent Space),所提算法有效地将JPEG压缩后含密图像信息提取的平均错误率分别降低了49.79%,49.73%,37.38%和38.85%,生成的含密图像视觉质量高于基于Catalan变换的图像隐写、FNNS隐写和RoSteALS隐写,并保持了较好的抗StegExpose隐写分析性能。
基于MLWE和MSIS的可验证解密方案
郭春彤, 吴文渊
计算机科学. 2024, 51 (5): 331-345.  doi:10.11896/jsjkx.230300127
摘要 ( 81 )   PDF(1769KB) ( 99 )   
参考文献 | 相关文章 | 多维度评价
两方安全计算中涉及的可验证解密技术可以应用在医疗研究数据共享、机构间合作进行模型训练等有隐私保护需求的现实场景中,有助于进一步打破数据孤岛、保障数据安全。但是目前已有的为基于格密码或其他后量子加密方案正确解密所构造的零知识证明的效率不高。面对这一现状,文中针对 Kyber 提出了一个基于模容错学习问题(MLWE) 和模小整数解问题(MSIS) 的可验证解密方案。首先,根据 Kyber 的加解密特性,在利用证明者和验证者所持数据构造相等关系时存在差异,该方案提出了一种利用误差估计结合 Kyber 的压缩函数,使证明者提供给验证者一部分所持数据的信息,从而消除差异的方法,进而提供可以用于验证的相等关系,把该关系与 Dilithium 签名方案无公钥压缩版本的框架相结合,构造非交互式零知识证明,将可验证解密问题转变为证明环中短向量满足的线性关系。其次,在理论上分析了方案的正确性、安全性、通信开销和计算复杂度,将方案的合理性和零知识性规约到 MSIS 困难假设,并提供了 2 组不同安全等级的建议参数设置。最后,通过编写 C 语言程序测试了所提方案的正确性和效率。实验结果与理论分析结果基本一致,与现有方案相比,所提方案在对单个密文的证明大小和证明时间上有显著优势,更加简洁、高效。
基于标签影响力传播的人工免疫检测器生成算法研究
周遵龙, 陈文, 马欣蕾
计算机科学. 2024, 51 (5): 346-354.  doi:10.11896/jsjkx.231000027
摘要 ( 54 )   PDF(2459KB) ( 65 )   
参考文献 | 相关文章 | 多维度评价
人工免疫系统利用训练样本对候选检测器进行筛选训练,以产生覆盖非自体区域的成熟检测器用于自体和非自体的区分。传统基于否定选择的检测器生成算法(Negative Selection Algorithm,NSA)通常需要大量有标记的自体训练样本,而实际应用中已标记样本有限,导致检测器训练不足,限制了检测器的检测精度。针对这一问题,提出了一种基于标签影响力传播的免疫检测器训练方法。在属于同一聚类的样本中,通过少量的已标记聚类成员进行标签影响力传播,为聚类中的未标记样本进行伪标记。随后,基于噪声学习的伪标记评估去除低可信的新标记样本。通过了标签评估的新标记样本被加入训练样本集合,以扩展已标记样本规模,提升免疫检测器的训练质量。在7类不同维度和规模的UCI公开数据集上的对比实验结果表明,所提基于标签影响力传播的免疫检测训练算法能够有效提升检测器的训练性能,尤其在训练样本有限或数据集不均衡的情况下,检测器的性能明显优于传统方法,相较于PSA,co-PSA和GFNSA等检测生成算法,检测器的识别精度平均提升了10%。
基于Jump-SBERT的二进制代码相似性检测技术研究
严尹彤, 于璐, 王泰彦, 李宇薇, 潘祖烈
计算机科学. 2024, 51 (5): 355-362.  doi:10.11896/jsjkx.230400011
摘要 ( 95 )   PDF(3011KB) ( 77 )   
参考文献 | 相关文章 | 多维度评价
二进制代码相似性检测技术在不同的安全领域中有着重要的作用。针对现有的二进制代码相似性检测方法面临计算开销大且精度低、二进制函数语义信息识别不全面和评估数据集单一等问题,提出了一种基于Jump-SBERT的二进制代码相似性检测技术。Jump-SBERT有两个主要创新点,一是利用孪生网络构建SBERT网络结构,该网络结构能够在降低模型的计算开销的同时保持计算精度不变;二是引入了跳转识别机制,使Jump-SBERT可以学习到二进制函数的图结构信息,从而更加全面地捕获二进制函数的语义信息。实验结果表明,Jump-SBERT在小函数池(32个函数)中的识别准确率可达96.3%,在大函数池(10 000个函数)中的识别准确率可达85.1%,比最先进(State-of-the-Art,SOTA)的方法高出36.13%,且Jump-SBERT在大规模二进制代码相似性检测中的表现更加稳定。消融实验表明,两个主要创新点对Jump-SBERT均有积极作用,其中,跳转识别机制的贡献最高可达9.11%。
基于对抗样本和自编码器的鲁棒异常检测
李沙沙, 邢红杰
计算机科学. 2024, 51 (5): 363-373.  doi:10.11896/jsjkx.230300153
摘要 ( 69 )   PDF(2490KB) ( 81 )   
参考文献 | 相关文章 | 多维度评价
基于自编码器的异常检测方法仅利用正常样本进行训练,因此可以有效地重构正常样本,但不能较好地对异常样本进行重构。另外,当基于自编码器的异常检测方法受到对抗攻击时,往往会取得错误的检测结果。为了解决上述问题,提出了一种基于对抗样本和自编码器的鲁棒异常检测(Robust Anomaly Detection Based on Adversarial Samples and AutoEncoder,RAD-ASAE)方法。RAD-ASAE由两个参数共享的编码器和一个解码器构成。首先,对正常样本施加微小的扰动以生成对抗样本,利用正常样本和对抗样本同时对模型进行训练,以提高模型的对抗鲁棒性;其次,在样本空间中最小化对抗样本的重构误差以及正常样本与对抗样本的重构样本之间的均方误差,同时在潜在空间中最小化正常样本和对抗样本的潜在特征之间的均方误差,以提高自编码器的重构能力。在MNIST,Fashion-MNIST,CIFAR-10数据集上进行实验,结果表明,与7种相关方法相比,RAD-ASAE展现了更优的异常检测性能。
面向流动追踪的多层鲁棒Excel文档水印
韩松源, 王宏霞, 蒋子渝
计算机科学. 2024, 51 (5): 374-381.  doi:10.11896/jsjkx.230300192
摘要 ( 58 )   PDF(3664KB) ( 79 )   
参考文献 | 相关文章 | 多维度评价
Excel文档被广泛应用于金融财务、科学研究、数据分析、统计报告等领域,在教育培训、在线办公等诸多场景中扮演着重要角色,却也潜藏着违规使用、侵权行为和信息泄露等安全隐患。为保护Excel文档内容的安全,迫切需要研究更安全可靠的文档保护技术。文中基于Excel文档格式,提出了一种面向流动追踪的多层鲁棒Excel文档水印算法,该算法通过将多层水印信息嵌入Excel文档的单元格样式和边框的RGB颜色值中,从而能在实际应用场景中明确敏感文档传播链条,对文档泄露源头进行追踪溯源,定位泄密责任人,以减少信息泄露事件的发生。经实验对比发现,所提水印算法不可感知性好,对增加、删除、重新键入、格式刷、复制粘贴和另存为等多种常见文档操作和攻击具有很强的鲁棒性,同时支持多层水印嵌入。与其他基于文档格式的水印算法相比,所提算法具有更好的水印不可见性、更强的鲁棒性和更宽广的应用范围。
面向多重属性的区块链去中心化程度度量模型
张睿蓉, 牛保宁, 樊星
计算机科学. 2024, 51 (5): 382-389.  doi:10.11896/jsjkx.230300076
摘要 ( 71 )   PDF(2620KB) ( 97 )   
参考文献 | 相关文章 | 多维度评价
去中心化是区块链的典型特征,随着区块链技术的不断发展,去中心化程度定量度量的现实意义也逐渐加深。现有区块链去中心化程度度量方法采用的评价指标或是考虑节点功能,或是考虑网络性能,评价角度不同,导致提出的模型和评价指标存在较大的偏差。为此,文中面向区块链交易流程,提取节点功能完整、网络传输、数据存储3方面影响区块链去中心化程度的关键因素,建立面向多重属性的去中心化程度度量模型(Multi-attribute Decentralized Degree Measurement Model,MDDMM),并进行原型实现。实验结果表明,数据存储、节点功能完整、网络传输对去中心化特征的影响程度依次降低,比特币的去中心化程度分别比比特现金、以太坊及以太经典高约3.5%,30%,38%。且所提模型与现有度量方法相比度量指标更加全面,为量化度量区块链平台的去中心化程度提供了理论依据和数据支撑。
基于扰动时空混沌的三维OFDM星座加密方案
赵耿, 吴锐, 马英杰, 黄思婕, 董有恒
计算机科学. 2024, 51 (5): 390-399.  doi:10.11896/jsjkx.230200169
摘要 ( 69 )   PDF(5762KB) ( 81 )   
参考文献 | 相关文章 | 多维度评价
无线通信网络的迅猛发展使得传输信息量迅速增加,这对系统的传输效率和通信安全提出了更高的要求。为满足上述要求,提出了一种基于扰动时空混沌的三维OFDM星座加密方案。首先,设计了一种反馈元胞自动机,以提高元胞自动机的周期性和伪随机性。将反馈元细胞自动机的迭代结果进行归一化后,作为扰动加入时空混沌系统中。通过分岔图、李亚普诺夫指数、回归映射分析和随机性测试,证明了添加该扰动的系统具有良好的混沌特性。其次,设计了一种新的三维16-ary星座图,将星座点之间的最小欧氏距离扩大了6.3%,并结合扰动的时空混沌系统实现了三维星座旋转的物理层调制加密。实验仿真结果表明,与其他三维16-ary星座映射旋转加密算法相比,该算法的误码率性能提高了约1 dB。此外,通过密钥空间、密钥灵敏度和统计攻击的安全分析,证明了其良好的安全性能。
正确性可验证的密文图数据最短路径外包计算方案
丁红发, 于莹莹, 蒋合领
计算机科学. 2024, 51 (5): 400-413.  doi:10.11896/jsjkx.230200031
摘要 ( 61 )   PDF(3230KB) ( 77 )   
参考文献 | 相关文章 | 多维度评价
地理位置、社交网络等海量图数据应用广泛且包含大量隐私,通常需要安全的外包计算来提供多样化的查询服务。然而,如何设计正确性可验证的图数据外包计算协议仍是公开的难题。为此,提出了加密图数据上正确性可验证的精确最短路径外包计算方案。该方案利用加法同态加密构造密态图数据上的广度优先最短路径计算算法,支持加密图数据的精确最短距离查询外包计算;其次,基于双线性映射累加器构造最短路径外包计算结果的概率正确性验证机制。分析和证明表明,该方案能以概率可靠性实现正确性可验证的精确最短路径的外包计算,具备随机预言模型下的IND-CCA2安全。对比实验结果表明,所提方案相比其他相关方案在安全性、功能性方面有显著优势,性能上较已有可验证图数据外包计算方案在初始化及加密环节、查询环节、验证及解密环节的时间开销分别降低了0.15%~23.19%,12.91%~30.89%和1.13%~18.62%。
基于RIS多径随机叠加的物理层密钥生成方案
张仲鑫, 易鸣, 肖帅芳
计算机科学. 2024, 51 (5): 414-420.  doi:10.11896/jsjkx.221000037
摘要 ( 79 )   PDF(2496KB) ( 85 )   
参考文献 | 相关文章 | 多维度评价
在静态场景下,多径相位和幅度变化缓慢,基于无线信道特征的物理层密钥速率低,难以满足高速数据业务下的通信安全需求。为此,提出了一种基于RIS多径随机叠加的物理层密钥生成方案。首先,收发双方利用RIS天线的实时可控和方向图的捷变特性,通过空间多径的功率谱特性分离多径;然后,在信道相干时间内多次改变空间多径的功率分配,构造等效快变信道,提高密钥源的随机性;最后,通过量化、协商、隐私放大等操作生成一致的安全密钥。仿真结果表明,与现有基于RIS天线的物理层密钥生成方案相比,所提方案一方面通过发掘信道的多径特征提高了信源熵;另一方面通过多径上的功率分配提高了信源的随机性,为密钥速率带来了一定的增益。