计算机科学

第49卷第7期目录

计算机科学. 2022, 49 (7): 0-0.

摘要 ( 243 )

PDF(5082KB) ( 661 )

相关文章 | 多维度评价

企业内部工业互联网现状与发展对策研究

王兴伟, 信俊昌, 邵安林, 毕远国, 易秀双

计算机科学. 2022, 49 (7): 1-9. doi:10.11896/jsjkx.210900029

摘要 ( 701 )

PDF(2855KB) ( 791 )

参考文献 | 相关文章 | 多维度评价

工业互联网通过互联网平台将设备、生产线、工厂、供应商、产品和客户紧密地连接、融合,推动了整个制造服务体系的智能化发展。我国对于工业互联网的发展高度重视,在工业互联网技术领域,国家提出了最新的发展目标。企业内部工业互联网是工业互联网中的重要组成部分,它将工业设备、信息系统、业务流程、企业产品与服务、人员之间互联,实现了从车间层到决策层的高效连接。首先,从企业内部工业互联网标准、企业内部工业互联网设备和企业内部工业互联网应用几个角度,介绍了企业内部工业互联网的发展现状;其次,从体系架构、网络标识、操作系统、实时性、可靠性、兼容性和安全性7个方面对企业内部工业互联网发展中存在的问题进行了深入的分析;接着,提出了企业内部工业互联网发展的建议,探讨了企业内部工业互联网协同创新机制和政策;最后,对企业内部工业互联网的未来发展进行了总结。

基于神经架构搜索的点击率预测模型

帅剑波, 王金策, 黄飞虎, 彭舰

计算机科学. 2022, 49 (7): 10-17. doi:10.11896/jsjkx.210600009

摘要 ( 672 )

PDF(3010KB) ( 826 )

参考文献 | 相关文章 | 多维度评价

点击率(Click-Through Rate,CTR)预测是推荐系统中一项重要的任务,其目标是预测用户点击一个广告或者商品的概率。特征嵌入和特征组合是影响预测性能的关键,因此很多点击率预测模型的思路也是针对这两个方面进行优化。但目前大部分工作仅关注其中一个方面,并且几乎所有的模型在进行特征组合时都没有对特征进行区分,同一个特征与其他特征组合时都使用相同的嵌入和组合方法,阻碍了模型性能的提升。为解决该问题,提出了Auto-SEI(Automatic Super-field-aware Feature Embedding and Interacting)模型。该模型先将每个特征子域分配给一个特征超域,再根据分组得到特征的嵌入,然后为特征对选择合适的组合方法获取组合特征,最后进行预测。Auto-SEI模型中,特征子域的划分和组合方法的选择被参数化为架构搜索问题,利用神经架构搜索(Neural Architecture Search,NAS)算法压缩搜索空间并进行选择。在3个真实的大规模数据集上进行了大量实验,结果表明Auto-SEI 模型在点击率预测任务上具有优秀的性能。

基于概率元学习的矩阵补全预测融合算法

齐秀秀, 王佳昊, 李文雄, 周帆

计算机科学. 2022, 49 (7): 18-24. doi:10.11896/jsjkx.210600126

摘要 ( 556 )

PDF(2156KB) ( 760 )

参考文献 | 相关文章 | 多维度评价

随着互联网社交媒体规模的飞速发展,利用推荐算法对海量信息进行有效建模筛选和过滤,成为了研究用户行为偏好、热点倾向和网络安全态势等问题的关键。随着深度学习的发展,图神经网络模型在解决推荐系统应用中的密集型图结构数据时取得了较好效果。协同过滤算法作为得到最广泛应用的推荐算法,其利用用户-项目的群体交互数据来预测用户未来的偏好与项目评级。但现有的推荐算法仍面临着数据稀疏和冷启动问题,且缺少对不确定性的良好量化。文中提出了一种基于概率元学习的归纳矩阵补全预测融合算法(MetaIMC),该算法从贝叶斯推断的角度重新对元学习进行表征,构建了稳健的图深度神经网络元学习模型,充分利用数据先验知识提出从稀疏数据中学习新任务的解决方案。首先,MetaIMC可以有效地利用变分贝叶斯推理获得先验分布,缓解元模型任务训练中的不确定性和模糊性问题,进一步提升了模型的泛化能力;其次,在不借助任何用户边信息的情况下,实现新用户推荐的冷启动;最后,在传统矩阵补全及用户冷启动两个场景下,利用Flixster,Douban和Yahoo_music 3个公开数据集对模型的性能进行了评估,验证了MetaIMC在面对传统矩阵补全任务时的有效性,并在冷启动问题上达到了最优的效果。

基于聚类分区的多维数据流概念漂移检测方法

陈圆圆, 王志海

计算机科学. 2022, 49 (7): 25-30. doi:10.11896/jsjkx.210600155

摘要 ( 547 )

PDF(2469KB) ( 733 )

参考文献 | 相关文章 | 多维度评价

对数据流中的潜在信息进行分析和利用是数据流挖掘工作的重要内容。然而,数据的分布会随着时间的推移发生变化,从而使学习假设发生更改,这就是概念漂移现象,它给数据流挖掘带来了巨大的挑战。检测数据分布的变化是一种直接且有效的概念漂移检测方法,目前,已有研究方法基于树型结构或网格结构建立直方图,实现对数据分布的描述,但是,此类方法在进行分布检测时容易产生检验盲点,其可解释性较差,并且在多维数据上的内存消耗较大。文中提出了一种基于等密度分区的概念漂移检测方法PUDC(Partition Based on Uniform Density Clusters),该方法基于改进的k-Means算法,对数据进行等密度分区,利用卡方检验对每个分区进行统计和计算,从而检测数据分布变化,以达到概念漂移检测的目的。为了验证方法的有效性,选取了4个人工数据集和3个真实数据集进行实验,对比分析了不同维度的数据下的I类错误率和II类错误率,实验结果表明,PUDC算法在多维数据流的概念漂移检测中相比几种较新的算法具有一定的优势。

基于Bi-LSTM的期货市场关联交易行为检测方法

张源, 康乐, 宫朝辉, 张志鸿

计算机科学. 2022, 49 (7): 31-39. doi:10.11896/jsjkx.210400304

摘要 ( 485 )

PDF(3425KB) ( 724 )

参考文献 | 相关文章 | 多维度评价

随着期货市场的不断发展,其交易量屡创新高,但在海量交易的背后,一些交易者利用关联交易行为对市场进行操纵,扰乱了交易秩序,给市场监管和风险控制带来了严峻考验。因此,如何从海量交易中挖掘潜在关联交易行为成为维护期货市场公平交易的重要任务。针对该问题,提出了一种多特征信息融合的双向长短期记忆(Bi-LSTM)网络模型,从原始数据中提取交易时间、交易量、持仓变化、期货品种等多种维度的浅层特征信息,通过Bi-LSTM网络模型从时间序列上向前、向后两个方向的上下文关系学习深层特征,实现关联交易行为检测。针对浅层特征提取提出了一种基于交易行为的多粒度窗口特征提取方法,从日、小时、分钟、秒等级别捕捉账户间交易的关联性,从而解决了原始交易数据维度高、数据量大、关联性弱的问题。模型引入了Dropout策略,缓解了收敛速度慢和过拟合的问题。在郑州商品交易所真实数据上的实验结果表明,与一些传统的分类模型以及RNN和LSTM网络相比,所提方法在分类的准确率和召回率上有明显提升,同时,对特征中各个维度信息的消解实验证明了多特征融合方法和多粒度窗口策略的有效性。另外,抽取了两种期货品种的交易数据进行测试,结果表明所提模型具有良好的泛化能力。

嵌入典型时间序列特征的随机Shapelet森林算法

高振卓, 王志海, 刘海洋

计算机科学. 2022, 49 (7): 40-49. doi:10.11896/jsjkx.210700226

摘要 ( 494 )

PDF(2876KB) ( 2709 )

参考文献 | 相关文章 | 多维度评价

近年来,时间序列分类问题的研究受到了广泛关注。先进的时间序列分类方法通常建立在良好的特征表示的基础之上。Shapelet是时间序列中具备鉴别性的子序列,可有效表达时间序列的局部形状特征。然而,高昂的计算成本大大限制了基于Shapelet的时间序列分类方法的实用性。除此之外,传统的Shapelet仅能描述欧氏距离度量下子序列的形状特征,因此极易受到噪声干扰并难以挖掘子序列中蕴含的其他类型的鉴别性信息。为应对上述问题,提出了一种新的时间序列分类算法——嵌入典型时间序列特征的随机Shapelet森林。该算法基于以下3个关键策略:1)随机选取Shapelet并限制Shapelet的作用范围以提高效率;2)在Shapelet中嵌入多个典型时间序列特征以提高算法对不同分类问题的适应性,并弥补随机选取Shapelet带来的精度损失;3)在新的特征表示的基础上构建随机森林分类器以确保算法的泛化能力。112个UCR时间序列数据集上的实验结果表明,本文算法的准确性超越了基于Shapelet精确搜索和Shapelet转换技术的STC算法,以及多个其他类型的先进时间序列分类算法。此外,广泛的实验对比验证了本文算法在效率上的显著优势。

基于评分区域子空间的协同过滤推荐算法

孙晓寒, 张莉

计算机科学. 2022, 49 (7): 50-56. doi:10.11896/jsjkx.210600062

摘要 ( 341 )

PDF(2625KB) ( 545 )

参考文献 | 相关文章 | 多维度评价

协同过滤推荐算法因其合理的可解释性以及简单的实现过程而被广泛应用。然而,在推荐系统中数据集通常具有规模大、稀疏度和维度高等特点,这些特点给协同过滤推荐算法带来了很大的挑战。为了缓解上述问题,提出了一种基于评分区域子空间的协同过滤推荐算法。基于用户-项目评分矩阵,该算法首先将评分范围划分为3个区域,即高评分区域、中评分区域以及低评分区域,根据这3个区域分别为每个用户寻找其项目子空间,即高评分子空间、中评分子空间以及低评分子空间。其次,定义了一种新的相似度计算方式,在各区域子空间中分别计算用户之间的评分支持度,只有当用户在各个子空间上的评分支持度都很高时,用户之间才是相似的。这种方式避免了惰性评分用户的评分干扰。实验结果表明,该算法能够在一定程度上解决数据稀疏性问题,特别是针对高维数据能降低其计算复杂度,并提高其推荐性能。

基于数据增广和模型集成策略的图神经网络在抑郁症识别上的应用

杨炳新, 郭艳蓉, 郝世杰, 洪日昌

计算机科学. 2022, 49 (7): 57-63. doi:10.11896/jsjkx.210800070

摘要 ( 553 )

PDF(2620KB) ( 792 )

参考文献 | 相关文章 | 多维度评价

目前对抑郁症的主流诊断方式是通过医生和患者之间的沟通交流来填写相关的问卷量表,这需要相应的临床知识并且诊断结果存在主观性,给抑郁症诊断带来了很多挑战。利用信息处理技术对生理信号进行分析,构建精准客观的辅助诊断模型具有重要价值,然而目前抑郁症辅助诊断的公共数据集普遍存在样本偏少的情况,使得辅助诊断的精度普遍偏低。基于此,文中提出了一种基于数据增广和模型集成策略的图神经网络的抑郁症识别方法,该方法利用53位受试者的128通道脑电信号(Electroencephalogram,EEG),对采集到的脑电信号进行数据切分并将其用于数据增广后,利用皮尔逊相关系数计算不同通道之间的相关度,从而构造脑网络,并利用图神经网络学习脑网络的特征,然后将得到的预测结果利用模型集成策略进行多数投票,得到受试者最终的预测结果。经过实验证明,所提方法提高了网络的分类能力,解决了因样本小而带来的分类能力差的问题,在兰州大学普适感知与智能系统实验室提供的MODMA数据集(包含24名抑郁症患者和29名正常对照组)上取得了77%的分类准确率,与其他方法相比,所提方法的分类准确率有明显的提升。

基于聚类和WOA的并行支持向量机算法

刘卫明, 安冉, 毛伊敏

计算机科学. 2022, 49 (7): 64-72. doi:10.11896/jsjkx.210500040

摘要 ( 428 )

PDF(2356KB) ( 488 )

参考文献 | 相关文章 | 多维度评价

针对并行SVM在大数据环境下对冗余数据敏感、参数寻优能力差以及并行过程中出现的负载不均衡等问题,提出了一种基于聚类算法和鲸鱼优化算法的并行支持向量机算法MR-KWSVM。首先,该算法提出KF策略来删减冗余数据,利用删减冗余数据后的数据集训练SVM,降低SVM对冗余数据的敏感性;其次,提出了基于非线性收敛因子和自适应惯性权重的鲸鱼智能优化算法IW-BNAW,利用“IW-BNAW”算法获取SVM的最优参数,提高支持向量机的参数寻优能力;最后,在利用MapReduce构造并行SVM的过程中,提出时间反馈策略用于reduce节点的负载调度,提高了集群的并行效率,实现了高并行的SVM。实验结果表明,所提算法不仅保证了SVM在大数据环境下的高并行计算能力,SVM的分类准确度也有明显提高,并且具有更好的泛化性能。

一种用于癌症分类的两阶段深度特征选择提取算法

胡艳羽, 赵龙, 董祥军

计算机科学. 2022, 49 (7): 73-78. doi:10.11896/jsjkx.210500092

摘要 ( 376 )

PDF(2322KB) ( 511 )

参考文献 | 相关文章 | 多维度评价

癌症是世界上最致命的疾病之一。利用机器学习处理基因微阵列数据集(Microarray Data)对于协助癌症的早期诊断具有重要作用,但微阵列数据集中基因特征的数目远大于样本数目,造成样本不平衡,影响了分类的效率和精度,因此对基因阵列数据进行特征选择就显得尤为重要。现有的特征选择算法多为单一条件的特征选择,很少考虑特征提取,且大多采用存在已久的神经网络,分类精度较低。因此,文中提出了一种两阶段深度特征选择(Two-Stage Deep Feature Selection,TSDFS)算法。第一阶段集成3种特征选择算法进行全面的特征选择,得到特征子集;第二阶段使用非监督神经网络获得特征子集的最佳表示,进而提高最终的分类精度。通过特征选择前后的分类效果和不同特征选择算法之间的对比来分析TSDFS的有效性,实验结果表明,TSDFS在减少特征数目的同时保持或者提高了分类的精度。

视频理解中的动作质量评估方法综述

张洪博, 董力嘉, 潘玉彪, 萧宗志, 张惠臻, 杜吉祥

计算机科学. 2022, 49 (7): 79-88. doi:10.11896/jsjkx.210600028

摘要 ( 1255 )

PDF(2123KB) ( 1936 )

参考文献 | 相关文章 | 多维度评价

视频中动作质量的评估指对视频中人物对象的动作质量进行评价,如计算动作质量分数、等级或者不同人物表现的优劣,是视频理解和计算机视觉研究中的一个重要方向。从动作质量分数预测、等级分类以及水平排序3个方面对视频中的动作质量评估方法进行总结,然后对这些方法在目前常用数据集上的表现进行分析,最后讨论未来研究中亟待解决的问题。

面向设备状态监测的可视化技术综述

杨啸, 王翔坤, 胡浩, 朱敏

计算机科学. 2022, 49 (7): 89-99. doi:10.11896/jsjkx.210900167

摘要 ( 448 )

PDF(6017KB) ( 915 )

参考文献 | 相关文章 | 多维度评价

随着传感器和数字化技术的发展,越来越多的设备和生产环境装配了传感器和相应的信息系统,这些传感器收集并传输了大量有价值的数据。面向设备状态监测的可视化技术,一方面可以整合操作人员的专业经验,客观评估设备的运行状态;另一方面能直观地解释数据模型的结果,以便对数据进行人机协同的智能分析。文中综述了数据可视化在设备状态监测中的相关研究,首先根据数据特征将设备状态监测数据分为网络数据、时空数据、多维数据和统计数据;然后在总结该场景的通用可视化流程的基础上,归纳出4类分析任务,即状态监测、相关性分析、异常原因推理、状态预测,针对每一类分析任务,归纳其中所用的可视化技术;最后,对设备状态监测可视化面临的挑战以及未来发展趋势进行总结和展望。

全局信息引导的真实图像风格迁移

张颖涛, 张杰, 张睿, 张文强

计算机科学. 2022, 49 (7): 100-105. doi:10.11896/jsjkx.210600036

摘要 ( 449 )

PDF(3779KB) ( 611 )

参考文献 | 相关文章 | 多维度评价

不同于艺术风格迁移,真实图像风格迁移的挑战在于,迁移结果在迁移风格图片的色调风格的同时在内容上应保持真实性。目前,真实图像风格迁移的方法往往是在艺术风格迁移方法的基础上进行预处理或后处理,以保持生成图片的真实性。但艺术风格迁移方法通常无法充分利用全局色彩信息实现更为协调的整体观感,且预处理和后处理操作往往繁琐而费时。针对以上问题,建立了全局信息引导的真实图像风格迁移网络,提出了色域均值损失(Lcpm)来衡量生成图片与风格图片全局色彩分布的相似性,对自适应实例归一化(AdaIN)进行改进,提出分区自适应实例归一化(AdaIN-P),以更好地适应真实图像的色彩风格迁移;此外,引入了一种跨通道分区注意力机制,以更好地利用全局上下文信息,提升生成图片的整体协调性。上述方法能够引导网络解码器充分利用全局信息。实验结果表明,相较于其他主流方法,所提网络模型能在保持图像细节的同时实现更好的真实图像风格迁移效果。

基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨

曾志贤, 曹建军, 翁年凤, 蒋国权, 徐滨

计算机科学. 2022, 49 (7): 106-112. doi:10.11896/jsjkx.210500224

摘要 ( 300 )

PDF(3452KB) ( 524 )

参考文献 | 相关文章 | 多维度评价

随着移动网络、自媒体平台的迅速发展,大量的视频和文本信息不断涌现,这给视频-文本数据跨模态实体分辨带来了迫切的现实需求。为提高视频-文本跨模态实体分辨的性能,提出了一种基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨模型(Fine-grained Semantic Association Video-Text Cross-Model Entity Resolution Model Based on Attention Mechanism,FSAAM)。对于视频中的每一帧,利用图像特征提取网络特征信息,并将其作为特征表示,然后通过全连接网络进行微调,将每一帧映射到共同空间;同时,利用词嵌入的方法对文本描述中的词进行向量化处理,通过双向递归神经网络将其映射到共同空间。在此基础上,提出了一种自适应细粒度视频-文本语义关联方法,该方法计算文本描述中的每个词与视频帧的相似度,利用注意力机制进行加权求和,得出视频帧与文本的语义相似度,并过滤与文本语义相似度较低的帧,提高了模型性能。FSAAM主要解决了文本描述的词与视频帧关联程度不同而导致视频-文本跨模态数据语义关联难以构建以及视频冗余帧的问题,在MSR-VTT和VATEX数据集上进行了实验,实验结果验证了所提方法的优越性。

基于DNGAN的磁共振图像超分辨率重建算法

戴朝霞, 李锦欣, 张向东, 徐旭, 梅林, 张亮

计算机科学. 2022, 49 (7): 113-119. doi:10.11896/jsjkx.210600105

摘要 ( 465 )

PDF(3328KB) ( 832 )

参考文献 | 相关文章 | 多维度评价

磁共振图像的质量会影响医生对患者身体情况的判断,高清晰度的磁共振图像更有利于医生做出准确的诊断。利用计算机技术对磁共振图像进行超分辨率重建,可以由低分辨率的磁共振图像得到高分辨率的磁共振图像。基于生成对抗网络强大的生成能力及其非监督学习特性,文中研究了基于生成对抗网络的磁共振图像超分辨率算法,设计了一个结合残差网络结构及DenseNet结构作为生成网络的网络模型DNGAN。该网络使用WGAN-GP理论作为对抗损失来稳定生成对抗网络的训练。除此之外,使用内容损失函数以及感知损失函数作为网络的损失函数。同时,为了更好地利用磁共振图像丰富的频域信息,将磁共振图像的频域信息作为频域损失函数添加到网络中。为了证明DNGAN模型的有效性,将其磁共振图像超分辨率实验结果与SRGAN以及双三次插值法的磁共振图像超分辨率重建结果进行对比,表明DNGAN模型能够有效地对磁共振图像进行超分辨率重建。

基于多路径特征提取的实时语义分割方法

程成, 降爱莲

计算机科学. 2022, 49 (7): 120-126. doi:10.11896/jsjkx.210500157

摘要 ( 697 )

PDF(4064KB) ( 694 )

参考文献 | 相关文章 | 多维度评价

深度学习在图像语义分割领域的应用极大地提升了分割精确度,但由于深度学习网络在速度、内存等方面的限制,其并不能直接应用于嵌入式设备进行实时分割。针对语义分割模型存在的的网络结构复杂和计算开销巨大的问题,提出了结合边缘检测算法的多路径特征提取的实时语义分割算法。模型通过Sobel算子、Scharr算子和Laplacian算子对图像的轮廓信息进行提取。算法设计了空间路径提取图像的空间位置信息、语义路径提取图像高级语义信息,以及通过边缘检测路径提取图像中具有代表性的纹理特征,并采用Ghost轻量化模块来减少模型参数量,提高算法的分割速度。在480像素×360像素的CamVid数据集上的实验结果表明,在3种边缘检测算子上,模型的分割准确率均能得到有效提升,尤其是在加入3×3大小的Sobel算子下算法的性能提升最为明显,在CamVid测试集图像处理速度为349 frames/s的基础上,分割精度达到了42.9%。所提算法在分割精度和分割速度上均取得了较好的效果,在实时性和准确性之间达到了很好的平衡。

基于卷积神经网络的虚拟现实视频帧内预测编码

刘月红, 牛少华, 神显豪

计算机科学. 2022, 49 (7): 127-131. doi:10.11896/jsjkx.211100179

摘要 ( 540 )

PDF(1928KB) ( 470 )

参考文献 | 相关文章 | 多维度评价

为了提高虚拟现实视频帧内预测编码的性能,采用卷积神经网络算法进行视频帧编码单元(Coding Unit,CU)选择,从而降低视频图像编码复杂度。首先设置量化参数,获取虚拟现实视频帧样本,接着构建图像编码树,然后建立卷积神经网络(Convolutional Neural Network,CNN)帧编码单元优化模型,将帧样本的图像亮度作为CNN的输入,结合图像率失真成本阈值,通过训练获得帧编码单元的优化结果。采用CNN训练优化,能够根据图像不同纹理度模块的帧内编码需求,获得不同深度的编码树(Coding Tree Unit,CTU)结构及合适数量的CU模块。实验结果表明,通过合理设置卷积核尺寸和量化参数,相比常用视频帧内预测编码算法,CNN算法能够获得更优的图像质量,在Balboa序列中的BD码率和编码时间分别为56 483.76 kbps和3 209.24 s。

Head Fusion:一种提高语音情绪识别的准确性和鲁棒性的方法

徐鸣珂, 张帆

计算机科学. 2022, 49 (7): 132-141. doi:10.11896/jsjkx.210100085

摘要 ( 895 )

PDF(4630KB) ( 845 )

参考文献 | 相关文章 | 多维度评价

语音情绪识别指使用机器从说话人的语音中识别说话人的情绪。语音情绪识别是人机交互的重要环节,但是目前的研究中仍然存在很多问题,例如,缺乏高质量的数据、模型准确性不足、在嘈杂的环境下进行的研究很少等。文中提出了一种基于多头注意力机制的Head Fusion方法,提高了语音情绪识别在相应数据集上的准确性。文中还实现了一个基于注意力的卷积神经网络模型,并在IEMOCAP数据集上进行了实验。语音情绪识别在该数据集上的准确度提高到76.18％(Weighted Accuracy,WA)和76.36％(Unweighted Accuracy,UA)。根据调研,该结果与该数据集上的最新结果(76.4％的WA和70.1％的UA)相比,在保持WA的同时提高了约6％的UA。此外,还使用了混入50种常见噪声的语音数据进行了实验,通过改变噪声强度、对噪声进行时域平移、混合不同的噪声类型,以识别它们对语音情绪识别(Speech Emotion Recognition)准确度的不同影响并验证模型的鲁棒性。文中还将帮助研究人员和工程师通过使用带有适当类型噪声的语音数据来增加其训练数据,从而缓解语音情绪识别研究中高质量数据不足的问题。

基于向量注意力机制GoogLeNet-GMP的行人重识别方法

孟月波, 穆思蓉, 刘光辉, 徐胜军, 韩九强

计算机科学. 2022, 49 (7): 142-147. doi:10.11896/jsjkx.210600198

摘要 ( 271 )

PDF(3000KB) ( 453 )

参考文献 | 相关文章 | 多维度评价

为了提高行人重识别(Re-ID)的准确率和适用性,提出了一种基于向量注意力机制GoogLeNet的Re-ID方法。首先,将3组图像(锚、正、负)输入到GoogLeNet-GMP网络中,获得分段式特征向量。然后,利用空间金字塔池化(Spatial Pyramid Pooling,SPP)对来自不同金字塔等级的特征进行聚合,并引入注意力机制,通过对代表目标视觉信息的多尺度池化区域进行整合,获得多个语义等级上的可区分性特征。同时,将两个不同损失函数的混合形式作为最终损失函数。在Market-15012和Duke-MTMC3数据集上进行实验,结果表明,相比其他优秀方法,所提方法在Rank-1和mAP指标方面表现更优。

中文预训练模型研究进展

侯钰涛, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木

计算机科学. 2022, 49 (7): 148-163. doi:10.11896/jsjkx.211200018

摘要 ( 2222 )

PDF(5427KB) ( 1903 )

参考文献 | 相关文章 | 多维度评价

近年来,预训练模型在自然语言处理领域蓬勃发展,旨在对自然语言隐含的知识进行建模和表示,但主流预训练模型大多针对英文领域。中文领域起步相对较晚,鉴于其在自然语言处理过程中的重要性,学术界和工业界都开展了广泛的研究,提出了众多的中文预训练模型。文中对中文预训练模型的相关研究成果进行了较为全面的回顾,首先介绍预训练模型的基本概况及其发展历史,对中文预训练模型主要使用的两种经典模型Transformer和BERT进行了梳理,然后根据不同模型所属类别提出了中文预训练模型的分类方法,并总结了中文领域的不同评测基准,最后对中文预训练模型未来的发展趋势进行了展望。旨在帮助科研工作者更全面地了解中文预训练模型的发展历程,继而为新模型的提出提供思路。

基于主动采样的深度鲁棒神经网络学习

周慧, 施皓晨, 屠要峰, 黄圣君

计算机科学. 2022, 49 (7): 164-169. doi:10.11896/jsjkx.210600044

摘要 ( 545 )

PDF(2677KB) ( 571 )

参考文献 | 相关文章 | 多维度评价

随着深度模型在许多实际任务中的广泛应用,提高模型的鲁棒性已经成为了机器学习的重要研究方向。最新的研究表明,通过对训练样本添加噪声扰动进行训练能有效地提升深度模型的鲁棒性。然而,该训练过程往往需要大量已标注样本。在许多实际应用中,准确地标注每一个样本的标记信息往往代价高昂且异常困难。主动学习是降低样本标注代价的主要方法,通过主动选择最有价值的样本进行标注,在提高模型性能的同时,能最大限度地降低查询标记的代价。提出一种基于主动采样的鲁棒神经网络学习框架,该框架能以较低的标注代价显著地提升深度模型的鲁棒性。在该框架中,基于不一致性的主动采样方法通过生成系列扰动样本并采用其预测差异来衡量每个未标注样本对提升模型鲁棒性的潜在效用,同时挑选不一致性值最大的样本用于深度模型的加噪训练。在基准图像分类任务数据集上进行的实验表明,基于不一致性的主动采样策略能以更低的样本标注代价有效地提升深度神经网络模型的鲁棒性。

一种面向电商网络的异常用户检测方法

杜航原, 李铎, 王文剑

计算机科学. 2022, 49 (7): 170-178. doi:10.11896/jsjkx.210600092

摘要 ( 355 )

PDF(3158KB) ( 734 )

参考文献 | 相关文章 | 多维度评价

在电商网络中,异常用户往往表现出与正常用户截然不同的行为特征,检测异常用户并分析其行为模式对维护电商平台秩序具有十分重要的现实意义。通过分析异常用户的行为模式,将电商网络抽象为异质信息网络并转化为用户-设备二分图,然后在此基础上提出了一种面向电商网络的异常用户检测方法——自监督异常检测模型(Self-Supervised Anomaly Detection Model,S-SADM)。该方法具有自监督学习机制,采用自编码器编码获取用户节点表示,通过优化联合目标函数来完成反向传播,同时采用支持向量数据描述对用户节点表示进行异常检测。经过网络的自动迭代优化,不仅使用户节点表示具有监督信息,还获得了较稳定的检测结果。最后,在真实网络数据集和半合成网络数据集中对S-SADM进行实验,结果表明了该方法的有效性和优越性。

融合RACNN和BiLSTM的金融领域事件隐式因果关系抽取

金方焱, 王秀利

计算机科学. 2022, 49 (7): 179-186. doi:10.11896/jsjkx.210500190

摘要 ( 842 )

PDF(2488KB) ( 945 )

参考文献 | 相关文章 | 多维度评价

金融领域的文本信息量大、价值高,尤其是其中的隐式因果关系事件包含着巨大的潜在利用价值。对金融领域文本进行隐式因果关系分析,挖掘隐式因果关系事件中隐含的重要信息,了解金融领域事件更深层的演化逻辑,进而构建金融领域知识库,对金融风险控制、风险预警等具有重要意义。为了提高金融领域中隐式因果关系事件识别的准确度,从特征挖掘的角度入手,提出了一种基于自注意力机制的融合循环注意力卷积神经网络(Recurrent Attention Convolution Neural Network,RACNN)和双向长短时记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的隐式因果关系抽取方法。该方法结合了基于迭代反馈机制能提取更重要文本局部特征的RACNN、能更好地提取文本全局特征的BiLSTM以及能更深入地挖掘融合特征语义信息的自注意力机制,在SemEval-2010 Task 8数据集和金融领域数据集上进行了实验,结果表明,评估指标F1值分别达到了72.98%和75.74%,均显著优于其他对比模型。

面向铣削机器人的低成本精确标定及刀路拟合方法

何晓, 周佳立, 吴超

计算机科学. 2022, 49 (7): 187-195. doi:10.11896/jsjkx.210500135

摘要 ( 311 )

PDF(4377KB) ( 493 )

参考文献 | 相关文章 | 多维度评价

针对铣削机器人路径轨迹绝对拟合精度低及空间路径拟合会产生刀路误差的问题,提出了一种无须精密仪器即可获得有效标定的方法。研究重点在于提高铣削加工精度。首先,通过重新计算和修正机器人路径轨迹控制点的方式,解决了路径拟合带来的切削误差问题,为接下来的切削测量精度提供了进一步的保障;然后,针对铣削主轴使工具末端位置产生的偏移,在机器人标定模型中加入了自重及外加负载模型,并且特别引入了包含角度数据的约束方程和目标函数,增加了标定数据的全面性并提高了标定效率;最后,利用此方法对KUKA60机器人进行参数标定实验,实验显示,经过标定后的铣削机器人的加工精度得到了显著的提高,铣削方块边长和夹角精度分别从0.520 mm和30分降为0.240 mm和16分,提高了53.8％和46.7％。

基于改进势场法的机器人路径规划

王兵, 吴洪亮, 牛新征

计算机科学. 2022, 49 (7): 196-203. doi:10.11896/jsjkx.210500020

摘要 ( 282 )

PDF(3160KB) ( 494 )

参考文献 | 相关文章 | 多维度评价

针对传统人工势场法存在引力过大、容易陷入局部极小值、目标不可达以及容易陷入陷阱区域等问题,提出了基于路径优化策略和参数优化的改进势场法。通过引力补偿增益系数来避免引力过大的问题;根据环境信息采取不同的虚拟目标点设置策略以逃离局部极小值点;设置观察距离以识别障碍物的分布情况,选择不同的路径优化策略来避免目标不可达问题,机器人通过提前旋转角度来切向远离陷阱区域或采用安全路径通过该区域;采用改进差分进化算法求解有约束最优化问题,使得人工势场法的初始化参数不再根据经验来设置。仿真实验结果表明,改进势场法可以有效解决机器人陷入局部极小值、目标不可达等问题,并可优化机器人的行驶路径,提高机器人移动的安全性。相比传统人工势场法,改进势场法的路径长度减少了17.5%。

基于自适应注意力机制的知识图谱补全算法

王杰, 李晓楠, 李冠宇

计算机科学. 2022, 49 (7): 204-211. doi:10.11896/jsjkx.210400129

摘要 ( 541 )

PDF(3278KB) ( 889 )

参考文献 | 相关文章 | 多维度评价

现有的知识图谱补全模型通常将多源信息整合为实体和关系学习单一的静态特征表示,但无法表征不同上下文中出现的实体和关系的细差含义和动态属性,即实体和关系在涉及不同的三元组时可能有着不同的角色和含义,并因此表现出不同的属性。为此,提出了一种自适应注意力网络用于知识图谱补全,引入自适应注意力建模每个特征维度对特定任务的贡献程度,为目标实体和关系生成动态可变的嵌入表示。具体而言,所提模型通过定义邻居编码器和路径聚合器来处理实体邻域子图中的两种结构,自适应地调整邻居实体和关系路径的注意力得分,以捕获逻辑上与任务最相关的属性特征,为实体和关系赋予符合当前任务的细粒度语义。在链接预测任务中的实验结果表明,所提模型在FB15K-237数据集中的MeanRank指标比PathCon降低了6.9%,Hits@1比PathCon提高了2.3%;在稀疏数据集NELL-995和DDB14上,其Hits@1分别达到了87.9%和98%,证明了引入自适应注意力机制能够有效提取实体和关系的动态属性,为二者生成更全面的表示形式,从而提高知识图谱补全精度。

融合双向门控循环单元和注意力机制的软件自承认技术债识别方法

熊罗庚, 郑尚, 邹海涛, 于化龙, 高尚

计算机科学. 2022, 49 (7): 212-219. doi:10.11896/jsjkx.210500075

摘要 ( 340 )

PDF(3237KB) ( 505 )

参考文献 | 相关文章 | 多维度评价

软件自承认技术债(Self-admitted Technical Debt,SATD)由程序开发人员写入项目的源代码注释中,是开发人员为追求短期效益而刻意留下软件缺陷的说明,大量的SATD将不利于软件维护。近年来,越来越多的学者致力于软件SATD识别的研究,并提出了不同的识别方法,如基于自然语言处理或文本挖掘等检测方法。然而,大多数研究结果依赖于现有的词库或手工提取的特征,不仅耗费了大量的时间,而且增加了计算复杂度,识别结果并不理想。基于此,提出了一种基于双向门控循环单元(Gate Recurrent Unit,GRU)和注意力机制的软件自承认技术债识别方法,通过Word2vec中的Skip-gram模型获取词向量,构建双向GRU网络获取高级特征,并利用注意力机制自动发现对SATD分类起到关键作用的词,从而捕获最重要的语义信息。实验结果表明,本文方法在精确率、召回率和F1-score上均有较优表现,能够有效地识别软件SATD,避免了传统任务中复杂的特征工程。

考虑中断风险与模糊定价的闭环供应链网络设计模型

吴功兴, 孙兆洋, 琚春华

计算机科学. 2022, 49 (7): 220-225. doi:10.11896/jsjkx.201100084

摘要 ( 374 )

PDF(2123KB) ( 439 )

参考文献 | 相关文章 | 多维度评价

为缓解供应中断对企业的打击,文中提出了在竞争环境下考虑模糊定价和中断风险的双目标闭环供应链网络模型。定义不确定需求为供应链及其竞争对手向客户提供的价格函数,使供应链在竞争环境中实现总利润最大化与碳排放量最小化。文中基于可能性理论求解所提模型,将双目标模型转换为单目标模型,最后使用真实案例进行数值算例分析。结果表明,所提模型不仅可以增强供应链抵御风险的能力,还有助于提高其在市场中的战略地位。

小样本雷达辐射源识别的深度学习方法综述

苏丹宁, 曹桂涛, 王燕楠, 王宏, 任赫

计算机科学. 2022, 49 (7): 226-235. doi:10.11896/jsjkx.210600138

摘要 ( 772 )

PDF(2762KB) ( 1055 )

参考文献 | 相关文章 | 多维度评价

面对复杂多变的电磁环境与新体制雷达系统,传统的雷达辐射源识别方法已无法满足需求。深度学习模型可有效提取雷达信号的脉内特征,快速准确地对低信噪比、未经分选的雷达辐射源信号进行脉内调制类型识别、型号识别与个体识别。但真实环境中雷达辐射源信号难以收集,无法满足传统的深度学习训练需要,因此小样本雷达辐射源识别是目前研究的热点与难点。文中首先对近年来将基于监督学习的多种经典深度学习方法应用于小样本雷达辐射源识别的研究进行了回顾;其次,介绍了小样本学习在雷达辐射源识别领域的研究进展;最后,基于小样本雷达辐射源识别的研究现状,总结面临的挑战,提出了对未来研究方向的展望。

语义通信系统的性能度量指标分析

姜胜腾, 张亦弛, 罗鹏, 刘月玲, 曹阔, 赵海涛, 魏急波

计算机科学. 2022, 49 (7): 236-241. doi:10.11896/jsjkx.211200071

摘要 ( 754 )

PDF(1794KB) ( 829 )

参考文献 | 相关文章 | 多维度评价

语义通信系统是目前通信领域的研究热点,但是该领域尚未建立起成熟的评价体系,导致不同性能度量指标下设计的语义通信系统的性能也各不相同。文中主要针对语义通信系统,介绍了基于精确率的性能度量指标、基于召回率的性能度量指标、基于精确率与召回率相结合的性能度量指标以及基于词向量空间模型的性能度量指标;并详细阐述了语义通信中各种性能度量指标提出的背景、意义、主要算法思想和适用范围,对比分析了每一种性能度量指标间的差异和优缺点。最后,总结了现阶段语义通信性能度量指标面临的问题,并展望了语义通信系统中性能度量指标研究的未来发展方向。

基于注意力神经网络的对地观测卫星星上自主任务规划方法

彭双, 伍江江, 陈浩, 杜春, 李军

计算机科学. 2022, 49 (7): 242-247. doi:10.11896/jsjkx.210500093

摘要 ( 673 )

PDF(2170KB) ( 734 )

参考文献 | 相关文章 | 多维度评价

星上自主任务规划是对地观测卫星自主运行的关键技术之一,近年来得到了研究人员的高度关注。考虑到星上计算资源有限,以及星上任务、资源动态变化等特点与挑战,现有研究主要采用启发式搜索算法对卫星星上自主任务规划问题进行求解,但这类算法还有待进一步优化。文中首先构建了一种新的观测任务序贯决策框架。基于该框架,对地观测卫星可以实时决策要执行的观测任务,而无须预先生成任何观测方案。然后,将注意力机制和循环神经网络相结合,设计了观测任务决策模型、任务特征表示方法以及模型训练方法,提出了一种基于注意力神经网络的观测任务序贯算法;最后,基于多组随机数据对所提算法、两种深度学习算法以及两种启发式在线搜索算法进行了比较。实验结果表明,所提方法的平均响应时间不到已有深度学习算法的1/5,收益误差远低于启发式搜索算法,证实了所提方法的可行性和有效性。

基于深度强化学习的边云协同资源分配算法

于滨, 李学华, 潘春雨, 李娜

计算机科学. 2022, 49 (7): 248-253. doi:10.11896/jsjkx.210400219

摘要 ( 716 )

PDF(2584KB) ( 891 )

参考文献 | 相关文章 | 多维度评价

移动边缘计算(Mobile Edge Computing,MEC)用于增强低功耗网络的数据处理能力,目前已成为一种高效的计算范例。文中考虑了由多个终端(Mobile Terminal,MT)组成的边云协同系统及其资源分配策略。为降低MTs的时延总和,采用多种卸载模式,提出了基于深度强化学习的任务卸载算法,该算法将深度神经网络(Deep Neural Network,DNN)作为一个可伸缩的解决方案来实现,从经验中学习多进制卸载模式来最小化时延总和。仿真结果表明,与深度Q网络(Deep Q Network,DQN)算法及深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法相比,所提算法在最大性能增益上提升显著。此外,从仿真结果中可以看出,所提算法具有较好的收敛性,该算法的结果接近穷举搜索得到的最优解。

基于自适应知识迁移与资源分配的多任务协同优化算法

唐枫, 冯翔, 虞慧群

计算机科学. 2022, 49 (7): 254-262. doi:10.11896/jsjkx.210600184

摘要 ( 405 )

PDF(2591KB) ( 789 )

参考文献 | 相关文章 | 多维度评价

多任务优化算法在各任务单独优化的同时进行任务间的知识迁移,从而提升多个任务的综合性能。然而,在相似度较低的任务间进行负向知识迁移反而会导致整体性能下降,且为难度不同的任务分配同等的计算资源会造成资源浪费。此外,在任务的不同阶段采用固定的搜索步长容易陷入局部最优。为解决上述问题,提出了一种基于自适应知识迁移与动态资源分配的多任务协同优化(Multitask Cooperative Optimization Algorithm Based on Adaptive Knowledge Transfer and Resource Allocation,AMTO)算法。首先,每个任务用一个单独的种群进行优化,并将一个种群分成3个子种群,采用3种不同的搜索策略,增加搜索行为的多样性,并且在单个任务内根据个体成功率来动态更新搜索步长,增强自适应搜索能力,避免陷入局部最优;其次,利用多个任务间知识迁移的反馈结果在线计算任务间相似度,并依据相似度自适应地调整迁移概率,同时,在相似度较低的任务间进行迁移时还需减去任务偏差,减小负向知识迁移造成的性能下降程度,提升算法对任务间差异的感知能力;然后,通过评估任务性能的提升度来估计任务难度与优化状态,对不同难度与状态的任务动态按需分配资源,最大限度地提升资源的利用率,减少资源浪费;最后,在简单与复杂两类多任务优化函数上,将本文算法与经典的多任务算法进行对比实验,验证了本文算法中自适应迁移策略、动态资源分配策略及其综合的有效性。

边缘计算中面向数据流的实时任务调度算法

张翀宇, 陈彦明, 李炜

计算机科学. 2022, 49 (7): 263-270. doi:10.11896/jsjkx.210300195

摘要 ( 347 )

PDF(2316KB) ( 834 )

参考文献 | 相关文章 | 多维度评价

近年来,随着物联网(Internet of Things,IoT)技术的发展,其应用场景呈爆炸式增长,这类应用一般具有时延敏感性和资源受限性。如何在有限的资源环境下实现任务的实时分配是当前的一个研究热点,而将这些有限的计算资源动态分配给实时任务,一般来说是一个NP-hard的组合优化问题。为解决此问题,设计了一种基于李雅普诺夫优化的实时调度算法,在保持虚拟队列稳定的情况下优化长期平均总能耗和总效用。首先在计算资源和通信资源约束下建立联合总能耗和加权总效用的优化模型,该模型包含两层虚拟缓冲队列,通过端到端(Device-to-Device,D2D)的调度方式进行任务卸载;然后基于李雅普诺夫优化,将长期平均总能耗和总效用的联合优化问题转化为一系列实时优化问题,为此还设计了一种基于贪心的设备匹配算法。数值实验的结果显示,该算法的效果比随机法所能达到的最好情况提升了8.6%,并且在不同连接概率下其效果逼近穷举法。

基于深度确定性策略梯度的服务器可靠性任务卸载策略

李梦菲, 毛莺池, 屠子健, 王瑄, 徐淑芳

计算机科学. 2022, 49 (7): 271-279. doi:10.11896/jsjkx.210600040

摘要 ( 327 )

PDF(3641KB) ( 468 )

参考文献 | 相关文章 | 多维度评价

随着智能移动设备的普及,新一代移动应用如人脸识别、虚拟现实等逐渐兴起,但移动设备因计算能力和电池容量有限,无法支持这类计算需求高且延迟敏感的应用。因此,移动边缘计算被提出以解决该问题。然而,在MEC环境中,边缘服务器可靠性较低,若发生设备故障会导致已有的卸载决策失效,使得应用程序响应时间增加,用户体验感降低。针对边缘服务器可能发生故障的问题,同时考虑到深度确定性策略梯度算法通过网络拟合策略函数,可以较好地应对高维动作空间的问题,提出了基于深度确定性策略梯度的服务器可靠性任务卸载策略。首先,通过复制子任务进行二次卸载的方式来降低应用执行的失败率;其次,将服务器可靠性约束下最小化应用时延的任务卸载和资源分配问题建模为马尔可夫决策过程;最后,利用基于深度确定性策略梯度的算法来求解任务卸载策略。仿真结果表明,SRTO-DDPG策略能有效地与环境交互并获得最优卸载决策,其性能优于本地执行策略,且相比基于DDPG的单卸载地点任务卸载策略,所提策略在可靠性约束下能实现低约26.16%的总延迟,能够更好地适应多服务器场景中边缘服务器的可靠性问题。

一种面向全双工多中继协作SWIPT网络的功率消耗方案

单永峰, 蒋锐, 徐友云, 李大鹏

计算机科学. 2022, 49 (7): 280-286. doi:10.11896/jsjkx.210400067

摘要 ( 440 )

PDF(3562KB) ( 432 )

参考文献 | 相关文章 | 多维度评价

在全双工多中继协作无线携能通信网络中,传统的中继选择算法未考虑到未被选择中继的闲置利用问题,导致中继数量增加时网络的性能浪费愈加严重,如何开发未被选择中继的剩余潜能成为提升网络性能的关键。对此,设计了一种新的HTT(Harvest then Transmit)功率消耗方案,在中继配备电池的情形下,通过充分利用中继处的能量收集模块增加了被选择中继处的发射功率,从而进一步提升了系统容量。此外,针对提出的新的HTT功率消耗方案,考虑了BIKT(Battery Information Known at Transmitter)和BIUT(Battery Information Unknown at Transmitter)两种应用场景。仿真实验的结果表明,3种中继选择算法,即单中继选择算法、贪婪中继选择算法和穷竭搜索算法,在采用提出的新的HTT功率消耗方案后,无论是应用于BIKT场景还是BIUT场景均能有效提升系统容量并降低中断概率。

数据中心网络BCDC上的顶点独立生成树构造算法

潘志勇, 程宝雷, 樊建席, 卞庆荣

计算机科学. 2022, 49 (7): 287-296. doi:10.11896/jsjkx.210500170

摘要 ( 510 )

PDF(3645KB) ( 471 )

参考文献 | 相关文章 | 多维度评价

作为云计算技术的基础,数据中心网络的通信性能成为了近年来的研究热点。独立生成树(Independent Spanning Trees,ISTs)作为数据中心网络中常见的基础结构,因其在可靠通信、容错广播以及安全分发方面的应用受到了研究者的广泛关注,在诸多特殊的网络上都取得了显著的成果。但是,学者们对在线图中独立生成树的研究却很少。BCDC是由Wang等于2018年提出的一个新的以服务器为中心的数据中心网络,其逻辑图是交叉立方体的线图且为2n－2正则图。文中给出了BCDC上独立生成树的构造算法,首先利用一种并行算法在交叉立方体中构造出2n－2棵树,然后将这些树按照一定规则连接并通过特定的转换方法将其转变为BCDC中2n－2棵相互独立的树,最后将BCDC中的剩余顶点通过一个时间复杂度为O(N)(其中N表示BCDC的顶点数)的高效算法挂接到树上,从而构造出BCDC上的以顶点[r,N(r,2)]为根的2n－2棵独立生成树,其中顶点r为交叉立方体CQ_n上的任意一个顶点。

降雨环境下毫米波MIMO信道特性研究

吴苏洁, 周杰, 王学英, 吕智康, 邵根富

计算机科学. 2022, 49 (7): 297-303. doi:10.11896/jsjkx.210600075

摘要 ( 433 )

PDF(3357KB) ( 688 )

参考文献 | 相关文章 | 多维度评价

米波作为5G通信的重要核心技术,具有广阔的发展前景。随着通信频率的提升,天气(尤其是降雨环境)对信号传播的影响日益增大。为了建立准确有效的传播信道模型,针对降雨环境下车对基站移动通信场景,提出了基于25GHz,30GHz和78GHz的三维毫米波的MIMO空间信道模型。首先介绍了雨滴的几何物理特性,然后对雨衰工程模型作了简要描述,在此基础上提出关于本模型的动态雨衰衰减表达式。该模型考虑了基站与信号接收机的视距与非视距路径,以及接收机运动和动态散射簇对信道在时域和空间域上的非平稳性。最后采用生灭过程对信道进行理论分析,推导频率、降雨量、俯仰角等参数对互相关函数以及信道容量的影响。通过与以往文献实测数据的对比发现,该模型与实际测量结果拟合程度高。该研究对降雨环境下无线通信系统的应用具有重要的理论和实际意义,丰富了移动无线通信信道模型的研究和应用。

串联排队系统中各服务站间的关联性分析

高雅, 赵宁, 刘文奇

计算机科学. 2022, 49 (7): 304-309. doi:10.11896/jsjkx.210500218

摘要 ( 441 )

PDF(2561KB) ( 495 )

参考文献 | 相关文章 | 多维度评价

串联排队系统中站与站之间存在关联性,深入分析串联排队系统中上游服务站对下游服务站的影响对研究串联排队系统性能具有重要意义。然而,串联排队系统上游服务站的输出过程通常是非更新过程,很难从理论上分析出各个站之间的关联性。文中利用指标比研究了串联排队系统各站间的关联性,通过大量的模拟实验,分析指标比与系统参数之间的关系。研究发现,上游服务站对下游服务站的平均排队时间有扩大或缩小效应。指标比是上游服务站服务时间的平方变异系数的增函数,当指标比大于1时,指标比是上游服务站与下游服务站平均服务时间之比的增函数;当指标比小于1时,指标比是上游服务站与下游服务站平均服务时间之比的减函数。因此,可以通过调整上游服务站的服务时间或平方变异系统来改变指标比,从而有效控制串联排队系统下游服务站的排队时间。

联邦学习攻防研究综述

陈明鑫, 张钧波, 李天瑞

计算机科学. 2022, 49 (7): 310-323. doi:10.11896/jsjkx.211000079

摘要 ( 1166 )

PDF(4808KB) ( 6152 )

参考文献 | 相关文章 | 多维度评价

联邦学习用于解决数据共享与隐私安全之间的矛盾,旨在通过安全地交互不可逆的信息(如模型参数或梯度更新)来构建一个联邦模型。然而,联邦学习在模型的本地训练、信息交互、参数传递等过程中依然存在恶意攻击和隐私泄漏的风险,这给联邦学习的实际应用带来了重大挑战。文中针对联邦学习在建模和部署过程中存在的攻击行为及相应的防御策略进行了详细调研。首先,简要介绍了联邦学习的基本流程和相关攻防知识;接着,从机密性、可用性和正直性3个角度对联邦学习训练和部署中的攻击行为进行了分类,并梳理了相关的隐私窃取和恶意攻击的最新研究;然后,从防御诚实但好奇(honest-but-curious)攻击者和恶意攻击者两个方向对防御方法进行了划分,并分析了不同策略的防御能力;最后,总结了防御方法在联邦学习实践中存在的问题及可能导致的攻击风险,并探讨了联邦系统的防御策略在未来的发展方向。

MTDCD:一种对抗网络入侵的混合防御机制

高春刚, 王永杰, 熊鑫立

计算机科学. 2022, 49 (7): 324-331. doi:10.11896/jsjkx.210600193

摘要 ( 549 )

PDF(2605KB) ( 5175 )

参考文献 | 相关文章 | 多维度评价

移动目标防御和网络欺骗防御均是通过增加攻击者获取的信息的不确定性来保护己方系统和网络,该方法能够在一定程度上减缓网络入侵。然而,单一的移动目标防御技术无法阻止利用多元信息进行网络入侵的攻击者,同时,部署的诱饵节点可能会被攻击者识别和标记,降低了防御效能。因此,提出了融合移动目标防御和网络欺骗防御的混合防御机制MTDCD,并通过深入分析实际网络对抗,构建了网络入侵威胁模型,最后基于Urn模型建立了防御有效性评估模型,并从虚拟网络拓扑大小、诱饵节点的欺骗概率、IP地址随机化周期、IP地址转移概率等多个方面评估了所提混合防御机制MTDCD的防御效能,为后续防御策略设计提供了一定的参考和指导。

面向多无人系统的安全协同模型

李瑭, 秦小麟, 迟贺宇, 费珂

计算机科学. 2022, 49 (7): 332-339. doi:10.11896/jsjkx.210600107

摘要 ( 415 )

PDF(2179KB) ( 5335 )

参考文献 | 相关文章 | 多维度评价

随着无人系统技术的不断发展,多无人系统的协同控制技术受到了广泛的关注。设计合理的协同模型是多无人系统中的重要研究内容,而已有协同模型在开放的网络环境中存在一定的安全性问题。在分析已有模型的不足的基础上,提出了一种具有安全特性的多无人系统协同模型RCC(Rules Combined Coordination)。RCC模型在协同过程中引入了逻辑规则,提供了终端的合法性认证及通信双方的权限控制,保障了多无人系统的安全性。最后,基于开源机器人系统ROS及RCC模型,搭建了多无人车的协同仿真平台,并在其中设计了导航、避障等实验场景,仿真实验的相关结果验证了RCC模型具有可用性和安全性。

基于HMM-NN的用户点击流识别

费星瑞, 谢逸

计算机科学. 2022, 49 (7): 340-349. doi:10.11896/jsjkx.210600127

摘要 ( 375 )

PDF(3544KB) ( 5260 )

参考文献 | 相关文章 | 多维度评价

用户行为画像分析是实现网络智能化的关键手段之一,而点击目标识别是构建用户行为画像的重要依据和基础。已有的工作主要为系统端设计,其只能反映用户对特定服务域的行为特征,不适合网络端的检测和管理。网络端用户行为分析面临的主要挑战是处于协议栈底层的网络管道无法获取应用层及系统端信息,只能依赖IP数据流,因此难以构建有效的网络端用户行为画像。因此,提出了一种新的面向中间网络的用户点击目标识别方法,该方法融合了隐马尔可夫模型(Hidden Markov Model,HMM)和神经网络(Neural Networks,NN)。HMM框架从IP流的角度描述点击流与非点击流的动态行为过程;NN用于建立HMM中的隐状态与复杂网络流行为特征之间的关系。通过评估待测请求序列与HMM-NN模型的拟合度来实现用户点击目标的识别。该方案的主要优点在于它继承了HMM的可解析性,并利用NN增强了HMM对复杂数据的描述能力;而且该方案不涉及IP流所承载的数据内容,适用于加密与非加密场景下网络端的点击行为识别,有效解决了网络端用户行为画像分析所面临的困难。基于多个实际数据集进行实验,结果表明该方案的3个常用评价指标F1,Kappa及AUC的数值分别超过已有方法0.91,0.83,0.96,证明该方法比已有的方法具有更好的性能表现。

基于本地化差分隐私的频率特征提取

黄觉, 周春来

计算机科学. 2022, 49 (7): 350-356. doi:10.11896/jsjkx.210900229

摘要 ( 358 )

PDF(2455KB) ( 5408 )

参考文献 | 相关文章 | 多维度评价

大数据时代信息技术不断发展,隐私问题越来越受到人们的关注。尤其是随着移动端的普及,如何在数据发布的同时保护用户个人的隐私信息是当前面临的重大挑战。此前学术界曾提出依赖于可信第三方的中心化差分隐私技术,但在实际应用中可信第三方的条件通常不成立;随后,在中心化差分隐私的基础上进一步提出了本地化差分隐私,它能够防止来自不可信第三方的隐私攻击,并且面对具有任意知识背景的隐私攻击者依然具有很强的防御效果。但是,市场通常不仅要迎合用户的需求,也要满足运营商的要求。为了对两者进行平衡,如何解决运营商的分析任务是亟待解决的问题。RAPPOR(Randomized Aggregatable Privacy-Preserving Ordinal Response)算法能够很好地完成这个任务,它通过使用两次随机响应机制对用户数据进行加密,保证了隐私保护的力度,并使用 Lasso 回归模型对加密数据进行解密,保证了频率特征提取的准确度。文中的贡献在于将RAPPOR算法应用于疫情信息采集,在保护受访者隐私信息的同时能获取真实的疫情资料,以美国各地新冠确诊人数的数据集进行实验,实验结果表明,所提方法较高程度地拟合了真实结果,完成了频率特征提取的分析任务。RAPPOR算法实现了本地化差分隐私技术从理论走向应用,切实保障了个人的隐私问题。

基于IPSO-BiLSTM的网络安全态势预测

赵冬梅, 吴亚星, 张红斌

计算机科学. 2022, 49 (7): 357-362. doi:10.11896/jsjkx.210900103

摘要 ( 623 )

PDF(2573KB) ( 5181 )

参考文献 | 相关文章 | 多维度评价

针对复杂的网络安全态势预测问题,为了提高预测的收敛速度和预测精度,提出了一种基于改进粒子群优化双向长短期记忆(IPSO-BiLSTM)网络的网络安全态势预测模型。首先,针对所用数据集没有真实态势值的问题,采用了一种基于攻击影响的态势值计算方法,用于态势预测。其次,针对粒子群(PSO)算法易陷入局部最优值、搜索能力不均衡等问题,对惯性权重和加速因子进行改进,改进后的粒子群(IPSO)算法的全局和局部搜索能力平衡,收敛速度更快。最后,使用IPSO优化双向长短期记忆(BiLSTM)网络参数,提升预测能力。实验结果表明,IPSO-BiLSTM的拟合程度可达0.994 6,其拟合效果和收敛速度均优于其他模型。