1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2024年第8期, 刊出日期:2024-08-15
  
封面下载
目录
第51卷第8期目录
计算机科学. 2024, 51 (8): 0-0. 
摘要 ( 92 )   PDF(305KB) ( 297 )   
相关文章 | 多维度评价
学科前沿
驶向智能未来:深度学习在轨道交通革新中的应用
孙宇墨, 李昕航, 赵文杰, 朱力, 梁雅楠
计算机科学. 2024, 51 (8): 1-10.  doi:10.11896/jsjkx.240300099
摘要 ( 228 )   PDF(3613KB) ( 416 )   
参考文献 | 相关文章 | 多维度评价
目前,轨道交通凭借其便利性、高效性等特点,在城市交通中扮演着重要角色。然而,现有轨道交通系统的运行过程也存在着复杂的问题,客流预测、列车调度等环节仍采用人工方式,效率和准确率均较低,对系统性能造成了一定影响。近年来,深度学习蓬勃发展,其强大的特征提取与图像识别能力,也为轨道交通的自动化、智能化发展提供了更多的可能性。文中首先阐述了当前轨道交通在现实生活各种应用场景中面临的挑战;其次从轨道交通感知任务、预测任务、优化任务等方面分析了深度学习赋能轨道交通领域的主要应用;最后,从高精度和高鲁棒性的安全性检测,轻量级的轨道交通模型,全自动的轨道交通智能化运行,以及借助云计算、大数据的信息处理高效化4个方面展望了未来深度学习在轨道交通中的发展方向。
构音障碍说话人自适应研究进展及展望
康新晨, 董雪燕, 姚登峰, 钟经华
计算机科学. 2024, 51 (8): 11-19.  doi:10.11896/jsjkx.230700161
摘要 ( 143 )   PDF(2194KB) ( 339 )   
参考文献 | 相关文章 | 多维度评价
自动化语音识别工具让构音障碍者和正常人的沟通变得顺畅,因此,近年来构音障碍语音识别成为了一项热门研究。构音障碍语音识别的研究包括:收集构音障碍者和正常人的发音数据,对构音障碍者和正常人的语音进行声学特征表示,利用机器学习模型比较和识别发音的内容并定位出差异性,以帮助构音障碍者改善发音。然而,由于收集构音障碍者的大量语音数据非常困难,且构音障碍者存在发音的强变异性,导致通用语音识别模型的效果往往不佳。为了解决这一问题,许多研究提出将说话人自适应方法引入构音障碍语音识别。对大量相关文献进行调研发现,当前此类研究主要围绕特征域和模型域对构音障碍语音进行分析。文中重点分析特征变换和辅助特征如何解决语音特征的差异性表示,以及声学模型的线性变换、微调声学模型参数和基于数据选择的域自适应方法如何提高模型识别的准确率。最后总结出构音障碍说话人自适应研究当前遇到的问题,并指出未来的研究可以从语音变异性的分析、多特征多模态数据的融合以及基于小数量的自适应方法的角度,提升构音障碍语音识别模型的有效性。
数据库&大数据&数据科学
离群点检测算法综述
孔翎超, 刘国柱
计算机科学. 2024, 51 (8): 20-33.  doi:10.11896/jsjkx.230600052
摘要 ( 139 )   PDF(3902KB) ( 349 )   
参考文献 | 相关文章 | 多维度评价
离群点检测作为数据挖掘领域的一个重要研究方向,其目的是发掘隐藏在数据集合中与众不同且具有潜在分析价值的数据,辅助研究人员甄别数据源可能存在的问题。目前,离群点检测已被广泛应用于欺诈识别、智慧医疗、入侵检测、故障诊断等诸多领域。文中在总结前人经验的基础上,首先讨论离群点的定义、产生原因以及典型应用领域,综述了DBSCAN和LOF等离群点检测经典算法及其改进算法的优势和局限,分析了深度学习方法在离群点检测领域的优势;其次结合当前互联网背景下海量、高维、时序数据处理需求,对离群点检测算法在新环境下的发展状况做进一步研究;最后介绍离群点检测算法的评价指标、代价因子在离群点检测评价中的作用以及常用工具包和数据集,总结展望了离群点检测面临的挑战和未来的发展方向。
卡-梅框架下数据财产权益保护规则分类分级配置研究
丛颖男, 彭友, 朱金清
计算机科学. 2024, 51 (8): 34-44.  doi:10.11896/jsjkx.240100030
摘要 ( 97 )   PDF(1758KB) ( 286 )   
参考文献 | 相关文章 | 多维度评价
在社会、经济数字化转型的关键时期,建立高效的数据要素市场是数字经济持续快速发展的重要基础和基本前提,也是多学科交融的时代课题。数据的财产权益保护制度是数据要素市场的基础制度,目前相关的理论探讨可谓百家争鸣,与法律规定和裁判观点共同构成了一张“规则清单”。卡-梅框架提供了一种以经济效率为标准的规则选择方法,与建设高效的数据要素市场这一政策目标相契合。在此框架下,从事前效率和事后效率两个视角分别对个人数据、企业数据和公共数据的财产权益保护规则进行比较和选择,发现对于个人数据和企业数据而言,提供事后救济的责任规则相比赋予绝对化财产权的财产规则更具效率;而对于公共数据而言,两者各有优势。基于此,进一步对个人数据保护提出了构建“三层构造”保护模式的立法建议和建立数据匿名化制度的构想,对企业数据保护提出了构建非绝对性财产权利的方向指引,对公共数据提出了建立三类规则相互配合的分类分级开放格局的建议。
面向延迟标签场景下的可解释信用评估模型
辛博, 丁志军
计算机科学. 2024, 51 (8): 45-55.  doi:10.11896/jsjkx.230900107
摘要 ( 92 )   PDF(3048KB) ( 248 )   
参考文献 | 相关文章 | 多维度评价
随着社会经济的快速发展,信贷业务在金融领域中扮演着越来越重要的角色,利用机器学习算法进行信用评估成为了当前主流的方法。然而,目前仍存在一些问题亟待解决,如延迟标签带来的有标签数据不充分、模型滞后性的问题,以及动态信用评估模型缺乏可解释性的问题。针对这些问题,提出了一种面向延迟标签场景的可解释信用评估模型。该模型在动态模型树的基础上进行了加权改进,结合了延迟标签更新算法和自适应阈值的伪标签选择策略,将延迟标签数据看作反馈数据和伪标签数据两种状态分别进行处理,平衡了有标签数据不充分和模型滞后带来的影响,并实现了模型的可解释性。最后,在一些合成和真实的信用评估数据集上对模型进行了实验,与其他主流的算法相比,其更好地权衡了预测性能和可解释性。
面向幂律图的动态图存储结构Power-PCSR
毛志雄, 刘志楠, 高叙宁, 王蒙湘, 巩树凤, 张岩峰
计算机科学. 2024, 51 (8): 56-62.  doi:10.11896/jsjkx.231000155
摘要 ( 82 )   PDF(2377KB) ( 234 )   
参考文献 | 相关文章 | 多维度评价
图数据在现实生活中广泛存在,且不断发生变化。传统高效的静态图存储方式——压缩行/列(Compressed Sparse Row/Column,CSR/CSR)存储方式在更新图数据时需要大量的数据迁移,不适用于动态图数据。而能够高效更新图数据的邻接表(Adjacency List,AL) 存储方式往往带有大量的指针,导致其图数据读取和分析效率低。Packed Compressed Sparse Row(PCSR)是一种基于CSR的动态图存储结构。该结构在存储边数据时并不是采用连续无空隙数组,而是采用留有空槽的压缩存储阵列(Packed Memory Arrays,PMA)结构,便于边数据的插入。因此,PCSR支持高效图更新和图分析。但是,PCSR在存储幂律图时,其性能容易受大度数顶点的影响。为此,基于PCSR提出一种支持可高效更新和分析动态幂律图的图存储结构Power-PCSR。该结构将幂律图中度数较大的顶点单独存储在一个独立的PMA中,其他所有小度数顶点与PCSR一样存储在原PMA中。小度顶点变化导致的数据迁移不会触及大度数顶点,从而大大减少了数据迁移数量;同样,大度数顶点更新导致的数据迁移只限制在每个大度数顶点的PMA内部,不会涉及小度数顶点和其他大度数顶点的数据迁移。实验显示,Power-PCSR在分析图数据时与PCSR具有相似的性能,而在更新图数据时比PCSR快2倍。
融合AP聚类算法和宽度学习系统的分布外硬盘故障预测
王屹阳, 刘发贵, 彭玲霞, 钟国祥
计算机科学. 2024, 51 (8): 63-74.  doi:10.11896/jsjkx.230600103
摘要 ( 101 )   PDF(3516KB) ( 250 )   
参考文献 | 相关文章 | 多维度评价
硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段。但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往不适用于其他硬盘。对于这两个问题,文中提出了一种融合AP 聚类算法和宽度学习系统的分布外硬盘故障预测方法。针对样本不平衡问题,文中使用AP聚类算法对硬盘故障出现前一阶段的样本集进行聚类,将与故障样本处于同一聚类簇的样本扩充为故障样本。针对不同型号硬盘分布存在差异的问题,文中结合流形正则化框架和宽度学习系统来学习硬盘数据的低维结构,提高模型对未知分布数据的泛化能力。实验结果表明,在AP聚类算法重采样的样本集上,相较于用于对比的重采样方法得到的样本集,多种故障预测方法的F1_Score取得了平均0.2的提升。此外,在分布外硬盘故障预测任务上,所提模型的F1_Score相比对比方法提升了0.1~0.2。
基于逻辑视角的不完备形式背景上知识相容表示与推理
张少霞, 李德玉, 翟岩慧
计算机科学. 2024, 51 (8): 75-82.  doi:10.11896/jsjkx.240400104
摘要 ( 64 )   PDF(1530KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
形式背景中的信息不完备引起了知识的不相容性,即蕴涵在不完备形式背景的任一完备化形式背景不能同时成立。逻辑描述是从语义上进行知识表示、语构上制定语义协调推理规则的方法论。首先,从逻辑角度研究不完备数据上的知识相容语义表示,通过定义不完备实例刻画知识的合理性和相容性,并构造最紧致的相容集(相容规范基)。其次,语构上制定具有语义合理性、相容性和完备性的推理规则,从而避免知识推理过程中产生不相容知识和无效知识。最后,将逻辑研究结果运用在不完备形式背景上,引入两类蕴涵形式:↓↓-型蕴涵和↑↑-型蕴涵。这两类蕴涵兼具相容性且相对于可接受性蕴涵尺度更加严格,构造这两类蕴涵的相容规范基并验证其完备性和无冗余性。
基于θ算子的多粒度直觉模糊粗糙集模型
郑宇, 薛占熬, 吕明明, 徐久成
计算机科学. 2024, 51 (8): 83-96.  doi:10.11896/jsjkx.230600185
摘要 ( 85 )   PDF(2223KB) ( 231 )   
参考文献 | 相关文章 | 多维度评价
针对在多属性决策中决策者难以在多个属性相互冲突时做出准确判断的问题,文中在直觉模糊近似空间中,首先利用直觉模糊集的隶属度、非隶属度与模糊蕴含算子,提出了基于θ算子和θ*算子的直觉模糊集及其隶属度和非隶属度的概念,并证明了它们的一系列性质。然后,在直觉模糊集与多粒度粗糙集上,定义基于θ算子的多粒度直觉模糊粗糙集的悲观、乐观模型,讨论两种模型的相关性质。最后,给出了基于θ算子的多粒度直觉模糊粗糙集模型的多属性决策算法,将高校引进的人才评价和企业绿色经济供应链的商家评价作为实例进行了分析,同时还与已有方法进行了分析对比,用乐观、悲观模型与已有方法的决策结果的对比证明了所提方法的正确性,并验证了该模型算法的有效性。
基于共享最近邻的自适应密度峰值聚类算法
王心耕, 杜韬, 周劲, 陈迪, 仵匀政
计算机科学. 2024, 51 (8): 97-105.  doi:10.11896/jsjkx.230500226
摘要 ( 80 )   PDF(4182KB) ( 248 )   
参考文献 | 相关文章 | 多维度评价
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。
基于符号表示的可度量shapelets提取的时序分类研究
王礼勤, 万源, 罗颖
计算机科学. 2024, 51 (8): 106-116.  doi:10.11896/jsjkx.230500161
摘要 ( 70 )   PDF(3160KB) ( 218 )   
参考文献 | 相关文章 | 多维度评价
在时序分类问题中,基于符号表示的shapelets提取方法具有良好的分类精度和分类效率,但对符号进行质量度量的过程,如计算TFIDF分数,耗时较长且计算量大,导致分类效率较低。此外,提取的shapelets候选数量仍然较多,判别力有待提高。针对这些问题,本文提出了一种基于符号表示的可度量shapelets提取方法,该方法包含时间序列数据预处理、确定shapelets候选集和学习shapelets 3个阶段,可以快速得到高质量shapelets。在数据预处理阶段,将时间序列转化为符号聚合近似(SAX)表示以降低原始时间序列的维度。在确定shapelets候选集阶段,利用Bloom过滤器过滤重复的SAX词,并将过滤后的SAX词存储在哈希表中进行质量度量。随后,对SAX词的相似性进行判别,基于相似性和覆盖度等概念确定最终的shapelets候选集。在学习shapelets阶段,采用logistic回归模型学得真正的shapelets用于时序分类。在32个数据集上进行了大量实验,实验结果表明,所提方法的平均分类精度和平均分类效率均排名第二。与现有的基于shapelets的时序分类方法相比,该方法可以在保证精度的同时提高分类效率,并且具有良好的可解释性。
河海图结构蛋白质数据集及预测模型
魏想想, 孟朝晖
计算机科学. 2024, 51 (8): 117-123.  doi:10.11896/jsjkx.231100014
摘要 ( 77 )   PDF(1564KB) ( 208 )   
参考文献 | 相关文章 | 多维度评价
蛋白质是一种具有空间结构的物质。蛋白质结构预测的主要目标是从已有的大规模的蛋白质数据集中提取有效的信息,从而预测自然界中蛋白质的结构。目前蛋白质结构预测实验存在的一个问题是,缺少能够进一步反映出蛋白质空间结构特征的数据集。当前主流的 PDB 蛋白质数据集虽然是经过实验测得,但没有利用到蛋白质的空间特征,而且存在掺杂核酸数据和部分数据不完整的问题。针对以上问题,从蛋白质的空间结构角度来研究蛋白质的预测。在原始 PDB 数据集的基础上,提出了河海图结构蛋白质数据集(Hohai Graphic Protein Data Bank,HohaiGPDB)。该数据集以图结构为基础,表达出了蛋白质的空间结构特征。基于传统 Transformer 网络模型对新的数据集进行了相关的蛋白质结构预测实验,在 HohaiGPDB 数据集上的预测准确率可以达到 59.38%,证明了HohaiGPDB数据集的研究价值。HohaiGPDB 数据集可以作为蛋白质相关研究的通用数据集。
面向多样化数据清洗任务的证据集智能选择方法
钱泽凯, 丁小欧, 孙哲, 王宏志, 张岩
计算机科学. 2024, 51 (8): 124-132.  doi:10.11896/jsjkx.230900003
摘要 ( 141 )   PDF(2188KB) ( 278 )   
参考文献 | 相关文章 | 多维度评价
由于针对单一特定数据质量问题而设计的数据清洗算法并不总能有效地适用于多种清洗需求共存的数据质量提升技术,因此可采用多种清洗方法互相配合的方式来解决各种数据清洗需求。将数据清洗问题转换为证据集的生成和选择问题,基于聚合查询的增量式质量评估方案和基于中间算子证据集的算子结果选择方案,在多种清洗任务下实现了多种清洗方法配合的高效数据清洗。在所提清洗模型中,算子库提供数据清洗结果并将其转换为中间算子;中游的采样器将中间算子集分流和剪枝,给搜索器提供优质的候选证据集;下游的搜索器在质量评估器的指导下进行证据集的选择,搜索完毕后向上游算子库更新数据和必要的参数,使算子库重新迭代生成中间算子。最后,基于3个不同规模的真实数据集进行了大量实验,通过不同数据清洗任务下的性能验证在任意种类的数据清洗需求下算子编排的可行性,并将所提方法和现有的智能数据清洗系统进行性能对比。结果表明,在多种清洗任务中,所提方法在多种数据质量约束、动态和大规模的数据清洗方面具有稳定的准确率和召回率,且同一清洗时间下异常值、规则违反和混合错误的清洗任务性能优于其他智能数据清洗系统15%以上。
计算机图形学&多媒体
一种基于对偶学习的场景分割模型
刘思纯, 王小平, 裴喜龙, 罗航宇
计算机科学. 2024, 51 (8): 133-142.  doi:10.11896/jsjkx.230700207
摘要 ( 79 )   PDF(4682KB) ( 253 )   
参考文献 | 相关文章 | 多维度评价
城市场景分割等复杂任务存在特征图空间信息利用率低下、分割边界不够精准以及网络参数量过大的问题。为解决这些问题,提出了一种基于对偶学习的场景分割模型DualSeg。首先,采用深度可分离卷积使模型参数量显著减少;其次,融合空洞金字塔池化与双重注意力机制模块获取准确的上下文信息;最后,利用对偶学习构建闭环反馈网络,通过对偶关系约束映射空间,同时训练“图像场景分割”和“对偶图像重建”两个任务,辅助场景分割模型的训练,帮助模型更好地感知类别边界、提高识别能力。实验结果表明,在自然场景分割数据集PASCAL VOC中,基于Xception骨架网络的DualSeg模型的mIoU和全局准确率分别达到81.3%和95.1%,在CityScapes数据集上mIoU达到77.4%,并且模型参数量减少18.45%,验证了模型的有效性。后续将探索更有效的注意力机制,进一步提高分割精度。
基于梯度引导的低剂量CT超分辨率重建算法
徐颖, 张道强, 葛荣骏
计算机科学. 2024, 51 (8): 143-151.  doi:10.11896/jsjkx.230700162
摘要 ( 82 )   PDF(5756KB) ( 203 )   
参考文献 | 相关文章 | 多维度评价
低剂量CT(Low-dose CT,LDCT)扫描在临床实践中起着关键作用,其能有效降低放射科医生和患者的患癌风险。然而,低剂量射线的使用会给生成的CT图像引入明显的噪声,这一问题凸显了LDCT降噪重建的必要性。图像重建领域中的另一个重要任务是超分辨率(Super-resolution,SR)重建,其目标是在减少计算开销的同时实现高分辨率的CT成像。高分辨率CT图像能够更准确地捕捉复杂的解剖细节。尽管这些任务在各自领域取得了显著进展,但目前仍缺乏能够有效利用这两个任务之间固有相关性并同时处理它们的有效方法。文中将边缘信息作为两个任务之间的纽带,并利用梯度提取强相关特征。这使得LDCT降噪重建过程能够辅助超分辨率重建过程,并最终生成具有清晰边缘的结果图像。文中提出的降噪和超分辨率重建网络(NRSR-Net)包括3个组成部分:1)边缘增强框架,该框架利用梯度信息引导和提取相关特征,从而充分利用两个任务之间的相关性,使降噪任务能够辅助超分辨率任务实现更好的性能;2)梯度门控融合模块(Gradient Guided Fusion Block,GGFB),该模块增强高度相关的边缘特征并抑制无关特征,从而实现边缘区域的有效重建;3)梯度损失,该损失函数为模型引入更加丰富的梯度特征,并使网络重点还原边缘区域。一系列的实验表明,NRSR-Net在定量评估中取得了令人满意的峰值信噪比(PSNR)、结构相似性(SSIM)和学习感知图像块相似度(LPIPS),并获得了高质量的可视化结果。这些优势表明NRSR-Net在临床CT成像中具有巨大潜力。
基于伪标签依赖增强与噪声干扰消减的小样本图像分类
唐芮琪, 肖婷, 迟子秋, 王喆
计算机科学. 2024, 51 (8): 152-159.  doi:10.11896/jsjkx.230500066
摘要 ( 88 )   PDF(3172KB) ( 236 )   
参考文献 | 相关文章 | 多维度评价
深度学习在图像分类领域的成功很大程度上依赖于大规模数据,然而在许多应用场景中,收集足够的数据用于模型的训练是比较困难的。因此,旨在利用有限的数据获得高性能模型的小样本学习成为热点研究方向。在小样本图像分类领域,使用无标签数据来扩充训练数据集是一种常用的方法,但该方法面临两个亟待解决的难题:如何获取无标签数据的伪标签以及如何减轻噪声标签累积的负面影响?首先,为获得高质量的伪标签,需要解决由源域和目标域的分布偏移导致的噪声标签问题,因而提出基于希尔伯特-施密特独立准则(Hilbert-Schmidt Independent Criterion,HSIC)的依赖增强方法,通过最大化图像特征表示与标签之间的相关性,从而提高伪标签的预测可靠度。其次,为克服标签预测误差随着时间推移不断累积的问题,提出噪声标签干扰消减(Noise Label Interference Reduction,NLIR)方法,确保具有正确标签的样本的梯度始终主导着训练动态,从而将模型引向最优解。所提方法在小样本图像分类基准数据集mini-ImageNet和tiered-ImageNet上进行了评估,实验结果表明,该方法能够很好地利用无标签数据提升分类精度,具有良好的分类性能。
任务感知的多尺度小样本SAR图像分类方法
张睿, 王梓祺, 李阳, 王家宝, 陈瑶
计算机科学. 2024, 51 (8): 160-167.  doi:10.11896/jsjkx.230500171
摘要 ( 80 )   PDF(2289KB) ( 272 )   
参考文献 | 相关文章 | 多维度评价
针对SAR图像分类时存在的带标注样本较少的问题,提出了一种任务感知的多尺度小样本SAR图像分类方法。为了能够充分挖掘局部特征并关注具体任务下的关键局部语义patches,引入了两种有效的注意力机制,获得了更加高效且丰富的特征表示。首先,在特征提取阶段使用互补注意力模块(CSE Block),关注原始特征中不同语义部分的显著特征,从被抑制的特征中提取次级显著特征并与主要显著特征融合,得到更加高效且丰富的特征表示。随后,利用自适应情景注意力模块(AEA Block)获得整个任务中的关键语义patches,增强任务间的区分信息,提升小样本SAR图像分类任务的精度。结果表明,在SAR图像分类标准数据集MSTAR上,5-way 1-shot任务分类精度相较于次优方法精度提升了2.9%,并且该方法在两项任务中的运行时间与其他度量学习方法相比水平相当,未额外增加过多的计算资源,验证了其有效性。
基于改进DeepLabv3+的遥感影像道路提取算法
王谦, 何朗, 王展青, 黄坤
计算机科学. 2024, 51 (8): 168-175.  doi:10.11896/jsjkx.230600118
摘要 ( 99 )   PDF(3325KB) ( 231 )   
参考文献 | 相关文章 | 多维度评价
道路提取可以帮助人们更好地理解城市环境,是城市交通和城市规划等方面的重要部分,随着深度学习与计算机视觉的发展,利用基于深度学习的语义分割算法从遥感影像中提取道路的技术趋于成熟。针对现有的深度学习道路提取算法存在的提取速度慢和容易受背景环境因素干扰而产生漏分割、不连续等问题,提出了一种基于ECANet注意力机制和级联空洞空间金字塔池化模块的轻量化算法CE-DeepLabv3+。首先,将主干特征提取网络更换为轻量级的MobileNetv2,减少参数量,提高模型的执行速度;其次,通过增加空洞空间金字塔池化模块的卷积层进一步扩大感受野,再级联不同特征层来增强语义信息的复用性,从而加强对细节特征的提取能力;再次,加入ECANet注意力机制,抑制背景环境中的干扰因素,聚焦道路信息;最后,采用改进的损失函数进行训练,消除了道路与背景样本不均衡对模型性能产生的影响。实验结果表明,改进算法的性能优良,与原始DeepLabv3+算法相比,在分割效率、分割精度上有较大的提升。
基于颜色流模型的非配对医学图像颜色迁移方法
王晓洁, 刘尽华, 陆书一, 周元峰
计算机科学. 2024, 51 (8): 176-182.  doi:10.11896/jsjkx.230700088
摘要 ( 69 )   PDF(3774KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
在临床应用中,CT图像是一种比较容易获取的影像数据,但是其与真实人体色彩有较大差距。人体断层彩色图像是真实人体的色彩反应,但却是一种稀有数据。如果将两者结合,使得每个病例都可以得到自己的彩色CT数据,将会对医生手术和患者理解有更好的促进作用。因此,文中提出了一种基于颜色流模型的医学图像颜色迁移框架。首先,将CT数据和真实人体彩色数据分别输入颜色流模型中,提取二者的内容特征和颜色特征;然后,在特征层面进行颜色和纹理的迁移工作;最后,将处理以后的特征信息重新输入到可逆颜色流模型中进行图像重建工作。为了使着色以后的图像更具有纹理特征,在每个流模块之后添加了纹理约束损失;同时,为了保证医学图像上细小血管等组织的特征不被丢失,在着色图像和源图像之间添加了边缘约束损失。通过定性和定量实验证明,所提方法比其他的着色方法更加鲁棒,且着色后的图像更加真实。文中也在不同的数据域上进行了测试,依旧可以得到稳定的实验结果。同时,所提方法也可以在不调整窗宽/窗位的前提下显示清晰的组织结构。
嵌入注意力机制的并行多尺度点云上采样方法
肖霄, 柏正尧, 李泽锴, 刘旭珩, 杜佳锦
计算机科学. 2024, 51 (8): 183-191.  doi:10.11896/jsjkx.230500094
摘要 ( 93 )   PDF(5481KB) ( 232 )   
参考文献 | 相关文章 | 多维度评价
目前,基于深度学习的点云上采样方法缺失对局部区域特征关联性的关注和对全局特征的多尺度提取,导致输出的密集点云存在异常值过多、细粒度不高等问题。为解决上述问题,提出了嵌入注意力机制的并行多尺度点云上采样网络(Parallel Multi-scale with Attention mechanism for Point cloud Upsampling),网络由特征提取器、特征拓展器、坐标细化器和坐标重建器4个模块级联组成。首先给定一个N×3的稀疏点云作为输入,为了获得点云的全局和局部特征信息,设计了一个嵌入注意力机制的并行多尺度特征提取模块(PMA)用于将三维空间的点云映射到高维特征空间。其次使用边缘卷积特征拓展器拓展点云特征维度,得到高维点云特征,以更好地保留点云特征的边缘信息,将高维点云特征通过坐标重建器转换回三维空间中。最后使用坐标细化器精细调整输出点云细节。在合成数据集PU1K上的对比实验结果表明,PMA-PU生成的密集点云在倒角距离(CD)、豪斯多夫距离(HD)和点面距离(P2F)上都有显著提升,分别比性能次优的网络模型优化了7.863%,21.631%,14.686%。可视化结果证明了PMA-PU具有性能更好的特征提取器,能够生成细粒度更高、形状更接近真实值的密集点云。
基于高深约束与边缘融合的单目3D目标检测
浦斌, 梁正友, 孙宇
计算机科学. 2024, 51 (8): 192-199.  doi:10.11896/jsjkx.230500071
摘要 ( 78 )   PDF(2973KB) ( 226 )   
参考文献 | 相关文章 | 多维度评价
单目3D目标检测旨在通过单目图像完成3D目标检测,现有的单目3D目标检测算法大多基于经典的2D目标检测算法。针对单目3D目标检测算法中通过直接回归的实例深度估计不准,导致检测精度较差的问题,提出了一种基于高深约束与边缘特征融合的单目3D目标检测算法。在实例深度估计方法上采用几何投影关系下的实例3D高度与2D高度计算高深约束,将实例深度的预测转化为对目标的2D高度以及3D高度的预测;针对单目图像存在图像边缘截断目标,采用基于深度可分离卷积的边缘融合模块来加强对边缘目标的特征提取;对于图像中目标的远近造成的目标多尺度问题,设计了基于空洞卷积的多尺度混合注意力模块,增强了对最高层特征图的多尺度特征提取。实验结果表明,所提方法在KITTI数据集上的汽车类别检测精度相比基准模型提升了7.11%,优于当前的方法。
基于多样化标签矩阵的医学影像报告生成
张俊三, 程铭, 沈秀轩, 刘玉雪, 王雷全
计算机科学. 2024, 51 (8): 200-208.  doi:10.11896/jsjkx.230600018
摘要 ( 76 )   PDF(5253KB) ( 238 )   
参考文献 | 相关文章 | 多维度评价
医学影像在医学诊断中具有重要作用,而准确描述的文本报告对于理解图像以及后续疾病诊断是必不可少的。目前在医学影像报告生成领域,基于模式化方法生成规范的文本报告成为近年的研究热点。但正负样本数量差距较大导致的数据偏差问题,使得生成的报告内容普遍倾向于描述正常状况,难以准确捕捉异常信息。为解决这一问题,提出了一种基于多样化标签矩阵的医学报告生成方法,可以对不同的疾病进行差异化学习,生成多样化的医疗报告;设计文本-矩阵特征损失函数,优化多样化标签矩阵;增加特征交叉模块改进Transformer网络,加强图像与文本的映射,提升疾病描述的准确性。在IU-X-Ray和MIMIC-CXR两个数据集上进行实验,实验结果表明,与目前的主流方法相比,所提方法在BLEU,METEOR等多个指标上取得了最优的效果。
一种稳健的频率步进SAR距离向栅瓣抑制方法
高文斌
计算机科学. 2024, 51 (8): 209-216.  doi:10.11896/jsjkx.230600050
摘要 ( 52 )   PDF(4264KB) ( 249 )   
参考文献 | 相关文章 | 多维度评价
频率步进合成孔径雷达(Synthetic Aperture Radar,SAR)的系统传递函数中存在幅度和相位误差(Magnitude Error and Phase Error,MEPE),通过宽带合成操作在距离宽带信号中引入了周期性MEPE,从而导致宽带合成后的高分辨率距离像(HRRP)中出现周期性栅瓣。经过后续SAR成像处理,这些周期性栅瓣在图像中表现为虚假目标,严重影响SAR图像目标的检测与识别。为此,基于SAR图像的栅瓣抑制(Grating Lobe Suppression,GLS)算法被提出,其基于点状目标假设,利用SAR图像中的强点目标实现图像栅瓣的有效抑制。然而,对于非点状目标场景,已有基于SAR图像的GLS算法的性能显著下降,而且会引起图像散焦。因此,文中提出了一种基于目标信息差异的GLS算法,取名为目标信息差异法。该算法不基于点状目标假设,通过估计宽带合成后的理想HRRP与实际HRRP之间的信息差异,稳健地估计出合成宽带信号中的周期性MEPE。通过补偿该周期性MEPE,该算法可以将频率步进SAR距离向栅瓣抑制到图像的背景水平。通过对不同GLS算法进行性能对比发现,所提GLS算法受图像信杂比影响小,且同时适用于非点状目标和点状目标场景,相比已有GLS算法具有明显的优势。实测数据处理结果证明了所提方法的有效性和相对已有GLS算法的优越性。
基于双鉴别器和伪视频生成的视频异常检测方法
郭方圆, 吉根林
计算机科学. 2024, 51 (8): 217-223.  doi:10.11896/jsjkx.230600148
摘要 ( 71 )   PDF(2454KB) ( 257 )   
参考文献 | 相关文章 | 多维度评价
在无监督的视频异常检测任务中,通常使用深度自编码器在仅包含正常事件的数据集上进行训练,并根据重构(预测)误差来识别异常帧。然而,这种假设在实践中并不总是成立,有时自编码器对异常事件也可以进行很好的重构(预测),从而导致异常的误检测。为了解决这一问题,提出了一种基于双鉴别器和伪视频生成的视频异常检测方法,通过鉴别器和生成器之间的对抗训练来提高生成模型对正常帧的预测能力,并抑制生成模型对伪视频帧的预测能力。此外,在生成模型中引入协调注意力,以进一步提升模型的生成能力。同时,将以往方法中的预测未来帧改为预测中间帧,有利于模型学习前向和后向的运动信息,从而提升模型的检测性能。在公开数据集UCSD Ped2和CUHK Avenue上进行实验,结果表明,AUC值在两个公开数据集上分别达到了98.6%和85.9%,相比其他视频异常检测方法,所提方法可显著提高视频异常检测的性能。
基于原型修正的小样本半监督语义图像翻译算法
何知霖, 顾天昊, 徐冠华
计算机科学. 2024, 51 (8): 224-231.  doi:10.11896/jsjkx.230500038
摘要 ( 70 )   PDF(4476KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
图像翻译任务是计算机视觉领域一个重要的研究方向,在图像风格化、超分辨率图像生成等视觉领域都有着广泛的应用。针对图像翻译任务中语义信息标注成本高、数据集通常标注困难的问题,提出了一种基于原型修正的小样本语义图像翻译算法,该算法主要包含StyleGAN、语义相似度回归器、pSp编码器模块。首先,为了降低模型对标签图像的依赖,该算法使用StyleGAN预训练模型充当生成器,增加小样本场景下的训练样本数和提升模型生成的多样性。其次,考虑到样本语义类内差异,该算法设计语义相似度回归器对原型进行修正,提升伪标签的准确率,增强模型优化效果。然后,结合标签图像和合成图像的特征图以及原型向量,实现语义信息的循环合成,构建出自监督损失函数以避免语义相似度回归器训练的标签信息需求,并利用伪标签图像对pSp编码器继续进行训练,实现语义图像翻译任务。最后,实验结果验证了所提算法在泛化性能和合成图像的多样性方面均优于经典算法。
基于多模态注意力网络的红外人体行为识别方法
汪超, 唐超, 王文剑, 张靖
计算机科学. 2024, 51 (8): 232-241.  doi:10.11896/jsjkx.230600143
摘要 ( 102 )   PDF(7515KB) ( 329 )   
参考文献 | 相关文章 | 多维度评价
深度学习网络对红外单一模态数据的学习表征能力具有一定的局限性,针对该问题,文中提出了基于多模态注意力网络的红外人体行为识别方法。由于深度学习网络模型无法直接对视频信息进行训练和分类,首先,通过预处理模块将得到的视频信息预处理成红外视图,再将得到的红外视图通过Sobel算子和基于L1范数的全变分光流法分别提取红外视图的边缘信息和光流信息得到边缘视图和光流视图;其次,将红外视图、边缘视图、光流视图分别输入融合注意力机制模块的三流网络中进行特征学习;然后,对三流网络中每个网络提取的多模态特征进行融合;最后,将融合得到的特征向量输入随机森林进行训练和分类。在公开数据集NTU RGB+D和自建数据集上进行实验,结果表明了所提方法具有不错的识别效果。
人工智能
传统机器学习模型的超参数优化技术评估
李海霞, 宋丹蕾, 孔佳宁, 宋亚飞, 常海艳
计算机科学. 2024, 51 (8): 242-255.  doi:10.11896/jsjkx.230600164
摘要 ( 105 )   PDF(1676KB) ( 276 )   
参考文献 | 相关文章 | 多维度评价
合理的超参数能够保证机器学习模型适应不同背景和不同任务。为了避免在模型超参数数量过多、搜索空间过大的情况下出现手动调节导致的效率低下问题,多种超参数优化技术已经被研发并运用到机器学习模型训练中。文中首先回顾了8种常见的超参数优化技术,即网格搜索、随机搜索、贝叶斯优化、Hyperband、BOHB、遗传算法、粒子群优化算法和协方差矩阵自适应进化策略,并从时间性能、最终结果、并行能力、可拓展性、稳健性和灵活性5个方面分析各类方法的优缺点。其次,将8种方法应用到LightGBM、XGBoost、随机森林和KNN这4种传统机器学习模型上,在4个基准数据集上完成了回归、二分类和多分类的实验,对各类方法进行了比较。最后总结了各类方法的优缺点,给出了不同方法的适用情景。
基于对比学习的大型语言模型反向词典任务提示生成方法
田思成, 黄少滨, 王锐, 李熔盛, 杜治娟
计算机科学. 2024, 51 (8): 256-262.  doi:10.11896/jsjkx.230600204
摘要 ( 86 )   PDF(2523KB) ( 262 )   
参考文献 | 相关文章 | 多维度评价
反向词典任务是一种新兴的任务,目的是根据给定的定义来查找对应的单词。大规模语言模型为这一任务提供了新的可能性,但是提示语句的质量会影响大模型的性能。为此,提出了一种基于对比学习的提示生成方法。该方法在从多个语义层面上理解定义语义的同时,还利用对比学习的原理在训练过程中引入了负例,提升了模型的泛化能力。通过这种方法,可以将目标单词缩小到一个小范围内,然后用大模型从这个范围内选择最符合定义语义的单词。实验结果表明,该方法可以有效地提升大规模语言模型在反向词典任务上的表现。提示生成模型有 94.7% 的概率生成包含目标词的范围,大规模语言模型有 58.03% 的概率直接选出目标单词,有 74.55% 的概率在给出5个候选单词时包含目标单词。
基于多奖励强化学习的半监督文本风格迁移方法
李静文, 叶琪, 阮彤, 林宇翩, 薛万东
计算机科学. 2024, 51 (8): 263-271.  doi:10.11896/jsjkx.230600184
摘要 ( 74 )   PDF(2260KB) ( 242 )   
参考文献 | 相关文章 | 多维度评价
文本风格迁移是自然语言处理中的一项重要任务,其主要目的在于改变文本的风格属性,同时保留必要的语义信息。然而,在许多任务缺乏大规模平行语料库的情况下,现有的无监督方法存在文本多样性不足和语义一致性较差的问题。针对这些问题,文中提出了一种半监督的多阶段训练框架。该框架首先利用风格标注模型和掩码语言模型构造伪平行语料库,以有监督的方式引导模型学习多样性的迁移方式。其次,设计了对抗性相似奖励、Mis奖励和风格奖励,从未标记的数据中进行强化学习以增强模型的语义一致性、逻辑一致性和风格准确性。在基于YELP数据集的情感极性转换任务中,该方法的BLEURT分数提升了3.1%,Mis分数提升了2.5%,BLEU分数提升了9.5%;在基于GYAFC数据集的正式文体转换实验中,该方法的BLEURT分数提高了6.2%,BLEU分数提高了3%。
基于字词融合的低词汇信息损失中文命名实体识别方法
郭志强, 关东海, 袁伟伟
计算机科学. 2024, 51 (8): 272-280.  doi:10.11896/jsjkx.230500047
摘要 ( 72 )   PDF(2676KB) ( 280 )   
参考文献 | 相关文章 | 多维度评价
中文命名实体识别(CNER)任务是一种自然语言处理技术,旨在识别文本中具有特定类别的实体,如人名、地名、组织机构名等,它是问答系统、机器翻译、信息抽取等自然语言应用的基础底层任务。由于中文不具备类似英文这样的天然分词结构,基于词的NER模型在中文命名实体识别上的效果会因分词错误而显著降低,基于字符的NER模型又忽略了词汇信息的作用,因此,近年来许多研究开始尝试将词汇信息融入字符模型中。WC-LSTM通过在词汇的开始字符和结束字符中注入词汇信息,使模型性能获得了显著的提升。然而,该模型依然没有充分利用词汇信息,因此在其基础上提出了基于字词融合的低词汇信息损失NER模型LLL-WCM,对词汇的所有中间字符融入词汇信息,避免了词汇信息损失。同时,引入了两种编码策略平均(avg)和自注意力机制(self-attention)以提取所有词汇信息。在4个中文数据集上进行实验,结果表明,与WC-LSTM相比,该方法的F1值分别提升了1.89%,0.29%,1.10%和1.54%。
基于改进高斯混合变分自编码器的半监督情感音乐生成
胥备, 刘桐
计算机科学. 2024, 51 (8): 281-296.  doi:10.11896/jsjkx.230500124
摘要 ( 68 )   PDF(6507KB) ( 214 )   
参考文献 | 相关文章 | 多维度评价
音乐可以通过序列化的声音信息传递声音内容和情感。情感是音乐所表达的语义中的重要组成部分,因此,音乐生成技术不仅要考虑音乐的结构信息,还应融入情感元素。现有的情感音乐生成技术大多采用基于情感标注的完全监督方法,但音乐领域缺乏大量标准的情感标注数据集,且情感标签不足以表达音乐的情感特征。针对上述问题,提出了基于改进的高斯混合变分自编码器(Gaussian Mixture Variational Autoencoders,GMVAE)的半监督情感音乐生成方法(Semg-GMVAE),将音乐的节奏特征和调式特征与情感建立联系,同时向GMVAE中引入一种特征解纠缠机制来分别学习这两种特征的潜在变量表示,并对其进行半监督聚类推断。最后通过操纵音乐的特征表示,实现了针对快乐、紧张、悲伤、平静情感的音乐生成与情感转换。同时,针对GMVAE难以区分不同情感类别数据的问题,实验指出其关键原因是GMVAE证据下界中的方差正则项与互信息抑制项使得各类别的高斯分量分散性不足,从而影响学习表示的性能和生成的数据样本的情感质量。因此,Semg-GMVAE对这两项因子分别进行了惩罚和增强,并使用Transformer-XL作为编码器和解码器以提升在长序列音乐上的建模能力。基于真实数据集的实验结果表明,相比现有方法,Semg-GMVAE能够将不同情感的音乐在潜在空间中更好地分离,增强了音乐与情感的关联程度,并且能够有效对不同音乐特征进行解纠缠分离,最后通过改变特征表示更好地实现情感音乐生成或情感切换。
基于RoBERTa和加权图卷积网络的中文地质实体关系抽取
张鲁, 段友祥, 刘娟, 陆誉翕
计算机科学. 2024, 51 (8): 297-303.  doi:10.11896/jsjkx.230600231
摘要 ( 85 )   PDF(2448KB) ( 245 )   
参考文献 | 相关文章 | 多维度评价
知识是大数据和人工智能的基石,知识图谱的可解释性和可扩展性等优势使其成为智能系统的重要技术。智能决策在各个领域都有迫切的应用需求,为知识图谱提供基于数据分析和推理的决策支持和应用场景,但领域场景复杂、数据多源、知识维度广,因此知识图谱的构建和应用都面临着很多挑战。针对地质领域知识图谱构建过程中领域知识模式完备性差的问题,以及现有实体关系抽取方法在处理非欧氏数据时存在的不足,提出了一种基于图结构的实体关系抽取模型RoGCN-ATT。该模型使用RoBERTa-wwm-ext-large中文预训练模型作为序列编码器,结合BiLSTM获取更丰富的语义信息,使用加权图卷积网络结合注意力机制获取结构依赖信息,以增强模型对关系三元组的抽取性能。在地质数据集上F1值达78.56%,与其他模型的对比实验表明,RoGCN-ATT有效提升了实体关系抽取性能,为地质知识图谱的构建和应用提供了有力的支持。
基于标签传播增强的多通道图卷积网络
袁立宁, 冯文刚, 刘钊
计算机科学. 2024, 51 (8): 304-312.  doi:10.11896/jsjkx.240100139
摘要 ( 74 )   PDF(3151KB) ( 201 )   
参考文献 | 相关文章 | 多维度评价
多数图卷积网络(GCN)模型通过设计高效的信息传递和保留方式提升节点分类任务的实验表现,忽略了节点标签信息在拓扑空间和属性空间的传播。针对上述问题,提出了一种基于标签传播算法(LPA)增强的多通道图卷积模型MGCN-LPA,同时增大同类节点在属性和拓扑空间的关系权重,改善节点间特征和标签信息的传播。首先,计算不同节点的属性相似度值,并采用k近邻算法生成属性关系图;然后,利用结合了GCN和LPA的图卷积层GCN-LPA提取属性图和属性关系图的潜在特征,生成拓扑节点表示和属性节点表示;最后,将拓扑和属性表示进行融合,并将生成的最终表示用于节点分类任务。在3个基准图数据集上进行实验,MGCN-LPA的实验表现能够匹配当前较为先进的基线模型,其在Cora和Citeseer数据集上的分类结果相比表现最优的基线模型提升了9.3%和12%。上述实验结果表明,MGCN-LPA能够增大同类节点间路径的权重,从而增强同类节点间的信息传递,提升节点分类任务的实验表现。此外,消融实验结果表明,与仅使用拓扑空间或者属性空间信息的变体相比,融合两类信息的MGCN-LPA能够充分提取和保留原始图中蕴含的潜在特征,提升模型的表征能力和泛化性。
基于知识图谱与邻域感知注意力机制的推荐算法研究
陈珊珊, 姚苏滨
计算机科学. 2024, 51 (8): 313-323.  doi:10.11896/jsjkx.230500143
摘要 ( 94 )   PDF(2709KB) ( 249 )   
参考文献 | 相关文章 | 多维度评价
为解决传统推荐算法在面对数据稀疏的推荐任务时产生的冷启动问题,本研究将知识图谱引入推荐算法,结合一种新的邻域感知注意力机制代替传统图注意力机制来挖掘实体间的高阶连通信息,提出了基于知识图谱和邻域感知注意力机制的推荐模型KGNPAN。得益于知识图谱可使推荐具有精准、多样和可解释的特点,该模型能够很好地缓解数据稀疏与冷启动问题。首先利用基于自对抗负采样的图嵌入方法RotatE对原有物品和用户表征的语义信息进行扩充,将实体和关系向量映射成低维嵌入向量;其次,根据协同邻居的不同类型分别应用邻域感知注意力机制聚合邻居节点信息,丰富目标节点语义,并以卷积形式递归挖掘高阶连通信息;最后对用户与项目向量应用内积操作计算交互概率,得到推荐结果。在Amazon-book和Last-FM两个公共基准数据集上进行实验,结果表明,在与CKE,BPRMF,RippleNet,KGAT,KGCN和CAKN 6个基准模型的对比中,KGNPAN相较于基准模型中结果最优的CAKN模型,在召回率(Recall)上分别提升了1.30%和1.37%,在归一化折损累计增益上(NDCG)分别提升了1.26%和1.14%,充分验证了其有效性和可解释性。
用于时变矩阵计算的固定时间递归神经网络及其在重复运动规划中的应用
李杏, 仲国民
计算机科学. 2024, 51 (8): 324-332.  doi:10.11896/jsjkx.230500052
摘要 ( 58 )   PDF(4022KB) ( 229 )   
参考文献 | 相关文章 | 多维度评价
文中提出了具有对数调节时间的固定时间收敛递归神经网络(Recurrent Neural Network,RNN)模型,用于求解时变矩阵计算问题。设计并详细分析了两个新颖的RNN模型,推导出在给定初始条件下模型调节时间函数的精确表达式;并给出任意初始条件下调节时间函数的上界。相比现有的固定时间收敛的RNN模型,两个新颖的模型具有对数调节时间,其调节时间上界更小,收敛速度更快。考虑到初始误差实际上在一个有界的区域内,给出RNN模型半全局对数调节时间函数,并由此推导出半全局意义上的调节时间函数的上界。采用RNN模型半全局调节时间上界的倒数,提出半全局预定时间收敛到精确解的改进RNN模型,其预定时间是一个可调参数。给出了所提RNN模型对时变Lyapunov方程和时变Sylvester方程求解的仿真结果,并将其应用于具有初始误差的冗余机械臂的重复运动规划,进一步验证了所提RNN模型的有效性。
基于RNN信息累积的动态多目标优化算法
程雪峰, 董明刚
计算机科学. 2024, 51 (8): 333-344.  doi:10.11896/jsjkx.230500046
摘要 ( 88 )   PDF(6826KB) ( 246 )   
参考文献 | 相关文章 | 多维度评价
动态多目标优化问题广泛存在于现实生活中,在环境发生变化后,进化算法需具备快速收敛、快速追踪帕累托最优前沿和维持多样性的能力。对于环境变化程度严重且变化频繁的情况,传统的预测方法无法有效获得帕累托最优前沿解。针对该问题,提出了一种基于循环神经网络(Recurrent Neural Networks,RNN)信息累积的动态多目标优化算法(IA-RNN)。首先,提出了一种基于RNN信息累积的非线性预测方法,利用RNN递归进行信息累积,提高了历史信息利用率,增强了预测的能力。其次,设计了一种基于个体的线性预测方法,利用参数矩阵对个体线性变化进行预测。线性预测与RNN非线性预测协同进化,可快速追踪帕累托最优前沿。最后,设计了一种基于最小二乘法的参数修正策略,通过当前环境的近似帕累托最优前沿解反向指导参数修正,减小了误差堆积的影响。将IA-RNN与5种代表性动态多目标优化算法在14个DF基准测试问题上进行比较。实验证明,IA-RNN算法的收敛性和多样性更优。
计算机网络
多天线无线充电器的安全布置研究
任美璇, 邓鹏, 赵悦, 汪笑宇, 王超, 戴海鹏, 吴黎兵
计算机科学. 2024, 51 (8): 345-353.  doi:10.11896/jsjkx.240400156
摘要 ( 103 )   PDF(3250KB) ( 224 )   
参考文献 | 相关文章 | 多维度评价
多天线无线充电器的安全布置问题(SPINNER)涉及给定一组无线可充电设备和一组无线充电器,每个充电器都配备了多根有向天线,需确定其功率水平和策略(包括充电器的位置和天线方向),以最大化整体充电效用,并确保目标区域内任意位置均满足电磁辐射安全约束。文中考虑了两种场景,分别是具有给定位置集的多天线无线充电器的安全布置(SPINNER-G)和具有任意点的多天线无线充电器的安全布置(SPINNER-A)。首先,采用分段常数函数近似非线性充电功率函数,并将二维区域划分为有限数量的子区域,使得无限的电磁辐射安全约束减少为有限个。然后,针对SPINNER-G,提出了一种最大覆盖集提取方法,以限制无线充电器的方向。针对SPINNER-A,构造了最大相交情况,以限制充电器的位置和方向。文中提出了两种基于线性规划的贪心方案,分别求解SPINNER-G和SPINNER-A,近似比均为1/2-ε。仿真结果表明,所提算法在充电效用方面相比3种对比算法至少提高了54.2%。
时间敏感网络中的可变长整形队列调整算法
蔡嫦娟, 庄雷, 杨思锦, 王家兴, 阳鑫宇
计算机科学. 2024, 51 (8): 354-363.  doi:10.11896/jsjkx.230500214
摘要 ( 69 )   PDF(2361KB) ( 226 )   
参考文献 | 相关文章 | 多维度评价
针对异步整形器(ATS)采用固定长度整形队列实现流量整形存在缓存资源利用率低、可调度流平均时延高等问题,提出了一种基于改进磷虾群算法与流量预测的可变长整形队列调整算法。综合考虑流的队列分配规则、有界时延需求及有限缓存资源,定义时间敏感网络中可调度流传输约束。引入混沌映射、反向学习与精英策略并设计自适应位置更新策略以提升传统磷虾群算法的求解能力,利用改进磷虾群算法寻找整形队列可调整上限。基于卷积神经网络与长短期记忆模型(CNN-LSTM)预测流量,根据预测值计算队列长度调整步幅。仿真结果表明,与采用固定长度整形队列的方法相比,所提算法能有效提高可调度流数量,降低调度流(ST)平均时延,并提升网络缓存资源利用率。
基于Websocket协议的车联网隐蔽信道构建
赵辉, 彭建友, 秦玉林, 韩利利
计算机科学. 2024, 51 (8): 364-370.  doi:10.11896/jsjkx.230500037
摘要 ( 57 )   PDF(2273KB) ( 192 )   
参考文献 | 相关文章 | 多维度评价
针对传统车联网协议下的隐蔽信道构建方式单一、无法适用于复杂网络环境的问题,通过分析轻量级物联网应用层协议Websocket的数据帧格式和通信机制,提出了一种基于Websocket协议的车联网隐蔽信道构建方法。该方法利用信息分离聚合算法将待发送的隐蔽信息进行多维传输,以提升隐蔽信道的传输速率和抗暴露性。同时,考虑到车联网网络的动态拓扑特性,基于跳频技术自适应变换信息分离聚合方式和编码映射表。为了提高信道的隐蔽性,通过最小二乘算法模拟了正常网络流量的传输特性。仿真实验结果表明,所构建的隐蔽信道在面对较差的网络环境时,受到的网络波动影响较小,具有较好的鲁棒性;并且相较于单一维度传输的隐蔽信道,在隐蔽性和传输速率方面有一定的提升。
信息安全
域名生成算法检测技术综述
汪绪先, 黄缙华, 翟优, 李础南, 王宇, 张宇鹏, 张翼鹏, 杨立群, 李舟军
计算机科学. 2024, 51 (8): 371-378.  doi:10.11896/jsjkx.230700189
摘要 ( 86 )   PDF(1670KB) ( 247 )   
参考文献 | 相关文章 | 多维度评价
C&C服务器是网络攻击者用于控制僵尸主机的中间服务器,在僵尸网络中处于核心位置。为增强C&C服务器的隐蔽性,网络攻击者使用域名生成算法来隐藏C&C服务器地址。近年来,域名生成算法检测技术作为检测僵尸网络的重要手段,已经成为一个研究热点。首先,介绍了当前网络安全的发展态势和僵尸网络的拓扑结构。其次,介绍了域名生成算法和相关数据集。接着,介绍了域名生成算法检测技术的分类,并对这些检测技术进行总结综述。最后,探讨了现阶段域名生成算法检测技术存在的问题,并对未来研究方向进行了展望。
面向物联网僵尸网络多阶段攻击的异常流量检测方法
陈亮, 李志华
计算机科学. 2024, 51 (8): 379-386.  doi:10.11896/jsjkx.230700197
摘要 ( 71 )   PDF(2535KB) ( 200 )   
参考文献 | 相关文章 | 多维度评价
针对如何从海量的网络流量数据中高效检测出物联网僵尸网络多阶段攻击行为,提出了一种基于多尺度混合残差网络(Multi-scale Hybrid Residual Network,MHRN)的物联网僵尸网络攻击检测(IoT Botnet Attack Detection based on MHRN,IBAD-MHRN)方法。首先,为了减少检测模型的计算参数,在数据预处理中提出基于方差阈值法的特征选择(Feature Selection based on Variance Threshold,FS-VT)算法;其次,采取一种将数据样本转换为图像样本的数据图像化处理策略,充分挖掘深度学习模型的潜能;然后,为了弥补传统僵尸网络检测模型表征能力有限的不足,提出了一种基于多尺度混合残差网络的物联网僵尸网络多阶段攻击检测模型,该模型通过混合方式融合了不同尺度深度提取的特征信息,再通过残差连接消除网络加深造成的网络退化影响;最后,集成上述模型和算法,进一步提出了一种物联网僵尸网络攻击检测方法IBAD-MHRN。实验结果表明,IBAD-MHRN方法的检测准确率和F1值均达到了99.8%,与表现较好的卷积神经网络方法相比在准确率和F1值上分别有0.14%和0.36%的提升,能够有效且高效地检测物联网僵尸网络多阶段攻击。
基于同态加密的隐私保护主成分分析方法
张金斗, 陈经纬, 吴文渊, 冯勇
计算机科学. 2024, 51 (8): 387-395.  doi:10.11896/jsjkx.230800177
摘要 ( 75 )   PDF(1635KB) ( 192 )   
参考文献 | 相关文章 | 多维度评价
在现实生活中,不同的行业之间,甚至同行业不同部门之间的数据并不互通,随着计算机算力的提升,制约模型训练效果的不是算力而是数据量。因此,想要得到更好的算法模型,仅靠某一方的数据是不够的,需要两方或者多方的参与,这就要求对各方的数据进行隐私保护。除此之外,随着收集的数据越来越详细,数据的维数也越来越大。面对高维的数据,数据降维是不可缺少的环节,而在数据降维方面,主成分分析(Principal Component Analysis,PCA)是常用的手段。当拥有数据的两方想要合作进行隐私保护的数据降维时,同态加密技术是一种解决办法。同态加密技术可以在保护数据隐私的前提下对加密数据进行计算,可以用在加密数据的PCA上。针对上述应用场景,利用CKKS同态加密方案,通过幂法迭代的SVD技术设计了一种两方加密数据进行PCA的方案,在保护两方数据隐私的前提下实现数据降维的目的;通过改进传统幂法迭代步骤,避免了代价高昂的同态密文除法运算,使得在选取较小的加密参数时,也能支持更多的幂法迭代次数,从而在缩短同态计算时间的同时提高计算精度。在公共数据集上进行测试,并与现有方案进行对比,该方案在计算耗时上缩短了约80%,与明文计算结果的均方误差缩减到1%以内。
基于注意力机制的CNN和BiGRU的加密流量分类
陈思雨, 马海龙, 张建辉
计算机科学. 2024, 51 (8): 396-402.  doi:10.11896/jsjkx.230500032
摘要 ( 91 )   PDF(3040KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
针对传统加密流量分类方法准确率低、利用流量载荷会侵犯用户隐私,以及泛化能力弱的问题,提出一种基于注意力机制的CNN和BiGRU(CNN-AttBiGRU)的加密流量分类方法,可以同时适用于常规加密和VPN、Tor加密流量。该方法基于包大小、包到达时间以及包到达方向将流量转化为直观的图片,为提高模型准确率,使用CNN提取流量图片的空间特征,同时设计BiGRU和Self-attention模型提取时间特征,充分利用流量图片的时间和空间特征,可按照流量类别、加密技术和应用类型对流量进行不同层面的分类。该方法对加密流量类别分类的平均准确率达95.2%,较以往提升11.65%;对加密技术分类的准确率达95.5%,较以往提升7.1%;对流量所使用的应用程序分类的准确率达99.8%,较以往提升11.03%。实验结果表明,CNN-AttBiGRU方法的泛化能力强,并且其仅利用加密流量的部分统计特征,有效地保护了用户隐私,同时取得了高准确率。
基于门限签名的时间轮换公证人组模型研究
臧文洋, 吕进来
计算机科学. 2024, 51 (8): 403-411.  doi:10.11896/jsjkx.230500060
摘要 ( 70 )   PDF(2073KB) ( 194 )   
参考文献 | 相关文章 | 多维度评价
随着各类区块链系统的不断涌现,跨链交互需求不断增加,跨链桥验证环节的安全性显得愈发重要。公证人机制原理简单、效率较高,常用于跨链交易验证、跨链交易确认等环节。但公证人机制存在去中心化程度低、低签名比例可验证交易、验证节点信息公开等问题。为提高跨链桥验证环节的安全性,提出了一种基于门限签名的时间轮换公证人组模型。该模型中的公证人组由同时拥有源区块链和目标区块链账户的高信用值节点组成。公证人组中的验证节点有任期要求且需质押保证金,公证人组采用门限签名技术对跨链交易进行签名,一半以上的验证节点签名后,跨链交易才能实施;候选公证人组为时间轮换公证人组提供新验证节点。分析结果表明,所提模型去中心化程度高,验证节点恶意攻击率低,验证签名环节安全性高,验证节点私密性高,跨链消息验证效率高。
基于主被动结合的新型UDP反射放大协议识别方法
陈宏伟, 尹小康, 盖贤哲, 贾凡, 刘胜利, 蔡瑞杰
计算机科学. 2024, 51 (8): 412-419.  doi:10.11896/jsjkx.230500227
摘要 ( 56 )   PDF(2561KB) ( 191 )   
参考文献 | 相关文章 | 多维度评价
反射放大攻击因具有优质的流量倍增能力和反追踪溯源能力正逐步成为主流的DDoS攻击手段。近年来不断涌现以OpenVPN等物联网协议为代表的新型UDP反射放大攻击方法,并且呈现出多协议组合反射放大的趋势。然而,当前UDP反射放大检测方法存在检测结果不准确、检测效率不足等问题。针对上述问题,为提升UDP反射放大检测能力,提出了一种基于主被动结合的新型UDP反射放大协议识别方法。首先,通过主动探测的方法获取已知的物联网反射放大协议流量,并将其作为实验数据集;其次,在流量自动化分析过程中使用双重阈值判定和多元特征匹配方法捕获未知的反射放大协议和触发方式;最后,通过重放的方式进行验证。实验结果表明,该方法可有效检测UDP反射放大流量,精度达到99.88%,并且发现了QUIC协议潜在的反射放大能力,有效提升了反射放大攻击的防护能力。
针对网络流量测量的完整性干扰攻击与防御方法
郑海斌, 刘欣然, 陈晋音, 王鹏程, 王楦烨
计算机科学. 2024, 51 (8): 420-428.  doi:10.11896/jsjkx.230500101
摘要 ( 75 )   PDF(3799KB) ( 216 )   
参考文献 | 相关文章 | 多维度评价
近年来,网络测量在评估网络状态、提高网络自适应能力方面取得了较好的性能,被广泛运用于网络管理中。然而,目前的大规模网络中存在异常行为导致的网络流量数据污染问题。例如,自治系统中的恶意节点通过伪造恶意流量数据来故意操纵网络指标,影响网络测量,误导下游任务决策。基于此,首先提出完整性干扰攻击方法,通过修改流量矩阵的最小代价,利用多策略干扰生成器生成恶意扰动流量的攻击策略,实现干扰流量测量的目的。然后,通过一种混合对抗训练策略,设计在网络中抵御此类攻击的防御方法,实现流量测量模型的安全加固。实验中对攻击目标进行了相应的限定,验证了完整性干扰攻击在受限场景下的攻击有效性。并通过混合训练的方式进行对比实验,验证了常规模型的加固方法可以提升模型的鲁棒性。
基于HotStuff的高效量子安全拜占庭容错共识机制
程安东, 谢四江, 刘昂, 冯艺萌
计算机科学. 2024, 51 (8): 429-439.  doi:10.11896/jsjkx.230600200
摘要 ( 65 )   PDF(2369KB) ( 225 )   
参考文献 | 相关文章 | 多维度评价
经典区块链中拜占庭容错共识机制使用的公钥数字签名在量子计算机的指数级加速下暴露出脆弱性,存在一定的安全风险。针对拜占庭容错共识机制不具有量子安全性的问题,提出了基于HotStuff的高效量子安全拜占庭容错共识机制EQSH(Efficient Quantum-Secured HotStuff)。首先,为解决现有无条件安全签名(Unconditionally Secure Signatures,USS)通信复杂度高的问题,提出了一种高效的多方环形量子数字签名(Efficient Multi-party Ring Quantum Digital Signatures,EMRQDSs)方案,该方案基于一种环形量子网络,在保证量子安全性、不可伪造性、不可抵赖性以及可转移性的同时,通信复杂度为O(n)。其次,为了消除量子敌手对门限签名的安全威胁,对HotStuff中使用的门限签名进行替换,提出了一种基于密钥分发中心的签名收集方案,该方案可以实现与门限签名同样的效果,通信复杂度为O(n),同时保证了量子安全性。最后,将上述两个方案相结合,应用于HotStuff中,提供了量子安全性;设计了一个起搏器保证了活性;简化了共识信息格式,使用流水线共识流程提高了共识效率。EQSH中没有使用量子纠缠等成本较高的技术,可在现有技术条件下实现,实用价值较高。相较于HotStuff,EQSH具有量子安全性。相较于其他非纠缠型量子安全拜占庭容错共识机制,EQSH首次将通信复杂度降为O(n),具有更佳的性能表现,且对于客户端量子线路数量的需求更低,有利于降低量子网络的架设成本。
一种基于国密算法的区块链无证书加密机制
向宴颉, 黄晓芳, 向科峰, 郑继楠
计算机科学. 2024, 51 (8): 440-446.  doi:10.11896/jsjkx.230400203
摘要 ( 117 )   PDF(1743KB) ( 261 )   
参考文献 | 相关文章 | 多维度评价
区块链因具有分布式、不可篡改和不变性的特点而广受关注,但区块链中使用的国际密码算法存在一定的后门安全隐患。现基于国密算法SM2,结合无证书密码机制,提出了一种基于区块链的无证书公钥加密(Certificateless Public Key Encryption,CL-PKE)方案。该方案不依赖双线性配对,降低了计算成本,消除了证书管理和密钥托管问题,并且利用区块链不可篡改和可追溯的优点,实现了用户对公钥的更新与撤销,同时能够对抗无证书机制中的Type-1和Type-2型敌手。该方案基于计算性Diffie-Hellman问题(Computational Diffie-Hellman Problem,CDHP)的困难性,在随机预言模型中被证明在自适应选择密文攻击下具有不可区分性。最后进行性能分析与测试,结果表明,与现有CL-PKE方案相比,该方案的计算效率至少提升11%。