1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2023年第11A期, 刊出日期:2023-11-16
  
封面下载
目录
第50卷第11A期目录
计算机科学. 2023, 50 (11A): 0-0. 
摘要 ( 402 )   PDF(569KB) ( 298 )   
相关文章 | 多维度评价
人工智能
基于深度强化学习的四旋翼无人机自主控制方法
梁吉, 王立松, 黄昱洲, 秦小麟
计算机科学. 2023, 50 (11A): 220900257-7.  doi:10.11896/jsjkx.220900257
摘要 ( 293 )   PDF(3016KB) ( 411 )   
参考文献 | 相关文章 | 多维度评价
随着无人机的广泛应用,无人机控制器的设计成为近年来广泛研究的热点。当前无人机中广泛使用的PID,MPC等控制算法受到参数难调节、模型构建复杂、计算量大等一系列因素的制约。针对上述问题,提出了一种基于深度强化学习的无人机自主控制方法。该方法通过神经网络拟合无人机控制器,直接将无人机的状态映射到舵机的输出以控制无人机运动,在不断与环境进行交互训练中即可得到一个通用的无人机控制器,有效地避免了参数调节、模型构建等复杂操作。同时,为进一步提高模型的收敛速度和准确性,在传统强化学习算法Soft Actor Critic(SAC)的基础之上引入专家信息,提出了ESAC算法,指导无人机对环境进行探索,以增强控制策略的易用性和扩展性。最后在无人机的位置控制以及轨迹跟踪任务中,通过与传统PID控制器和SAC,DDPG等强化学习算法构建的模型控制器进行对比,实验结果表明,通过ESAC算法构建的控制器能够达到与PID控制器同样甚至更优的控制效果,同时在稳定性和准确性上优于SAC和DDPG构建的控制器。
基于图卷积网络的甲型流感H3N2抗原性预测
何明龙, 赵锟, 李维华, 李川
计算机科学. 2023, 50 (11A): 230100113-6.  doi:10.11896/jsjkx.230100113
摘要 ( 323 )   PDF(2503KB) ( 236 )   
参考文献 | 相关文章 | 多维度评价
流感病毒血凝素蛋白的持续和累积变化会产生新的抗原株,能够逃避人类免疫并引起季节性流感或流感大爆发。及时识别新的抗原变异体,对疫苗筛选和流感预防是至关重要的。图嵌入模型在部分数据缺失的情况下仍然可以实现有效的相互关系建模。针对甲型流感病毒H3N2,提出一种基于图卷积神经网络的抗原性预测方法,获取流感毒株低维稠密嵌入向量,同时对序列信息进行编码并作为补充特征,利用深度神经网络模型对特征进行融合并学习关键的抗原特征,完成抗原性预测。在两个数据集上的实验结果表明,该方法相比其他同类方法,显著提升了抗原相似性预测性能,具有良好的鲁棒性和可扩展性。此外,从实验中还可以看出,图卷积神经网络可以有效地获取抗原相似关系的抗原特征。
基于原型回放和动态更新的类增量学习方法
张禹, 曹熙卿, 钮赛赛, 许鑫磊, 张倩, 王喆
计算机科学. 2023, 50 (11A): 230300012-7.  doi:10.11896/jsjkx.230300012
摘要 ( 308 )   PDF(2982KB) ( 350 )   
参考文献 | 相关文章 | 多维度评价
灾难性遗忘问题在增量学习场景中普遍存在,而对旧知识的遗忘会严重影响模型在整个任务序列上的平均性能。因此,针对在增量学习过程中原型偏移引起的旧知识遗忘问题,提出了一种基于原型回放和动态更新的类增量学习方法。该方法在原型更新阶段保留新类的原型后,进一步采用动态更新策略对旧类的原型进行实时更新。具体地,在学习新任务后,该策略基于当前可访问数据的已知偏移,来实现在旧类原型中存在的未知偏移的近似估计,并最终完成对旧类原型的更新,从而缓解原始的旧类原型与当前的特征映射间的不匹配。在CIFAR-100和Tiny-ImageNet数据集上的实验结果表明,所提出的基于原型回放和动态更新的类增量学习方法能够有效地减少对旧知识的灾难性遗忘,提高模型在类增量学习场景中的分类性能。
复杂约束下单集装箱装载问题的改进元启发式算法
刘日鑫, 秦威, 许鸿伟
计算机科学. 2023, 50 (11A): 221200091-10.  doi:10.11896/jsjkx.221200091
摘要 ( 117 )   PDF(3724KB) ( 294 )   
参考文献 | 相关文章 | 多维度评价
三维单集装箱装载问题(Three-dimensional Single Container Loading Problem,3D-SCLP)因其在制造业和物流业中有着广泛的应用,已成为最优化领域中最经典的工程问题之一。然而,目前的优化方案主要从算法优化改进与局部约束调整等角度考虑,没有充分考虑实际装载过程中的复杂约束需求,如重量限制、负载平衡、货物稳定性、堆叠约束以及人因工程因素,导致现有方法理论装载率虽高,但实用性低。在充分考虑实际多重复杂约束的基础上,提出了一种基于天鹰座优化器的改进元启发式算法。该算法基于种群优化策略,并将差分变异和高斯扰动与潜在点策略相结合,实现复杂约束情况下的快速收敛。在中等规模工业实例数据上进行了算法验证,与传统启发式优化方法相比,所提方法能够解决中等规模复杂约束下的三维装箱优化问题,在实际空间利用率、生成效率等方面优于现有的解决方案。对物流运输行业减少人工成本,实现装箱标准化与智能化具有重要意义。
基于DPCNN和多学习模式损失的富上下文反讽识别
刘畅, 朱焱
计算机科学. 2023, 50 (11A): 230200067-5.  doi:10.11896/jsjkx.230200067
摘要 ( 145 )   PDF(2479KB) ( 233 )   
参考文献 | 相关文章 | 多维度评价
反讽作为一种层次丰富且复杂的语言表达方式,广泛存在于人们的日常表达和社交平台中。在电子商务、事件话题分析等方面,准确检测评论文本是否具有反讽意图对判断评论者情感倾向、对评论主体的好恶至关重要。研究针对会话上下文、用户上下文、主题上下文这3类反讽上下文语境,构建上下文语境丰富的反讽检测模型。针对传统浅层CNN难以捕获句子远距离依赖的问题,所提模型引入DPCNN架构捕获语句远程关联信息,并融合双向注意力机制学习会话上下文中的不协调信息。考虑到现实的数据样本中反讽类型数量少、反讽表达层次不均衡,还提出一种多学习模式的非对称损失函数,来解决样本类别不平衡、难易样本优先学习的问题。通过在3个公开反讽数据集上进行验证实验,结果表明所提模型在ACC、F1和AUC指标上均优于基准模型,最高超出2.5%。消融实验证明所提模型各个模块以及多学习模式损失函数均能提升反讽检测的性能。
基于空间域和频率域特征融合的场景文本识别
霍华骑, 陆璐
计算机科学. 2023, 50 (11A): 230300101-8.  doi:10.11896/jsjkx.230300101
摘要 ( 356 )   PDF(2783KB) ( 246 )   
参考文献 | 相关文章 | 多维度评价
对于小样本语言无关场景的文本识别,现有的方法往往面临鲁棒性低和泛化能力差的问题。针对这一问题,一方面,在特征提取阶段,提出了基于空间域和频率域特征融合的双流网络结构,其包含一个提取空间域特征的深度残差卷积网络分支,以及提取频率域特征的一维快速傅里叶变换和浅层神经网络分支,接着使用通道注意力机制融合这两种特征。另一方面,在序列建模阶段,针对语言无关场景的特点,提出一种多尺度一维卷积模块用来代替双向长短期记忆网络。然后结合现有的TPS矫正模块和CTC解码器搭建完整模型。训练过程中采用了迁移学习的方法,先在大型英文数据集上进行预训练,后在目标数据集上进行微调。在文中整理的两个小样本语言无关数据集上的实验结果表明,所提模型在准确率上优于现有的模型,验证了其在该场景下的具有较高的鲁棒性和泛化能力;此外,在语言相关场景的5个基准数据集上的相关实验(不用微调)表明,使用文中所述特征提取模块的方法优于对比的基线方法,证明了所提出的双流特征融合网络的有效性和通用性。
翻译错误类分布加权的专利译文自动后编辑集成模型
赵三元, 王裴岩, 叶娜, 赵欣瑜, 蔡东风, 张桂平
计算机科学. 2023, 50 (11A): 230300072-8.  doi:10.11896/jsjkx.230300072
摘要 ( 116 )   PDF(2927KB) ( 223 )   
参考文献 | 相关文章 | 多维度评价
自动后编辑(APE)是一种自动修改机器译文错误的方法,能够改善机器翻译系统的译文质量。目前,APE研究主要集中于通用领域,然而对于专业性强和译文质量要求较高的专利译文的APE则鲜有研究。文中研究了专利译文自动后编辑,提出了翻译错误类分布加权的专利译文自动后编辑集成模型。首先,提出术语加权翻译编辑率(WTER)计算方法,在翻译编辑率(TER)中加入了每个词的术语概率因子,使术语错误较多的样本WTER值较高。然后,通过WTER从3个机器翻译系统构造的训练数据中选择错译、漏译、增译与移位错误样本子集分别构建错误修正偏向性APE子模型。最后,通过翻译错误类分布加权错误修正偏向性APE子模型。该方法针对专利专业性、强术语较多的特点,每个子模型分别面向一类错误,考虑了错误修正的偏向性,通过模型集成兼顾了译文错误多样性,在英中专利摘要数据集上的实验结果表明,相比3个基线系统,所提方法的BLEU值分别平均提升了2.52,2.28和2.27。
基于话题注意力和依存句法信息的文本立场分析
康书铭, 朱焱
计算机科学. 2023, 50 (11A): 230200068-5.  doi:10.11896/jsjkx.230200068
摘要 ( 109 )   PDF(1843KB) ( 202 )   
参考文献 | 相关文章 | 多维度评价
文本立场分析旨在从用户发表的文本中推测其对特定话题的看法,如支持、反对、中立等态度。传统的立场分析研究往往采用卷积神经网络或者长短时记忆网络等深度学习模型学习文本的基本语义信息,忽略了文本蕴含的句法结构信息。针对这一问题,文中设计实现了基于话题注意力和依存句法的文本立场检测模型——AT-BiLSTM-GAT,在BiLSTM提取的文本上下文信息基础上,采用GAT进一步学习文本语言学层次的依存句法信息。同时设计实现一种融合上下文语义信息的话题注意力机制,采用缩放点积注意力学习立场文本中与话题相关的重要内容,在公开数据集上的对比实验证明了AT-BiLSTM-GAT模型的高效性。最后,针对立场分析研究数据集存在规模较小的问题,设计实现了一种基于WordNet同义词库与WebVectors词嵌入模型的同义词替换数据增强方案WWDA,保证了同义词替换过程的词性正确性和语义相似性,通过实验证明其可以生成更多高质量样本,提升模型的检测性能。
基于特征融合的无标复句关系识别
杨进才, 马晨, 肖明
计算机科学. 2023, 50 (11A): 221100065-6.  doi:10.11896/jsjkx.221100065
摘要 ( 263 )   PDF(1833KB) ( 224 )   
参考文献 | 相关文章 | 多维度评价
无标复句因缺少关联词的辅助,其关系识别为自然语言处理中的一项较为困难的任务。将词性特征融入到词向量中,训练得到含有外部特征的词向量表示,通过组合BERT模型与BiLSTM模型,将字向量、词向量、词性向量结合进行训练,并在特征融合层添加BiLSTM模型捕获的极性特征信息以及CNN模型捕获的依存句法特征信息。实验结果表明,该方法在汉语复句分类上取得了较好的效果,与基准模型相比在宏F1值与微F1值上均有提升,在顶层分类上取得了83.67%的微F1值,在第二层分类上取得了68.28%的微F1值。
中文工艺规范文本分词语料的构建与研究
王裴岩, 张莹欣, 付小强, 陈佳欣, 徐楠, 蔡东风
计算机科学. 2023, 50 (11A): 221200070-6.  doi:10.11896/jsjkx.221200070
摘要 ( 235 )   PDF(2038KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
中文分词是处理工艺规范文本的一项基本任务,并且在工艺知识图谱与智能问答等下游任务中发挥着重要作用。工艺规范文本分词面临的一个挑战是缺乏高质量标注的语料,特别是面向术语、名词短语、工艺参数、数量词等特殊语言现象的分词规范。文中面向工艺规范文本制定了专用分词规范,收集并标注了一个中文工艺规范文本分词语料(WS-MPST),含11 900个句子与255 160个词,4名标注者分词标注一致性达95.25%。在WS-MPST语料上对著名的BiLSTM-CRF与BERT-CRF模型进行了对比实验,F1值分别达到92.61%与93.69%。实验结果表明,构建专用的工艺规范分词语料是必要的。对实验结果的深入分析揭示了未登录词与中文非中文字符混合构成的词是工艺规范文本分词的难点,也为今后工艺规范文本及相关领域的分词研究提供了一定的指导。
融合迭代式关系图匹配和属性语义嵌入的实体对齐方法
迟棠, 车超
计算机科学. 2023, 50 (11A): 230200041-6.  doi:10.11896/jsjkx.230200041
摘要 ( 139 )   PDF(2411KB) ( 267 )   
参考文献 | 相关文章 | 多维度评价
实体对齐是知识融合中的关键步骤,用于解决多源知识图谱中实体冗余、指代不明等问题。目前,大多数的实体对齐方法主要依赖于邻域网络,而忽略了关系间的连通以及属性信息,导致模型无法捕捉到复杂关系,额外信息也没有被充分利用。针对上述问题,提出一种迭代式关系图匹配和属性语义嵌入的实体对齐方法,将〈头实体,关系,尾实体〉进行转置,生成〈头关系,实体,尾关系〉构建,与实体图相对应的关系图,接着利用注意力机制编码实体和关系表示,二者通过相互迭代,能够更好地表示实体,再融合属性表示最终判定两个实体是否对齐。实验结果表明,本模型在DBP15K 3个跨语言数据集中显著优于其他6种方法,相比于最好方法Hit@1指标提升了4%,证明了关系匹配和属性语义的有效性。
基于BERT和多特征门控机制的口语理解联合方法
王志明, 郑凯
计算机科学. 2023, 50 (11A): 230300002-6.  doi:10.11896/jsjkx.230300002
摘要 ( 347 )   PDF(2135KB) ( 257 )   
参考文献 | 相关文章 | 多维度评价
意图分类和槽位填充是口语理解任务的两个子任务,用于在对话系统中识别文本序列的意图以及从文本序列中提取出能进一步确定意图具体内容的槽位信息。近些年的研究表明,这两个任务具有相关性,且可以相互促进。然而,现有的大多数联合方法仅利用单一特征简单地通过共享参数建立两者之间的关联,而这往往会导致模型泛化能力差及特征利用程度低等问题。针对这些问题,提出了一种新的联合模型。模型在BERT的基础上引入了意图特征提取层和槽位特征提取层用于进一步提取文本特征,以增强文本向量表示能力,并通过多特征门机制融合了多方特征,充分利用两个任务之间的语义关系预测标签。在公开数据集ATIS和SNIPS上的实验结果表明,提出的模型能有效提升意图分类和槽位填充的性能,相比已有方法取得了更优的结果。
基于MacBERT和对抗训练的审计文本命名实体识别
钱泰羽, 陈一飞, 庞博文
计算机科学. 2023, 50 (11A): 230200083-6.  doi:10.11896/jsjkx.230200083
摘要 ( 132 )   PDF(1828KB) ( 300 )   
参考文献 | 相关文章 | 多维度评价
为了从审计文本中自动识别有效的实体信息,提高政策跟踪审计的效率,提出一种基于MacBERT(MLM as correction BERT)和对抗训练的审计文本命名实体识别(Named Entity Recognition,NER)模型(Audit-MBCA)。目前深度学习在NER任务上应用成熟且成果显著,但审计文本存在语料库缺乏、实体边界识别不清晰等问题。针对这些问题,文中构建了审计文本数据集并将其命名为Audit 2022,使用MacBERT中文预训练语言模型获得其向量表示,同时引入对抗训练,利用中文分词(Chinese Word Segmentation,CWS)任务与NER任务的共享词边界信息帮助进行实体边界识别。实验结果表明,Audit-MBCA模型在Audit 2022数据集上的F1值为91.05%,较主流模型提升了4.53%;在SIGHAN 2006数据集上的F1值为93.70%,较其他模型提升了0.33%~3.25%,验证了所提模型的有效性和泛化能力。
基于多特征融合的评论文本个性化情感分类新方法
王友卫, 刘奥, 凤丽洲
计算机科学. 2023, 50 (11A): 221000217-7.  doi:10.11896/jsjkx.221000217
摘要 ( 334 )   PDF(2507KB) ( 281 )   
参考文献 | 相关文章 | 多维度评价
现有的情感分类研究未能充分考虑用户个人历史评论中蕴含的个性特征对情感分类结果的影响,且未能综合考虑用户社会关系、个人属性、历史评论与当前评论等诸多因素的共同作用。为此,提出一种基于多特征融合的评论文本个性化情感分类新方法。首先,利用大量无标注的用户历史评论挖掘用户个性表达,结合用户历史评论和用户属性信息提取得到用户特征向量;然后,利用node2vec算法在获得图节点表示方面的优势对用户社会关系网络进行学习以得到用户的社会关系向量,并利用预训练的word2vec模型获得用户当前评论向量;最后,将用户特征向量、社会关系向量和有标注的当前评论向量输入全连接神经网络中进行训练以得到最终的分类模型。在从中文股吧爬取的真实数据集上的实验结果表明,与支持向量机、朴素贝叶斯、TextCNN、Bert等典型方法相比,所提方法能够有效提高情感分类的准确率和F1值,验证了其在改善情感分类表现方面的有效性。
基于局部上下文焦点机制和交谈注意力的方面级情感分析
林正超, 李弼程
计算机科学. 2023, 50 (11A): 220900266-6.  doi:10.11896/jsjkx.220900266
摘要 ( 311 )   PDF(2554KB) ( 316 )   
参考文献 | 相关文章 | 多维度评价
方面级情感分析是目前自然语言处理领域的一个重要研究方向,其目的是预测句子当中不同方面的情感极性。现有的方面级情感分析,通常忽略了情感极性与局部语境之间的关系,且在部分使用多头注意力机制的研究中,每个注意力头数的运算是相互独立的。为此,提出了一种基于局部上下文焦点机制和交谈注意力的方面级情感分析模型。首先,通过BERT预训练模型分别捕获局部上下文和全局上下文的初步特征。然后,在特征提取层,利用局部上下文焦点机制,通过上下文特征动态掩码层结合交谈注意力机制来进一步提取局部上下文特征;利用交谈注意力机制进一步提取全局上下文特征。最后,将局部和全局信息进行融合,输入非线性层获取情感分析结果。在3个公开数据集上进行了对比实验,实验结果表明,与现有的多个基线模型相比,所提模型的MF1值和准确率均有提升。
面向海关进出口商品税率检测的归纳交互网络模型
吴安奇, 车超, 张强, 周东生
计算机科学. 2023, 50 (11A): 230200086-7.  doi:10.11896/jsjkx.230200086
摘要 ( 228 )   PDF(2170KB) ( 219 )   
参考文献 | 相关文章 | 多维度评价
中国海关传统的人工商品税率审查方式存在效率低、判断依据不一致、精度不高等问题,使用文本分类方法对商品分类自动确定税率可以有效降低海关税率风险。但面向海关商品数据进行分类时,商品类别具有层次性,同一大类下的许多子类别的商品描述具有高度相似性,给商品分类带来了很大的挑战。因此,提出了一种归纳交互网络模型,在BERT和CNN基础上加入归纳和交互指导模块。在归纳模块中采用动态路由算法对CNN提取的特征进行迭代运算,可以有效解决相邻特征融合和冗余问题。同时,为了解决不同子类别之间特征相似问题,提高分类性能,引入交互指导模块,该模块主要是将归纳模块提取的特征信息同[CLS]分类向量进行交互。在真实的海关数据集上进行实验,实验结果表明,该方法能达到较好的效果,其中准确率高达92.98%,且性能明显优于各基线模型。
基于改进蝴蝶算法的机械臂时间最优轨迹规划
周明月, 周明伟, 刘桂岐, 程超
计算机科学. 2023, 50 (11A): 220900284-8.  doi:10.11896/jsjkx.220900284
摘要 ( 128 )   PDF(3198KB) ( 232 )   
参考文献 | 相关文章 | 多维度评价
机械臂在轨迹规划过程中,为使驱动装置符合实际负载要求,各关节速度和加速度在选取上会相对保守,导致完成一套动作需要的时间过长,从而使基于运动速度和加速度的机械臂的连续性和平稳性未能充分发挥。为解决机械臂各个关节速度和加速度的优化问题,提出一种基于改进蝴蝶算法的机械臂时间最优轨迹规划方法。首先,利用3-5-3多项式插值算法对AUBO-i5六自由度机械臂构造机械臂运动轨迹,然后,利用引入莱维飞行和正弦余弦算法的蝴蝶优化算法对运动轨迹进行时间优化,在满足工作需求的前提下,减少机械臂的运行时间。仿真结果表明,改进的蝴蝶算法与同类算法相比,不易陷入局部最优,且具有更高的寻优精度。将改进的蝴蝶算法应用在轨迹规划中,机械臂的运动时间大大缩短,可保证机械臂在实际生产中平稳高效地完成任务。
基于深度学习的羽毛球知识图谱补全模型构建
陈玉珏, 胡赫, 李强
计算机科学. 2023, 50 (11A): 220900205-6.  doi:10.11896/jsjkx.220900205
摘要 ( 262 )   PDF(2838KB) ( 282 )   
参考文献 | 相关文章 | 多维度评价
为提升知识图谱在羽毛球领域的应用价值,首先对补全模型的研究现状进行了分析,其次结合深度学习技术和注意力机制,基于图卷积神经网络构建子图结构解耦的知识图谱补全模型,最后对模型的改进性能进行评估。结果表明,所提模型在所有子数据集都取得了良好的结果,与最佳基线模型相当;在实验中选择的3个数据集上,两个测试指标都有不同程度的降低,这表明了实体特征解耦的有效性;只需3个或8个基底就足以表达模型中不同关系的特征。本研究得到了改进效果良好的知识图谱补全模型,为知识图谱在羽毛球领域的推广奠定了基础。
一种约束验证神经网络的方法
郜玉钊, 邢云汉, 刘嘉祥
计算机科学. 2023, 50 (11A): 221000045-5.  doi:10.11896/jsjkx.221000045
摘要 ( 294 )   PDF(1783KB) ( 283 )   
参考文献 | 相关文章 | 多维度评价
神经网络的验证一直是人工智能领域的主要挑战之一。文中基于DeepZ方法,提出一种通过约束提升深度神经网络的局部鲁棒性验证精度的方法。在传播过程中加入约束来缩小抽象域,通过线性规划求解一个更小的神经网络输出范围,以此推断出神经网络输出节点的新的边界。应用新的边界,可以得出更精确的验证结果。基于此方法,实现了DeepZero工具,并在 MNIST数据集上进行了充分的实验。实验结果表明,所提方法能有效提升DeepZ方法的验证成功率。在实验中,验证成功率平均可提升49%,说明了所提方法的有效性。
参数全局耦合的基因调控网络建模研究
马梦宇, 孙家祥, 胡春玲
计算机科学. 2023, 50 (11A): 221100088-7.  doi:10.11896/jsjkx.221100088
摘要 ( 271 )   PDF(2568KB) ( 185 )   
参考文献 | 相关文章 | 多维度评价
系统生物学中,基于隐马尔可夫模型的非齐次动态贝叶斯网络(HMM-DBN)能够合理推断出周期性基因表达数据中的调控关系,是重构基因调控网络的重要方法之一。但其通常假设调控参数具有完全独立性(每个时间段的参数需要独立推断),而参数假设(完全独立)等于忽略了自然界生物进化过程的连续性,这会影响网络重构精度。针对上述问题,结合多变点过程,提出了参数全局耦合的HMM-DBN(GCHMM-DBN)。GCHMM-DBN模型通过在HMM-DBN的基础上增加了全局耦合超参数,在所有时间段中共享具有相似高斯分布的噪声方差超参数和信噪比超参数,实现了回归参数的全局耦合,最终提高了基因调控网络的重构精度。在酿酒酵母(酵母)数据集和合成RAF数据集上进行实验,结果表明,与经典的同类型HMM-DBN模型相比,GCHMM-DBN模型拥有更高的基因调控网络重构精度。
参差质量工人环境中的众包任务全局分配模型
蒋玖川, 魏金鹏, 张金伟
计算机科学. 2023, 50 (11A): 230200079-9.  doi:10.11896/jsjkx.230200079
摘要 ( 262 )   PDF(5885KB) ( 228 )   
参考文献 | 相关文章 | 多维度评价
已有的众包研究大多优先使用优秀工人来完成任务,即众包平台会为任务分配技能水平度和信誉度最高的工人。然而现实平台中大部分工人的技能水平度与信誉度相对较低,导致众包平台中同时存在大量无法分配的任务和无任务可做的工人。问题的主要原因如下:(1)复杂任务对工人技能水平度要求高,专业工人数量较少,而占大多数的技能水平度较低的工人无法完成复杂任务,使得大量任务分配失败;(2)任务会被优先分配给技能水平度高和信誉度高的工人,而技能水平度、信誉度相对较低的工人因为没有达到任务要求往往无任务可做。在实际众包平台中,我们发现很多复杂任务都有充足的预算,并且平台中的工人们可以通过合作来提升技能水平度。基于这些实际观察,设计了一个工人合作模型:当平台中缺少符合任务要求的工人时,该模型会让技能水平度不足的工人加入团队,通过团队内工人合作达到任务要求的技能水平度,从而使任务分配成功。最后在真实数据集上开展了实验,实验结果表明,所提模型能够提高任务分配成功率,并同时降低任务发布者的预算成本、提高工人的整体收入水平。
基于基因优先级排序的活跃模块识别方法
张琦, 潘可, 朱凯
计算机科学. 2023, 50 (11A): 221200113-8.  doi:10.11896/jsjkx.221200113
摘要 ( 202 )   PDF(3428KB) ( 195 )   
参考文献 | 相关文章 | 多维度评价
随着高通量测序技术的快速发展,海量的多组学数据有助于从分子水平上研究癌症的致病机理。近年来,活跃模块的识别问题已成为生物信息学领域的主要研究方向。然而,许多现有方法往往无法识别与癌症密切相关的强连通模块。通过整合蛋白质-蛋白质相互作用网(PPI)和基因表达两种组学数据,提出一种活跃模块识别方法IdeMod。具体而言,IdeMod提出了基于p步随机游走核回归模型的基因活跃评分函数,结合帕累托最优共识(POC)方法中的支配关系得到基因优先级排序列表。通过引入一种模拟退火算法SA-PROX,寻找PPI网络中优先级高且连通性强的活跃模块。在真实的乳腺癌数据和宫颈癌数据下进行实验,与SigMod,LEAN,RegMod和ModFinder方法相比,IdeMod可以识别一个连通性强且包含大量癌症相关基因的活跃模块。因此,IdeMod方法可作为检测活跃模块的一种有效补充工具。
图像处理&多媒体技术
基于自适应预测的2D人体姿态估计
郑泉石, 金城
计算机科学. 2023, 50 (11A): 221000048-7.  doi:10.11896/jsjkx.221000048
摘要 ( 369 )   PDF(3876KB) ( 256 )   
参考文献 | 相关文章 | 多维度评价
基于回归的2D人体姿态估计方法直接预测人体关键点的2D坐标,是主流的2D姿态估计方法之一。Transformer能有效建立人体部位间的关系,它的应用显著提升了回归方法的准确率。然而相关方法存在以下两个问题:1)在交叉注意力模块中,对于不同图像,固定的Query值难以准确关注到不同的关键点区域,导致注意力分散;2)直接学习关键点的标注位置,导致模型过拟合于训练集的标注,泛化性差。文中提出了一种基于自适应预测的姿态估计模型来解决以上问题。针对第一个问题,该模型自适应地预测Query的关注区域,并引导注意力集中于该区域。针对第二个问题,该模型自适应地预测关键点在所有位置上出现的可能性分布,通过软预测的方式,缓解模型对标注的过拟合。在MS-COCO数据集上的实验表明,该模型将基线方法的准确率提升了2.8%,并将相关方法的最高准确率提升了0.2%。
基于局部特征与全局表征耦合的2D人体姿态估计
陈乔松, 吴济良, 蒋波, 谭冲冲, 孙开伟, 邓欣, 王进
计算机科学. 2023, 50 (11A): 221100007-5.  doi:10.11896/jsjkx.221100007
摘要 ( 106 )   PDF(2286KB) ( 275 )   
参考文献 | 相关文章 | 多维度评价
近年来卷积神经网络和Transformer都在人体姿态估计领域中取得进步,卷积神经网络(Convolutional neural network,CNN)擅长提取局部特征,Transformer擅长捕捉全局表征,但目前结合两者实现人体姿态估计的研究较少且效果不佳。针对此问题,提出一种耦合局部特征和全局表征的的模型CNPose(CNN-Nest Pose),该框架的局部-全局特征耦合模块利用多头注意力计算和残差结构的方式深度耦合局部特征和全局表征;还提出了局部-全局信息交流模块解决局部-全局特征耦合模块在计算过程中局部特征和全局表征数据源范围不一致的问题。在COCO-val2017和COCO-dev-test2017数据集上进行了验证,实验表明,采用了局部特征和全局表征耦合的CNPose模型相较于同类型方法有着更为优越的表现。
基于残差网络的FMCW雷达人体行为识别
罗金燕, 常俊, 吴彭, 许妍, 卢中奎
计算机科学. 2023, 50 (11A): 220800247-6.  doi:10.11896/jsjkx.220800247
摘要 ( 200 )   PDF(3732KB) ( 264 )   
参考文献 | 相关文章 | 多维度评价
现有的基于调频连续波(Frequency Modulated Continuous Wave,FMCW)雷达的人体行为识别方法大多采用深度卷积神经网络完成,但随着网络加深,会出现网络训练难度增大或特征提取不充分的问题。针对此问题,提出一种基于残差网络的FMCW雷达人体行为识别方法。通过对雷达回波数据分析处理得到每种行为的微多普勒时域谱图,将其作为识别模型的分类特征。将卷积块注意模块(Convolutional Block Attention Module,CBAM)引入残差网络的残差块中构建识别模型,CBAM关注谱图的颜色变化情况和谱图中每种颜色的位置信息,同时引入自适配归一化和改变网络输入部分的卷积结构提高模型的特征提取能力。实验验证,该模型的平均识别准确率可达98.17%,对于微多普勒特征相似的行为,识别准确率可达95%,证明了该模型具有较好的识别性能。
基于自适应搜索范围调整的视觉目标跟踪
王超, 王凯
计算机科学. 2023, 50 (11A): 221000172-6.  doi:10.11896/jsjkx.221000172
摘要 ( 79 )   PDF(2998KB) ( 213 )   
参考文献 | 相关文章 | 多维度评价
当前主流的视觉目标跟踪算法检测目标时,其搜索范围是以前一帧目标位置为中心设定的。然而目标可能由于运动而偏离设定的搜索中心,其在当前帧的检测响应易受到余弦窗惩罚机制的抑制,导致跟踪失败。为解决上述问题,提出了自适应搜索范围调整(Adaptive Search Range Adjustment,ASRA)方法。该方法采用了基于循环神经网络的运动预测模型来预测当前帧目标位置,并与相关滤波响应相结合来对搜索中心进行调整,进一步根据目标的运动矢量对搜索范围尺寸进行调整。将ASRA方法应用于当前先进的基于孪生网络的目标跟踪算法,在OTB2015和VOT2018数据集上进行的实验结果表明ASRA方法可以改善跟踪算法的准确率和鲁棒性。
基于改进D2Det尺度自适应目标检测算法研究
王玲, 黄冠, 王鹏, 白燕娥, 邱天衡
计算机科学. 2023, 50 (11A): 221100247-9.  doi:10.11896/jsjkx.221100247
摘要 ( 298 )   PDF(5034KB) ( 231 )   
参考文献 | 相关文章 | 多维度评价
针对D2Det(Towards High Quality Object Detection and Instance Segmentation)面对尺度变化目标和小目标的检测效果不佳并且参数量较大的问题,基于D2Det提出一种尺度自适应的目标检测模型G-SAD2Det。首先在数据预处理阶段引入数据增强算法CutOut和Mosaic,使模型应对复杂场景时有较好的鲁棒性;其次改进特征提取网络ResNet,在每个残差块内构建多尺度特征提取结构,从细粒度层面上更好地提取目标特征,同时在网络结构上添加可切换的全局上下文语义特征提取模块,通过不同池化层来增强显著性特征和全局上下文语义信息;然后改进候选框生成模块,采用自主定位目标中心区域指导候选框的生成,增强算法对尺度变换目标的自适应能力;最后通过Ghost卷积替换普通卷积降低网络的参数量和计算量。使用VOC数据集和COCO子数据集验证算法的有效性,G-SAD2Det比D2Det在两个数据集上的mAP@0.5分别提升了3.6%和4.9%;模型参数量减少了27.42%,计算量减少了35.96%,证明改进后的算法在提高了精度的同时也减少了计算量。
物体区域信息引导下的RGB-D场景3D目标检测
缪永伟, 单丰, 杜思澄, 王金荣, 张旭东
计算机科学. 2023, 50 (11A): 221200152-8.  doi:10.11896/jsjkx.221200152
摘要 ( 163 )   PDF(2946KB) ( 239 )   
参考文献 | 相关文章 | 多维度评价
针对室内场景RGB-D数据的3D目标检测是图形学与三维视觉中的重要问题。针对RGB-D场景中3D目标检测对复杂背景的适应性较差、目标检测中难以有效利用物体区域信息及场景点云特征信息等缺陷,基于物体区域信息引导,提出一种融合全局和局部点云特征并排除背景干扰的3D目标检测框架。该框架以场景RGB-D数据作为输入,首先提取彩色图像中待检测目标对象2D区域并为对象进行粗分类,再将对象区域二维边界框提升到三维斜锥体区域并转化形成点云数据;然后在斜锥体点云上利用物体区域分类信息进行特征提取,并利用特征变换与最大池聚合操作将点云全局特征和局部特征有效融合;接着利用融合特征以预测各采样点与前景背景相关程度的概率分数,依据此概率分数分割场景前景点与背景点,并通过场景背景点剔除以形成屏蔽性点云;最终在屏蔽性点云中投票产生物体中心点并借助物体区域信息提出建议及3D目标预测,此外,还加入了一个角点损失,对边界框精度进行优化。针对SUN RGB-D数据集进行网络训练,实验结果表明,与传统方法相比,所提框架的目标检测结果准确率得到有效提升,同一评估指标下的点云目标检测准确率达到59.1%,并且在强遮挡或稀疏采样点区域下亦能够精确估计三维物体的边界框。
多特征感知的时空自适应相关滤波目标跟踪
孟庆姣, 姜文涛
计算机科学. 2023, 50 (11A): 230200096-9.  doi:10.11896/jsjkx.230200096
摘要 ( 297 )   PDF(3984KB) ( 227 )   
参考文献 | 相关文章 | 多维度评价
针对正则化滤波器预先定义正则化项,但无法实时抑制非目标区域学习的缺点,提出了一种多特征感知的时空自适应相关滤波目标跟踪的新方法。首先在目标函数中引入空间局部响应变化量实现空间正则化,使滤波器专注于学习对象中值得信任的部分,从而得到响应模型;其次根据全局响应变化决定滤波器的更新率;最后通过级联颜色直方图(Colour Name,CN)与降维后的梯度直方图(Fast Histogram of Oriented Gradient,fHOG)特征实现非卷积特征层面的融合,采用ImageNet-VGG-2048的Conv1,Conv5层提取目标的空间轮廓以及语义信息,并使用ReLU函数拟合训练数据,在保留主要信息的同时提高速率。在数据集DTB70上的精确率(0.747)和成功率(0.789)相较于STRCF算法的精确率(0.737)和成功率(0.760)分别提高了1%和2.9%。大量实验证明该算法在复杂背景、物体遮挡、快速运动等多种场景下基本能满足实时性需求。
改进YOLOv5的小型旋翼无人机目标检测算法
路琪, 于元强, 许道明, 张琦
计算机科学. 2023, 50 (11A): 220900050-8.  doi:10.11896/jsjkx.220900050
摘要 ( 363 )   PDF(4131KB) ( 404 )   
参考文献 | 相关文章 | 多维度评价
低空慢速小型目标检测一直是预警探测领域关注的重点和难点。目前,基于神经网络的主流目标检测算法在设计时主要考虑应用于VOC数据集或COCO数据集,在特定场景下检测精度不够理想。针对复杂背景下小型旋翼无人机目标检测的特定检测场景,提出一种基于改进YOLOv5的小型旋翼无人机目标检测算法。首先,增加小目标检测层以获得大尺寸的浅层特征图,从而提升算法对小目标的检测能力;其次,针对小型旋翼无人机尺寸不一的问题,利用K-Means++聚类算法对先验框的尺寸进行优化并将其与各特征层进行匹配;最后,使用Mosaic-SOD方法进行数据增强以及改进损失函数,增强算法对小目标的感知能力以及提高网络训练效率。将改进后的算法应用在复杂背景下的小型旋翼无人机目标检测中,实验结果表明,相较于原始YOLOv5算法,该算法在小型旋翼无人机目标检测上具有更高的检测精度和特征提取能力,虽然检测速度有一定下降,但通过对可见光视频流进行检测可知其仍能够满足实时性的要求。
复杂环境下自适应去雾的YOLOv3汽车识别算法
杨秀璋, 武帅, 李娜, 杨雯雯, 廖文婧, 周继松
计算机科学. 2023, 50 (11A): 220700147-8.  doi:10.11896/jsjkx.220700147
摘要 ( 343 )   PDF(3584KB) ( 301 )   
参考文献 | 相关文章 | 多维度评价
复杂环境因素会严重影响道路汽车目标检测算法的性能,传统方法识别精度较低且感知慢,严重威胁交通安全,为此提出一种融合自适应图像去雾的YOLOv3汽车识别算法。首先,在图像预处理阶段构建自适应图像去雾算法,融合ACE去雾算法和暗通道去雾算法,有效降低雨雾图像噪声;其次,利用改进的YOLOv3算法识别和定位汽车位置;最后,通过详细的对比实验证明方法的有效性,并准确识别出复杂天气中行驶的车辆。实验结果表明,所提方法能有效降低雨雾情况下的噪声,对行驶车辆进行有效定位,其精确率、召回率和F1值分别为0.944,0.934和0.939,均高于传统SSD,YOLO和YOLOv3算法,并且具有较好的鲁棒性和速度,这将为智慧交通的发展提供理论基础并具有实践意义。
基于潜在注意力的高性能视频超分辨率技术
王宇骥, 董昊呈, 龚雪鸾, 陈艳姣
计算机科学. 2023, 50 (11A): 221100156-10.  doi:10.11896/jsjkx.221100156
摘要 ( 137 )   PDF(3278KB) ( 275 )   
参考文献 | 相关文章 | 多维度评价
为了解决视频超分辨率的问题,可以对视频中的时空相关性信息加以利用,这是将低分辨率视频重建为高分辨率视频的一种行之有效的方法。之前的相关工作主要集中在利用运动补偿来捕捉视频生成中的时间依赖性,这种阶段性重建策略是低效的。相比运动补偿,注意力模型更能在寻找时空相关性中发挥作用。为了使注意力模型可以被应用于视频超分辨率问题,利用基于摊销变分推理的注意力估计构建潜在注意力模型,并设计了长程注意力模块和短程注意力模块两个有效的注意力功能模块。在此基础上构建出一个新型深度学习网络模型,它可以有效地捕捉视频超分辨率的时空相关性,并允许端到端学习。通过在公共视频数据集的广泛实验,可以证明该方法相比当前最先进的几种方法如SPMC,DUF-16L等具有更优越的性能。
多维特征激励网络用于视频行为识别
罗会兰, 于亚威, 王婵娟
计算机科学. 2023, 50 (11A): 230300115-8.  doi:10.11896/jsjkx.230300115
摘要 ( 290 )   PDF(3703KB) ( 239 )   
参考文献 | 相关文章 | 多维度评价
在动作识别任务中,由于视频数据存在内容多样和背景复杂的特性,因此提取有效的时空特征是研究的主要难点。为了利用深度网络学习时空特征,研究者们通常采用双流网络和3D卷积网络。但是,双流网络中光流信息缺乏捕获长距离时间关系的能力,且光流提取需占用很大的内存和时间;而3D卷积与2D卷积相比,增加了一个数量级的计算成本,容易导致过拟合和收敛缓慢。为解决以上问题,提出了一种基于注意力的多维度特征激励融合网络MFARs(Multi-dimensional Feature Activation Residual networks)用于视频行为识别。MFARs采用2D卷积网络解决时序特征表达学习问题,利用运动补足激励模块建模时序特征,激发时间通道运动信息;同时利用联合特征激励模块,通过时序特征激励通道和空间信息,以学习到更好的时空特征表达。MFARs在行为识别数据集UCF101和HMDB51上的准确度分别达到了96.5%和73.6%。与当前的主流行为识别模型相比,提出的多维特征激励方法能够有效地表达时空特征,更好地平衡复杂度和分类准确率。
双分支注意力网络的遥感图像融合
李贺, 聂仁灿, 杨小飞, 张谷铖
计算机科学. 2023, 50 (11A): 230200072-7.  doi:10.11896/jsjkx.230200072
摘要 ( 165 )   PDF(5586KB) ( 266 )   
参考文献 | 相关文章 | 多维度评价
在遥感图像中,PAN图像具有较高的空间分辨率,而MS图像包含了更多的光谱信息,因此,将它们进行融合得到高分辨率的多光谱图像是一项重要的技术。由于CNN往往无法准确获取远距离的空间特征,因而限制了全色锐化的空间细节。为了充分提取全色图像的空间信息和多光谱图像的光谱信息,文中提出了一种双分支注意力网络用于遥感图像融合任务。与以往利用纯卷积神经网络提取空间和光谱信息的方法不同,该方法在卷积块中引入空间注意力模块和通道注意力模块,分别用于关注空间和光谱信息,并在层级之间进行信息交互,以充分提取空间信息和光谱信息;同时,以Transformer为基础架构,搭建Transformer全局分支用于充分学习图像中的空间特征和光谱特征,最后经过解码得到高空间分辨率的多光谱图像。该方法在IKONOS和WorldView-2数据集上进行了全分辨率实验和降低分辨率实验,实验结果表明,该方法相比于对比方法在客观指标和主观视觉上均取得了更好的结果。
基于模糊遮蔽与动态推理的生成式工业异常定位模型
吴天月, 张辉, 张邹铨, 唐珺琨
计算机科学. 2023, 50 (11A): 230100073-7.  doi:10.11896/jsjkx.230100073
摘要 ( 273 )   PDF(4656KB) ( 229 )   
参考文献 | 相关文章 | 多维度评价
工业生产机械化对工业产品质量检测环节提出了新的要求,需要一种具有高精度、易于移植的异常检测算法来适应生产方式的更新。针对工业生产中,异常样本出现概率低、无法完全预测的固有难题,提出了一种基于模糊遮蔽与动态推理的生成式工业异常定位模型。首先,设计了一个基于随机模糊遮蔽的对比样本生成模块,用于获取高质量的模拟异常图像。同时,利用浅层特征融合路径保留更多的边缘信息,使用损失函数加权使模型更加关注结构相似性,以及使用对比学习的方式使网络获得更好的表示能力。其次,为了缓解生成式模型输出图像模糊的问题,设计了多分支异常动态推理方法,使迭代生成和精准修复两分支相互配合,拉远背景噪声与真实异常间的距离。实验结果表明,所提方法在MVTec数据集上取得了91.42%的平均定位精度,其中有12类达到了前三的异常定位精度,能够较完整地获取异常地位置;对于纹理复杂和背景占比较大的图像,所提方法仍然保持着较高的指标敏感度,其异常定位性能在近年来提出的生成式检测模型中取得了最佳。
基于特征变换结合KD树改进ICP的快速点云配准方法
唐佳林, 林寿南, 周壮, 司炜, 王腾辉, 郑泽鑫
计算机科学. 2023, 50 (11A): 230100028-5.  doi:10.11896/jsjkx.230100028
摘要 ( 181 )   PDF(2737KB) ( 326 )   
参考文献 | 相关文章 | 多维度评价
点云配准是三维重建的关键技术。针对迭代最近点(ICP)算法存在收敛速度慢、配准效率低、配准时间长等难题,提出了一种基于特征变换结合 KD树改进ICP的快速点云配准方法。首先利用体素网格法进行初步降采样,在其差分高斯模型上获取三维尺度不变特征变换(SIFT)关键点;其次建立快速点特征直方图(FPFH);然后使用采样一致性初始配准(SAC-IA)算法,实现粗配准;最后根据得到的初始变换矩阵使用KD树改进的ICP算法,实现精配准。在斯坦福大学公开数据集上进行配准实验,结果表明,与ICP算法相比,所提改进算法具有较高的配准精确度和时间效率,且可为精确配准选择较优的初始位姿。文中在一定程度上避免了点云配准时存在的局部最优现象,为后续目标识别匹配和三维重建提供了一种高效的方法。
基于多尺度改进的YOLOv5电解槽设备及样品检测方法
吴姣姣, 刘铮
计算机科学. 2023, 50 (11A): 230200163-6.  doi:10.11896/jsjkx.230200163
摘要 ( 342 )   PDF(3396KB) ( 203 )   
参考文献 | 相关文章 | 多维度评价
针对电解铝车间电解槽转运机器人实时识别问题,电解槽设备和铝锭样品的目标检测存在识别物体尺寸差异过大的问题,通常使用的目标检测算法参数较大,部署在电解槽转运机器人上难以达到实时检测的要求。因此,提出一种解决目标尺寸差异过大的轻量化多尺度的YOLOv5网络模型,替换主干特征提取网络为轻量化ShufflenetV2网络;添加SE注意力机制提高小目标识别准确率;在加强特征提取网络中增加一层浅层检测层作为更小目标的检测层,实现对多尺度以及尺寸变化大的目标的识别准确率。实验结果表明,改进后的YOLOv5算法在电解槽转运机器人的电解槽设备和样品识别中物体总类别的平均检测精度为93.5%,相比YOLOv5算法平均检测精度提升了1.5%,模型参数量降低了约39.4%,每张图片平均检测速度提升了2.5 ms,有利于部署到电解槽转运机器人中。
改进YOLOv5s的轻量化钢材表面缺陷检测模型
蒋博, 万毅, 谢显中
计算机科学. 2023, 50 (11A): 230900113-7.  doi:10.11896/jsjkx.230900113
摘要 ( 190 )   PDF(3033KB) ( 300 )   
参考文献 | 相关文章 | 多维度评价
针对现有钢材表面缺陷检测模型结构复杂、参数量多、检测精度和实时性较差等问题,提出了一种改进YOLOv5s的轻量化钢材表面缺陷检测模型。首先采用MobileNetv3-Small网络替换YOLOv5s主干提取网络,实现模型轻量化,提升检测速度;其次在特征融合阶段采用加权双向特征金字塔网络(Bidirectional Feature Pyramid Network,BiFPN)加强特征提取,通过融合不同尺度的特征,提升检测的准确率和鲁棒性。同时引入CBAM(Convolutional Block Attention Module)注意力机制增强模型对小尺度目标的检测能力;最后使用K-means++算法聚类先验框,提高先验框聚类的准确性和收敛速度。改进后的模型在NEU-DET数据集上的平均精度均值(mAP@0.5)达到77.2%,在NVIDIA 1080Ti上检测速度达到102FPS。相较于原始YOLOv5s模型,mAP提升3.90%,参数量减少58.6%,体积减小34%,检测速度提升29.7%。实验结果表明改进的YOLOv5s模型在保证轻量化的同时能够有效提升钢材表面缺陷检测的精度和速度,易于部署,满足带钢实际生产中的需求。
结合门控融合网络和残差傅里叶变换重建太阳斑点图
黄亚群, 郑培煜, 蒋慕蓉, 杨磊, 罗俊
计算机科学. 2023, 50 (11A): 220800229-7.  doi:10.11896/jsjkx.220800229
摘要 ( 321 )   PDF(3877KB) ( 185 )   
参考文献 | 相关文章 | 多维度评价
使用现有深度学习算法重建云南天文台拍摄的高度模糊太阳斑点图像时,出现高频信息丢失、边缘模糊、重建难度大等问题。对此,提出一种结合门控融合网络与残差傅里叶变换的太阳斑点图重建算法,其中门控融合网络由一个生成器和两个鉴别器组成,生成器包含去模糊模块、高维特征提取模块、门控模块和重建模块。去模糊模块采用基于双注意力机制的U形网络框架,获取低分辨率图像去模糊后的特征;高维特征提取模块使用残差傅里叶变换的卷积块,提取包含图像空间细节的高维特征;门控模块将上述两个特征进行融合,得到权重图,与去模糊后的特征进行加权后,再与高维特征融合,得到融合特征;重建模块采用残差傅里叶变换的卷积块和像素混洗层,将门控模块得到的融合特征图进行重建,得到高分辨率图像。利用两个鉴别器分别鉴别去模糊模块产生的去模糊图像和重建模块产生的高分辨率图像的真实性。最后,设计包含像素内容损失、感知损失和对抗损失的组合训练损失函数,指导模型训练。实验结果显示,所提方法与现有深度学习重建方法相比,高频信息的恢复能力更强,边缘轮廓更清晰,结构相似性和峰值信噪比指标更高。
图像美学信息增强的视觉感知推荐系统
张凯煊, 蔡国永, 朱琨日
计算机科学. 2023, 50 (11A): 221100083-8.  doi:10.11896/jsjkx.221100083
摘要 ( 280 )   PDF(3536KB) ( 262 )   
参考文献 | 相关文章 | 多维度评价
视觉感知推荐系统旨在从视觉认知角度出发,通过提取物品图像的视觉特征来增强用户和物品交互的行为特征,建模用户视觉与行为相关的偏好,从而更好地进行推荐。已有的视觉感知推荐研究中,通常使用预训练的卷积神经网络(CNN)来提取视觉对象语义特征,很少考虑物品外观图像内部隐藏的美学风格特征;其次,在视觉感知推荐中用户和物品的交互行为结构嵌入信息通常被忽视。为了解决这些问题,提出了一个融合图像美学和行为交互结构嵌入的美学特征感知视觉推荐系统(ABVR)。ABVR使用预训练ViT模型提取图像的高层视觉特征——语义类别特征,利用美学提取网络挖掘出图像中的中层美学视觉特征——物品的颜色、形状等特征,利用图卷积神经网络(GCN)模块学习用户物品交互图结点的多层图结构嵌入特征,最后将3类特征关联融合,以实现美学增强的视觉推荐。在两个真实数据集上进行了大量实验,验证了ABVR模型在视觉推荐性能提升上的有效性。
基于任务关联特征解耦网络的无监督领域自适应图像分类
唐珺琨, 张辉, 张邹铨, 吴天月
计算机科学. 2023, 50 (11A): 230100068-8.  doi:10.11896/jsjkx.230100068
摘要 ( 258 )   PDF(3173KB) ( 332 )   
参考文献 | 相关文章 | 多维度评价
无监督领域自适应(Unsupervised Domain Adaptation,UDA)旨在帮助模型在跨域分布差异条件下从带标注的源域中学习到知识,以迁移至无标注的目标域。当前先进的域自适应方法主要通过直接对目标域与源域分布对齐来实现,其中特征往往被当作一个整体对象用于开展域间自适应任务,忽略了特征中的任务关联信息(域间不变、域内独特信息)与无关信息(颜色对比度、图像风格)耦合的情况,使得模型难以把握关键的特征信息,从而导致次优化。针对上述问题,提出了一种基于任务关联特征解耦网络的无监督领域自适应分类方法(Task Relevant Feature Separation Network,TRFS),通过对域间风格混合干扰下的特征与原始特征的注意力进行一致性的学习,来帮助网络提炼出与下游任务相关的特征权重,并进一步采用权重差获取任务无关特征权重,而后通过正交函数约束推远任务关联与无关特征,实现特征解耦;设计了任务特征细化解耦层,减轻配对特征与域独特特征混淆的情形,优化模型对分类判别的精度。此外,为了提升伪标签质量,引入基于记忆力银行的领域聚合伪标签生成方法,用于降低伪标签噪声。综合实验结果表明,所设计解耦模块具有良好的即插即用性,能够提升自适应方法的性能;且所提方法相比其他先进的域适应方法具有明显的优势,其中在Office-Home数据集上达到了73.6%的分类精度。
基于深度学习的钢轨光带检测算法
张新峰, 边浩南, 张博, 张嘉铭, 梁玉清
计算机科学. 2023, 50 (11A): 230200146-6.  doi:10.11896/jsjkx.230200146
摘要 ( 230 )   PDF(4157KB) ( 268 )   
参考文献 | 相关文章 | 多维度评价
列车在轨道上行驶的过程中,车轮的轮缘会对钢轨轨面进行碾压,形成光带。钢轨光带的形状反映钢轨与车轮之间的位置关系,对异常光带形状的捕获可以有效预防列车运行的安全问题,并且提高列车乘坐的舒适程度。传统的人工检测光带方法存在效率低和专业性强等问题。早期的计算机视觉技术利用图像的边缘信息和灰度信息对钢轨区域进行定位,在此基础之上对光带区域进行分割,在效率和鲁棒性上差强人意。因此,对钢轨以及光带区域进行高效率、高精度分割是十分必要的。首先,使用ResNet分类网络区分道岔区和非道岔区图像。然后,针对两种图像,分别利用DeeplabV3+分割网络对图像的光带和钢轨区域进行分割。最后,针对钢轨边缘容易分割不清的问题,提出一种基于Douglas-Peucker算法的后处理算法,对钢轨边缘进行拟合。研究结果表明:相比于直接利用语义分割网络对两类图像一起分割,先分类再分割并对分割结果后处理的操作能够稳步提高分割准确率。该算法对非道岔区的图像的整体分割、铁轨分割、光带分割的交并比(IOU)分别为95.45%,87.48%,92.60%;对道岔区的图像的相应指标分别为90.20%,76.56%,85.42%。因此,所提算法对钢轨以及光带区域的分割精度较高,并且能够高效完成批量图像处理,具有较高的工程价值。
基于改进的YOLOv5s列车轨道线检测方法
姜珂, 石建强, 陈光武
计算机科学. 2023, 50 (11A): 230200101-6.  doi:10.11896/jsjkx.230200101
摘要 ( 376 )   PDF(3686KB) ( 354 )   
参考文献 | 相关文章 | 多维度评价
轨道线检测有助于提高列车的行驶安全,但检测效果易受列车行驶环境的影响。针对这种情况,提出了基于图像预处理并使用改进后的YOLOv5s网络进行轨道线检测的方法。首先,对图像预处理,使用HSV分离出图像的多余信息后,基于Otsu阈值处理,提高了图像检测目标的显著度,降低了目标识别的复杂程度;其次,考虑到列车车载系统轻量化的要求,对YOLOv5s目标识别网络进行了改进,通过添加 CBAM注意力机制模块改进主干网络,来加强有效的特征信息,可以在确保检测结果的基础上提高检测速度,并使得检测算法模型易于部署到移动端设备中。使用公开的列车行驶图像构建数据集进行实验,实验结果表明提出的检测算法在数据集测试中的mAP达到了94.1%,具备一定的实时性和鲁棒性。
基于GA-BP的圆形靶标圆心定位误差预测建模与补偿研究
陈海燕, 朱军林, 王平
计算机科学. 2023, 50 (11A): 221100170-5.  doi:10.11896/jsjkx.221100170
摘要 ( 284 )   PDF(3720KB) ( 248 )   
参考文献 | 相关文章 | 多维度评价
利用圆形靶标进行相机标定时,靶标成像效果会随着不同的相机拍摄位姿呈现为椭圆,因此利用常规圆心定位方法得到的图像圆心坐标并非真实圆心在图像中的成像位置,直接利用该圆心图像坐标进行相机标定的标定精度不高。针对此问题,提出了一种先对圆形靶标图像圆心定位误差进行预测建模,然后进行误差补偿来提高圆心定位精度的方法。首先,建立圆形靶标成像图的仿真图像集;其次,对图像预处理并利用椭圆拟合法定位图像中的圆心坐标;再次,构建并训练GA-BP神经网络,建立圆心定位误差与相机镜头位姿之间的关系模型;最后,通过误差补偿策略对定位的圆心坐标进行误差补偿。实验结果表明,所构建的GA-BP神经网络模型对圆心定位的横、纵坐标的误差预测精度明显优于BP或者E-R模型,其MAPE,RMSE,R2分别为5.51%,0.004 8,0.999 6和6.14%,0.096 4,0.999 8。误差补偿后的圆心定位精度更高,验证了采用误差预测建模和误差补偿的方法提高圆心定位精度的可行性,为高精度相机标定任务提供了方法支撑。
基于网格与超像素的图像重定向方法
陈美颖, 毕秀丽, 刘波
计算机科学. 2023, 50 (11A): 221100153-8.  doi:10.11896/jsjkx.221100153
摘要 ( 133 )   PDF(5834KB) ( 240 )   
参考文献 | 相关文章 | 多维度评价
图像是人与人之间进行交流的重要媒介,在信息高速发展的今天,利用图像重定向技术使图像能满足各式各样的设备尺寸具有重要意义。基于网格的图像重定向算法首先对输入图像生成对应的规则矩形网格,然后根据该网格内的图像内容来评估图像像素权重以此决定此网格的变形程度,对图像全局进行不断迭代直到图像重定向终止条件。此类算法仍存在对图像内容评估不全面的问题,进而导致输出图像结构扭曲、难以保持结果图像的对角线特征以及整体结构等问题。针对以上问题,提出了一种基于超像素、梯度以及显著性的图像重定向方法。首先利用超像素方法对输入图像做预处理,然后用超像素块作为后续处理单位,随后利用基于梯度和显著性的图像像素权重评估方法对超像素处理输出图像进行权重度量,输出一幅图像重定向权重热力图,最后根据此重定向权重热力图对网格进行迭代优化,实现对图像的重定向处理。实验结果表明,相比对比方法所提方法在6种无参考图像质量评估指标上都有一定优越性,在语义合理性、信息准确性和视觉自然性上都具有一定优势,在图像重定向领域有较大的应用价值。
融合多头注意力机制的图像降噪网络模型
李玥玥, 刘万平, 黄东
计算机科学. 2023, 50 (11A): 230100091-8.  doi:10.11896/jsjkx.230100091
摘要 ( 232 )   PDF(4610KB) ( 336 )   
参考文献 | 相关文章 | 多维度评价
由于GPU计算的快速发展,深度学习近年来在图像降噪方面得到了应用。大多数深度学习方法都需要无噪声图像作为训练标签,但通常它们很难获得,甚至不可能获得。于是,有学者开始研究使用噪声图像进行降噪网络训练,但其恢复的图像却面临丢失细节信息的问题。受Noise2Noise(N2N)的思想启发,文中使用成对的噪声图像训练神经网络,学习同一范围的同类型噪声之间的分布关系,实现了一种新的降噪网络模型。新开发的模型(MA-UNet)基于经典UNet架构,融合了多头注意力机制(Multi-head Attention)和简易的残差网络,可以更好地挖掘图像的关键信息,掌握特征的全局信息,从而恢复更清晰的图像。与传统算法(CBM3D)和其他方法(如DnCNN和B2U)相比,MA-UNet的性能参数优良。从视觉图像观察来看,所提模型恢复了更清晰的图像细节。与N2N设计的模型相比,在不同噪声幅值下,所提模型在4个经典数据集上的峰值信噪比和结构相似性指数的均值均有显著提高。
一种面向工业产品表面缺陷图像的色调增强方法
罗月童, 李超, 段昶, 周波
计算机科学. 2023, 50 (11A): 230200089-6.  doi:10.11896/jsjkx.230200089
摘要 ( 277 )   PDF(3124KB) ( 222 )   
参考文献 | 相关文章 | 多维度评价
在基于深度学习的工业缺陷检测中,采样数据的色调分布、缺陷的位置分布往往与检测数据存在着差异,这会导致检测模型性能不佳,基于GAN(Generative Adversarial Networks)的数据增强方法为常用的解决方法,文中设计了HC-GAN和T-GAN来分别进行色调和缺陷位置的增强。在HC-GAN中,通过构建语义保持模块和色调控制模块,能够在不改变缺陷特征的前提下实现基于参考数据的色调增强;在T-GAN中,通过输入、输出数据的成对设定,实现了缺陷位置转移;在实际应用中,两个GAN的串联使用能降低训练数据在色调和空间上的不均衡性,提高了模型的检测性能。最后进行了实验验证,结果表明,所提方法生成的数据实现了缺陷图像的色调增强和位置增强,提高了工业产品表面缺陷检测的精度。
基于混合注意力的实时图像语义分割算法
王燕, 夏创帅, 汪娜, 南佩奇
计算机科学. 2023, 50 (11A): 230200010-6.  doi:10.11896/jsjkx.230200010
摘要 ( 137 )   PDF(3335KB) ( 256 )   
参考文献 | 相关文章 | 多维度评价
针对现有语义分割算法因模型复杂、计算量庞大,导致算法较难部署在移动设备的问题,提出了一种基于混合注意力的实时图像语义分割算法。该算法是非对称的编码器解码器结构,编码器部分结合深度可分离卷积与扩张卷积设计出一个高效残差单元来提取不同网络深度的图像特征,在浅层较多关注空间位置信息,在深层增强语义信息提取。解码器部分设计了混合注意力特征融合模块,使用空间注意力强化浅层的空间位置信息,使用通道注意力增强深层特征图中关键信息的表达能力,能够有效融合不同层次特征图中空间信息与上下文信息,强化语义信息的表达,减小融合过程中图像信息的损失,最后使用分类器得到分割预测图。大量实验的结果表明,该算法在Cityscapes数据集上PA和mIoU分别达到了93.2%和73.2%,在TeslaV100图像计算显卡上以1.62×106的参数量达到38FPS,在Pascal VOC 2012数据集上PA和mIoU达到了92.4%和74.8%。实验结果表明,该算法能够有效且实时地完成城市场景图片分割任务。
UFormer:基于Transformer和U-Net结构的端到端特征点景象匹配算法
辛瑞, 张霄力, 彭侠夫, 陈锦文
计算机科学. 2023, 50 (11A): 230300045-6.  doi:10.11896/jsjkx.230300045
摘要 ( 441 )   PDF(3526KB) ( 252 )   
参考文献 | 相关文章 | 多维度评价
目前景象匹配算法多采用传统特征点匹配算法,算法流程由特征检测和特征匹配组成,对于弱纹理场景精度低,匹配成功率低。UFormer提出了一种端到端的方案,用于完成基于Transformer的特征提取和匹配操作,采用注意力机制提高算法应对弱纹理场景的能力。受U-Net架构的启发,UFormer在编码器-解码器结构的基础上由粗到细构建了图像亚像素级的映射关系。编码器采用self-cross attention交叠结构检测并提取图像对各尺度的相关特征,建立特征连接,进行下采样,用于粗粒度的匹配,提供初始位置。解码器上采样,恢复图像分辨率,融合每个尺度上的注意力特征映射,实现细粒度层面的匹配,并通过期望的方式将匹配结果细化至亚像素精度。引入真值单应性矩阵计算粗、细粒度匹配点对坐标的欧氏距离反馈损失,监督网络的学习。UFormer融合特征检测与特征匹配,结构更简单,在保证准确性的同时提高了实时性,在一定程度上具备应对弱纹理场景的能力。在收集的无人机飞行轨迹数据集上,相比SIFT,坐标精度提升了0.183个像素,匹配耗时缩短至0.106 s,对弱纹理场景图像的匹配成功率更高。
结合小波变换高频信息的可控面部性别伪造
陈万泽, 陈家祯, 黄丽清, 叶锋, 黄添强, 罗海峰
计算机科学. 2023, 50 (11A): 221000241-10.  doi:10.11896/jsjkx.221000241
摘要 ( 94 )   PDF(5820KB) ( 266 )   
参考文献 | 相关文章 | 多维度评价
基于生成对抗网络(Generative Adversarial Network,GAN)的图像到图像的翻译(Image-to-Image Translation,I2I)技术在各种领域中取得了一系列突破,并广泛应用于图像合成、图像着色、图像超分辨率,特别是在面部属性操作方面获得了深入研究。为了解决目前I2I领域由于模型架构以及数据不均衡所导致的不同翻译方向的生成图像性能表现差异的问题,提出了一种HFIGAN(High Frequency Injection GAN)模型,实现了结合高频信息的可控面部性别伪造。首先在结合高频信息的小波模块中,将编码特征通过离散小波变换进行特征级的分解,将所得到的高频信息在解码阶段对等注入,使得在上采样过程中的源域与目标域之间的信息可以达成平衡状态。其次,针对I2I任务中多域转换在不同方向的翻译难度不一致的问题,通过对损失函数进行重新设计,将难易样本的损失进行放缩,提高难样本对模型的反馈,使模型更专注于难样本的训练从而提升模型性能。最后,提出基于风格特征的多样性正则项,将风格向量在不同空间中的距离度量添加至传统的多样性损失中进行监督,使得模型能在保持生成图像多样性的同时提升图像的生成质量。分别在CelebA-HQ数据集和FFHQ数据集上进行实验并验证了所提方法的有效性。在主流的I2I模型中结合所提损失进行了损失函数通用性验证。实验结果表明,与以往先进方法相比,HFIGAN在面部性别伪造方面性能更加优异,所提出的损失函数具备一定的通用性。
融合门控循环单元及自注意力机制的生成对抗语音增强
张德辉, 董安明, 禹继国, 赵恺, 周酉
计算机科学. 2023, 50 (11A): 230200203-9.  doi:10.11896/jsjkx.230200203
摘要 ( 354 )   PDF(3655KB) ( 200 )   
参考文献 | 相关文章 | 多维度评价
因其通过两种网络对抗训练并不断提升网络映射能力的特性,生成对抗网络(Generative Adversarial Networks,GAN)具有强大的降噪能力,近年来被应用于语音增强领域。针对现有生成对抗网络语音增强方法未充分利用语音特征序列中的时间相关性和全局相关性这一不足,提出一种融合门控循环单元(Gated Recurrent Unit,GRU) 和自注意力机制(self-attention)的语音增强GAN网络。该网络利用串联和并联两种方式构建了时间建模模块,可捕获语音特征序列的时间相关性和上下文信息。与基线算法相比,所设计的新型GAN网络语音质量听觉估计分数(PESQ)提高了 4%,且在语音信号分段信噪比(SSNR)和短时客观可懂度(STOI)等多个客观评价指标上表现更优。该研究结果表明,融合语音特征序列中的时间相关性和全局相关性有助于提升GAN 网络语音增强的性能。
联合边缘检测与参数自适应PCNN的遥感图像融合方法
石影, 贺新光, 刘滨瑞
计算机科学. 2023, 50 (11A): 220900264-6.  doi:10.11896/jsjkx.220900264
摘要 ( 212 )   PDF(3122KB) ( 193 )   
参考文献 | 相关文章 | 多维度评价
为了提高全色与多光谱图像的融合质量,解决脉冲耦合神经网络(PCNN)参数调整困难和融合图像边缘特征保存不完整的问题,提出了一种联合Canny算子和参数自适应PCNN的遥感图像融合方法。首先对多光谱图像进行HSV颜色空间变换,获取多光谱的V亮度分量,再利用Canny算子提取全色图像边缘特征,并根据边缘特征因子对全色图像与多光谱的V分量进行边缘特征融合,得到边缘加强的全色图像。然后对新的全色图像和多光谱V分量分别进行非下采样剪切波变换(NSST),获得相应的高频和低频系数子带。其高频子带采用参数自适应PCNN模型进行融合,其中所有PCNN参数均由输入频段自适应估计,得到具有最优参数的PCNN模型;而低频子带则采用有选择性的加权求和规则进行融合。最后由NSST逆变换得到新的V分量,再经HSV逆变换获得最终的融合图像。将所提方法与其他新近提出的方法进行对比实验,选取7种客观评价指标对融合图像的空间细节和光谱信息进行评价。实验结果表明,所提融合算法在视觉质量以及客观指标评价方面上更有优势,获得了更好的融合性能。
多流融合的轻量级图卷积行为识别算法
李华, 赵领娣, 陈雨杰, 杨杨, 杜新兆
计算机科学. 2023, 50 (11A): 220800147-6.  doi:10.11896/jsjkx.220800147
摘要 ( 260 )   PDF(1918KB) ( 258 )   
参考文献 | 相关文章 | 多维度评价
传统的基于RGB视频的行为识别容易受到光线强度、观察视角等问题的影响。基于骨骼的行为识别受这些问题的影响较小,成为现在的主流方法之一。但目前基于骨骼信息的行为识别方法参数量较大,运算速度较慢。为了解决这些问题,提出一种多流融合的轻量级图卷积行为识别框架。首先,将融合人体关节、骨骼边、关节速度和骨骼速度的多种信息的数据输入到空间图卷积模块中;其次,在空间图卷积模块中加入了空间注意力机制来更好地提取各个关节之间的关系;最后,在时间卷积模块中使用了深度卷积和逐点卷积减少参数量。提出的网络与基线网络SGN相比,在NTU-RGB+D120数据集中,交叉视角评估下提高了2.3%,交叉设置评估下提高了1.9%,参数量减少了0.12×106个,从而验证了提出网络的有效性。
基于机器视觉的超声相控阵缺陷检测研究
邹宸玮, 么娆
计算机科学. 2023, 50 (11A): 230200150-6.  doi:10.11896/jsjkx.230200150
摘要 ( 379 )   PDF(3447KB) ( 226 )   
参考文献 | 相关文章 | 多维度评价
超声相控阵检测是一种常用的无损检测(NDT)技术,用于工件缺陷检测与评估。为实现现代工业大数据化和自动化,解决缺陷检测过程中产生的超声相控阵图像信息缺失和散斑噪声问题,并实现对各类型缺陷的准确识别,提出了一种基于机器视觉的缺陷识别方法,该方法在利用改进PM微分方程对图像进行去噪处理后,提取图像特征作为粒子群优化的BP神经网络的实验数据。实验结果表明,所提方法的训练集精准率为99.543%,相比传统的BP网络模型提高了1.833%,能够在准确实现缺陷识别的同时,保持模型良好的性能。
基于改进YOLOv4的磁瓦缺陷检测算法
张晓晓, 邓承志, 吴朝明, 曹春阳, 胡诚
计算机科学. 2023, 50 (11A): 230100100-7.  doi:10.11896/jsjkx.230100100
摘要 ( 237 )   PDF(3975KB) ( 258 )   
参考文献 | 相关文章 | 多维度评价
磁瓦在生产制造过程中会因为工艺问题产生各种不同的缺陷,传统检测算法检测速度慢、精度低,为了实现磁瓦表面缺陷快速有效的检测,文中提出了一种改进YOLOv4算法的磁瓦缺陷检测方法。首先将scSE注意力模块嵌入特征提取主干网络中的CSPnet的残差单元中,增强小目标的空间特征和通道特征;其次,采用空洞卷积空间池化金字塔(ASPP)模块代替原有SPP模块,增大卷积核感受野,更多地保留图像细节并增强信息相关性;最后,在颈部部分用深度可分离卷积替换5次卷积块中的传统卷积,以此来更好地对特征信息进行提取,减小模型的参数量。实验结果表明,改进的YOLOv4算法对磁瓦表面缺陷检测的平均精度值达到96.67%,检测速度为44 ms,模型大小为249 MB,明显优于原始算法,具有较高的检测精度和实用性。关键词:缺陷检测;YOLOv4;scSE注意力;空洞卷积池化;深度可分离
基于YOLOv5的湿润沥青路面裂缝检测
张恩华, 王卫杰, 段楠, 康楠
计算机科学. 2023, 50 (11A): 220900155-5.  doi:10.11896/jsjkx.220900155
摘要 ( 226 )   PDF(2914KB) ( 232 )   
参考文献 | 相关文章 | 多维度评价
为探究湿润环境对沥青路面裂缝自动检测效果的影响,文章通过YOLOv5深度学习目标检测算法,建立了沥青路面裂缝检测模型;并在此基础上,设置了湿润与干燥环境下的裂缝检测对比实验,对比了在两种环境下沥青路面裂缝检测结果的准确度与置信度。研究结果表明,湿润环境扩大了沥青路面裂缝在深度学习网络中的识别特征,提高了裂缝检测的效果。干燥路面裂缝检测的准确度为80.70%,湿润路面裂缝检测的准确度为89.47%,湿润环境下的沥青路面裂缝检测模型准确率提升了8.77%。同时,统计同一裂缝两种环境下检测的置信度发现,置信度平均值在干燥环境下为0.72,在湿润环境下为0.78,且湿润与否与裂缝检测的置信度存在显著正相关关系。研究成果为沥青路面裂缝自动检测效果的提升提供了新的思路,为路面养护管理的决策提供了有效工具。
基于文本引导图像语义融合的跨模态哈希检索
顾宝程, 刘立
计算机科学. 2023, 50 (11A): 221100191-6.  doi:10.11896/jsjkx.221100191
摘要 ( 245 )   PDF(2454KB) ( 260 )   
参考文献 | 相关文章 | 多维度评价
基于哈希的跨模态检索算法具有存储消耗低和搜索效率高的特点,跨模态哈希检索在多媒体数据中的应用成为当前的研究热点。目前对于跨模态哈希检索的主流方法是研究模态间哈希码的学习能力,忽视了不同模态之间的特征学习能力以及语义融合能力。将Clip中的图像-文本匹配问题转换为像素-文本匹配问题,文本特征经过Transformer解码器查询图片特征,鼓励文本特征学习到最相关的图片像素级信息,并将像素-文本匹配得分引导图片模态的特征学习,挖掘出不同模态之间的更深层次的相关联的语义信息,并引入二元交叉熵损失函数来提升模态之间的语义融合能力,在高维特征映射到低维的汉明空间时能够得到高质量的二值哈希码。在MIRFLICKR-25K和NUS-WIDE数据集上进行对比实验,实验结果表明所提算法模型在不同长度的哈希码条件下的检索效果均优于目前主流的算法。
跨视角地理视觉定位
刘旭东, 余平
计算机科学. 2023, 50 (11A): 221100066-7.  doi:10.11896/jsjkx.221100066
摘要 ( 191 )   PDF(3648KB) ( 265 )   
参考文献 | 相关文章 | 多维度评价
伴随着智能终端设备的爆炸性增长和移动互联网的迅速崛起,在许多场景下,例如地广人稀的偏远山区,基于位置的服务需求越来越凸显。但由于这些区域GPS信号遮挡或信号基站难以覆盖,GPS定位无法正常发挥作用。图像地理定位指仅根据视觉信息确定图像的拍摄位置。在没有任何先验知识的情况下,预测照片的地理位置是一项非常艰巨的任务,因为不同条件下(例如,不同的天气,物体或相机设置)拍摄的图像会呈现出巨大的变化。文中尝试探索图像的跨视角地理视觉定位方法,首先利用逆极坐标转换将街景视角转换为空域视角图像,以此减少两者间的域差异,再利用深度学习的方法来对不同视角的图像进行编码以获得更加鲁棒的图像全局向量描述子,然后在此基础之上进行图像匹配和街景视角查询图像的定位。在图像特征提取方面,采用了VGG16模型,利用层数更深的小卷积核的方式去增大网络模型的感受视野并节省参数。在特征编码方面,将多尺度注意力机制融入NetVLAD模型,将骨架模型提取到的特征编码成更加鲁棒的全局特征描述子向量。实验结果显示,上述方法能够实现较高精度的街景视角的匹配与定位,同目前已有的方法相比,匹配精度更高。而且无须专业设备采集的高清街景视图,普通智能手机拍摄的街景视图即可获得较好的匹配定位精度。
大数据&数据科学
复杂网络社团发现综述
曹金鑫, 许伟忠, 金弟, 丁卫平
计算机科学. 2023, 50 (11A): 230100130-11.  doi:10.11896/jsjkx.230100130
摘要 ( 369 )   PDF(3625KB) ( 329 )   
参考文献 | 相关文章 | 多维度评价
现实世界中许多复杂系统均被建模成复杂网络,如社交网络、科学家协作网络等。复杂网络的研究吸引了不同领域的诸多研究者的广泛关注。挖掘社团结构,即将网络划分到具有类内链接稠密、类间链接稀疏的不同社团,是复杂网络研究的问题之一。研究复杂网络社团检测对分析复杂网络中潜在结构、规律以及社团的形成有着至关重要的意义,并且有着广泛的应用前景。鉴于复杂网络中同时包含了网络拓扑与节点内容,结合节点内容的社团检测研究将成为该研究领域的新趋势之一。文中介绍了复杂网络社团检测的研究背景和研究意义;并从基于网络拓扑、基于节点内容和基于网络拓扑和节点内容融合3个方面,较为全面地对社团检测研究现状进行了梳理以及对其面临的问题进行了分析。从3类社团检测方法中选择了10种具有代表性的算法,对它们进行性能对比和时间复杂度分析,以期望描绘关于社团发现新趋势的清晰轮廓。
电子病历可视化研究综述
叶显忆, 柴艳妹, 郭凤英
计算机科学. 2023, 50 (11A): 221100265-11.  doi:10.11896/jsjkx.221100265
摘要 ( 329 )   PDF(7070KB) ( 339 )   
参考文献 | 相关文章 | 多维度评价
随着医疗信息化技术的不断发展,对电子健康记录(EHR)数据的深入挖掘和有效利用在辅助医疗领域发挥着越来越大的作用。对近十年来基于电子病历的数据可视化方法和技术进行了总结、梳理和展望。首先,利用知识图谱方法对该领域的研究热点和发展趋势进行梳理;然后,从文献中提取出可视化技术的一般流程和4项任务,即对比分析、异常检测、模式发现和决策支持;再分别对具有代表性的技术方法进行描述、分类和评价;最后,归纳出电子病历可视化研究中的5种可视化表现形式和3个可视化维度,并在此基础上探讨各种方法的适用场景。分析发现,电子病历可视化技术不仅可帮助医护人员在临床诊断中更直观地了解病人的状态,也可帮助研究人员分析挖掘EHR数据的价值,对互联网医疗和智慧医疗的发展具有积极意义。但目前该领域的研究也存在中文医疗词典和知识库较少、不能有效处理海量时变数据以及缺少统一和量化的评价方法等问题。
基于数据库表的微服务拆分方法
黄志成, 柳先辉
计算机科学. 2023, 50 (11A): 230200102-7.  doi:10.11896/jsjkx.230200102
摘要 ( 117 )   PDF(1875KB) ( 237 )   
参考文献 | 相关文章 | 多维度评价
微服务架构和云平台容器化部署是当前软件工程实践中一个比较热门的话题,很多研究报告表明越来越多的软件开发者正在将单体架构向微服务架构转型。在将单体架构应用拆分成微服务架构应用的过程中,实施者面临着一个重要的挑战,即缺乏一个明确的方法将单体应用高效准确的进行拆分。针对这个问题,提出了一种基于数据库表的微服务拆分方法并实现了一个拆分工具。该方法通过收集项目中的所有 SQL 语句,并结合数据库表之间的主外键关系,生成表关联矩阵,根据这个表关联矩阵初步划分出一部分微服务。然后根据测试案例收集所有的交易链路,再结合交易链路分析表和微服务之间的关系,计算出独立的表和微服务的关联度矩阵,根据这个独立的表和微服务的关联度矩阵来完成最终的微服务数据库表的划分,最后按照提出的规则进行微服务代码的拆分。实验结果表明,所提方法可以帮助软件开发者高效准确地进行微服务拆分。
基于子图特征的节点排序算法
陈端兵, 杨志杰, 曾卓, 傅彦, 周俊临, 赵俊严
计算机科学. 2023, 50 (11A): 230100122-7.  doi:10.11896/jsjkx.230100122
摘要 ( 438 )   PDF(2519KB) ( 274 )   
参考文献 | 相关文章 | 多维度评价
复杂网络理论已被广泛应用于各个领域,节点重要性排序研究是复杂网络领域的重要分支。复杂网络中节点重要性排序及重要节点挖掘对分析和理解复杂网络的结构与功能具有重要意义。众多学者针对复杂网络的关键节点识别和节点重要性排序问题进行了深入研究,取得了大量研究成果。但随着人工智能的发展和数据体量的飞速增长,复杂网络规模呈指数级增长,传统算法的准确性和泛化性已经无法满足现实需求。文中基于节点的二阶邻域信息,提出了一种基于子图特征的节点重要性排序(Subgraph Feature Extraction Rank,SFE Rank)的机器学习模型。利用二阶邻域信息,建立局部子图的含权邻接矩阵,通过矩阵特征分解提取能够有效反映节点局部特征信息的向量表征,在此基础上,建立机器学习模型,用于学习节点子图特征向量和节点重要性的关联关系。在9个真实网络上进行实验,结果表明,相比已有的节点重要性排序方法,所提方法具有更优的排序效果和更好的泛化性能。
基于时空注意力机制的多元时间序列异常检测
梁李芳, 关东海, 张吉, 袁伟伟
计算机科学. 2023, 50 (11A): 230300022-8.  doi:10.11896/jsjkx.230300022
摘要 ( 226 )   PDF(2783KB) ( 270 )   
参考文献 | 相关文章 | 多维度评价
物联网系统被广泛应用于各种基础设施,系统中涉及许多相互连接的传感器,这些传感器产生大量的多元时间序列数据。由于物联网系统容易遭受网络攻击,多元时间序列异常检测方法被用于及时监测系统中发生的异常,这对于保障系统安全至关重要。然而,由于高维传感器数据关系复杂,现有的大多数异常检测方法难以明确学习多元时间序列的相关性,导致异常检测的准确率较低。因此,提出一种基于时空注意力机制的多元时间序列异常检测方法(STA)。首先,以图形结构的形式学习传感器间的关系,再使用多跳图注意力网络为图中每个传感器节点的多跳邻居节点分配不同的注意力权重,用于捕捉序列的空间相关性。其次,采用基于长短时间记忆网络的时间注意力机制自适应地选择相应的时间序列,用于学习序列的时间相关性。在4个真实世界传感器数据集上的实验结果表明,STA可以比基线方法更准确地检验时间序列中的异常,其F1分数分别优于最佳基线31.03%,14.29%,15.91%和21.74%。此外,消融实验和灵敏度分析验证了模型中的关键组件的有效性。总的来说,STA可以有效捕捉多元时间序列中的空间和时间相关性,提高模型的异常检测性能。
基于PCA-MC的土壤湿度数据重构算法
王杉, 刘璐
计算机科学. 2023, 50 (11A): 230300073-6.  doi:10.11896/jsjkx.230300073
摘要 ( 228 )   PDF(3995KB) ( 213 )   
参考文献 | 相关文章 | 多维度评价
土壤湿度在气象、气候等学科中起着重要作用,然而目前观测的土壤湿度数据缺少高精度、高空间分辨率,其适用性受到很大的限制。矩阵填充(Matrix Completion,MC)是压缩感知在矩阵上的应用,它针对部分缺失、污染、损毁的大规模数据,旨在将一个低秩不完整的矩阵,利用其元素间的相关性,恢复出矩阵的全部数据,适用于土壤湿度这类时空相关性高但缺失值多的数据。但其要求矩阵秩是相关或近似相关的,而土壤湿度的秩不稳定。对此,通过预设矩阵的秩,引入主成分分析方法(Principal Component Analysis,PCA),在降低矩阵维度的同时保留大部分信息,并在此基础上对具有缺失值的土壤湿度数据进行矩阵填充。实验选取了ERA-Interim 2022年部分地区的卫星土壤湿度数据,结果显示,相较于传统的MC算法,引入主成分分析的PCA-MC(Low Rank Matrix Completion)的实验结果的偏差减小了28.6%,均方根误差减小了5.78%,最大误差减小了14.8%,同时缩短了重构时间,这表明,PCA-MC方法相比MC方法可以有效地重构有缺失值的大规模矩阵。
结合图注意力机制的知识图谱推荐算法
张小婉, 邓秋军, 柳先辉
计算机科学. 2023, 50 (11A): 230100057-7.  doi:10.11896/jsjkx.230100057
摘要 ( 316 )   PDF(2146KB) ( 227 )   
参考文献 | 相关文章 | 多维度评价
由于传统推荐算法存在数据稀疏性和冷启动问题,并且将物品作为单独的个体,没有考虑到物品之间存在的关系。为了解决这些问题,考虑引入知识图谱这一辅助信息。但现有的基于路径以及基于嵌入的知识图谱推荐算法没有考虑不同实体对于用户的重要性不同,导致重要性更低的实体对推荐结果的影响反而更大。针对这类局限性,文中提出了一种结合图注意力机制的知识图谱推荐系统,该推荐系统首先使用图嵌入方法生成用户和项目的初始表示,然后在表示传播时采用注意力机制区分不同邻居实体的重要性,通过权值加和来生成用户和项目的向量表示,最后预测层生成用户和项目的最终表示,并根据最终表示预测用户和项目交互的概率。在两个公开数据集Amazon-book和Last-fm上与其他算法进行对比实验,实验结果表明,该模型在指标recall,ndcg,precision,HR上均有提高,证明其能有效提高推荐的准确度。
基于全局特征增强的会话推荐算法
靳博文, 王庆梅, 胡承佐, 魏嘉呈
计算机科学. 2023, 50 (11A): 220800205-8.  doi:10.11896/jsjkx.220800205
摘要 ( 299 )   PDF(2128KB) ( 234 )   
参考文献 | 相关文章 | 多维度评价
基于会话的推荐系统的研究通常侧重于在使用浅层神经网络的同时通过聚集节点的K跳邻域来对当前会话用户偏好建模,但是此类方法面临着过平滑的问题。为此,提出了一种基于全局特征增强的会话推荐算法(GFE-SR)。首先,该方法在会话图中利用图神经网络和注意力机制获得会话级项目表示。其次,在全局图的特征传播阶段给每个节点的最近邻域按比例赋予权重来限制过平滑问题,通过全局图进行特征表征融合,获得特征增强的全局级项目表示。然后,通过注意力机制聚合两种项目表示对当前会话的用户偏好进行建模,最终输出候选项目的预测概率。在3个基准数据集上的实验表明,该方法的性能优于现有的最佳方法如 GCE-GNN 等,最高可提升5.2%,证明了该方法的有效性。
基于知识图残差注意力网络的推荐方法
范洪玉, 张永库, 孟祥福
计算机科学. 2023, 50 (11A): 220900180-7.  doi:10.11896/jsjkx.220900180
摘要 ( 238 )   PDF(2241KB) ( 226 )   
参考文献 | 相关文章 | 多维度评价
随着互联网的高速发展,推荐系统已成为缓解信息过载的重要手段之一。当前的推荐方法主要采用深度学习模型挖掘用户对项目的兴趣度,但是目前使用图神经网络的推荐方法无法有效表征用户和项目之间的交互行为,并且网络层数的增加会产生梯度消失问题。因此,文中提出了一种新的模型,基于正交变换和图上下文的知识图嵌入方式并融合残差网络和注意力机制的模型。首先,通过嵌入节点的邻居属性来表征用户与项目的交互行为,然后通过图神经网络和残差网络分析用户项目交互行为,最后利用注意力机制区分不同的邻域,提高推荐的准确性。通过在Alibaba-fashion和Last-FM两个真实数据集上进行实验,结果表明所提方法能够显著提升推荐效果。
基于物品关联协同过滤的下一购物篮推荐算法
蒋滨泽, 邓欣, 杜雨露, 张恒
计算机科学. 2023, 50 (11A): 221000076-6.  doi:10.11896/jsjkx.221000076
摘要 ( 129 )   PDF(2315KB) ( 241 )   
参考文献 | 相关文章 | 多维度评价
下一购物篮推荐系统的目标是根据用户的历史购物篮序列,为用户推荐下一个购物篮可能购买的物品。然而现有的方法侧重于把购物篮内的每个物品看作是独立的部分进行推荐,忽略了购物篮内物品之间的联系,从而影响推荐结果的准确性。针对这一问题,文中提出了一种基于物品关联协同过滤的下一购物篮推荐算法(Correlation Between Items Collaborative Filtering,CBICF)。首先对用户的历史购物篮序列进行建模生成用户的个性化物品频率信息,并用它对用户进行近邻聚类;然后通过物品关联性度量方法生成物品关联矩阵,以加权融合的方式来获取用户偏好物品的关联物品信息,从而提高推荐的准确度。在两个真实数据集上进行实验比较与分析,结果表明该算法在各评价指标上均优于对比算法。特别是在探索新物品的情形中,所提方法的推荐准确度相比于其它基于协同过滤的方法有显著提升。
融合物品关系的图神经网络推荐算法
廖冬, 于海征
计算机科学. 2023, 50 (11A): 230100019-9.  doi:10.11896/jsjkx.230100019
摘要 ( 114 )   PDF(3750KB) ( 237 )   
参考文献 | 相关文章 | 多维度评价
典型的社交推荐方法都受限于对用户的行为建模,如用户与用户之间的社交行为、用户与物品之间的交互行为,而忽略了用户感兴趣的多个物品之间存在的潜在相关性,导致信息丢失。在数据稀疏的推荐场景中,用户行为的稀疏性导致系统可用的信息不足,因此需要引入具有丰富内涵的物品关系作为辅助信息。文中致力于融合用户行为和辅助信息共同建模用户的偏好,以提升推荐的准确性。推荐系统中的数据大多可以表示为图结构,例如用户的社交行为、交互行为和物品关系,可以转化为用户-用户图、用户-物品图和物品-物品图。图神经网络在处理大规模图形数据方面颇有成效,建立一个包含物品关系的图神经网络推荐框架面临巨大的挑战:1)物品-物品关系是隐式的;2)用户-用户图、用户-物品图、物品-物品图,是3种不同类型的图;3)用户与用户、用户与物品、物品与物品之间的联系都具有异质性。为了解决上述问题,文中提出了一种新的基于图神经网络的社交推荐方法(PEVGraphRec),引入了一种数学上的方法显式地构建物品间的连接,该模型能够内在地结合3种不同的图,以便更好地学习用户偏好。最后,提出了注意力机制来综合地考虑不同信息的权重。在3个真实数据集上进行实验,实验结果证明了所提方法的有效性。
基于动态负采样的图卷积协同过滤推荐模型
马汉达, 方雨清
计算机科学. 2023, 50 (11A): 230200149-7.  doi:10.11896/jsjkx.230200149
摘要 ( 409 )   PDF(2947KB) ( 261 )   
参考文献 | 相关文章 | 多维度评价
负采样对协同过滤算法的准确性有很大的影响。针对现有的图卷积网络缺乏对负采样策略的探索这一问题,提出一种基于动态负采样的图卷积协同过滤推荐模型(Dynamic Negative Sampling-Based Graph Convolution Collaborative Filtering Recommendation Model,DGCCF)。首先,为了能更灵活地适应不同图数据的需求,在图卷积网络中引入归一化参数来调节节点进行信息传递时邻域对其的影响;其次,提出一种动态负采样策略,从用户未交互过的物品节点中选取负样本集,经过图卷积后得到负样本评分,选取评分最高的负样本作为难负样本;最后,将得到的难负样本和正样本作为样本对输入贝叶斯个性化排序函数,对模型进行优化。在Gowalla,Yelp2018和Amazon-Book 3个公开数据集上与基线模型进行的对比实验表明,DGCCF在多个评价指标下均优于现有的基线方法,在3个数据集上,召回率分别比最优基线提升了0.3%,9.4%和10.6%。
一种基于相似学习者判定的个性化学习路径推荐及验证方法
冯舒, 祝义, 宋媚, 居程程
计算机科学. 2023, 50 (11A): 220900067-10.  doi:10.11896/jsjkx.220900067
摘要 ( 264 )   PDF(3419KB) ( 214 )   
参考文献 | 相关文章 | 多维度评价
基于相似学习者判定方法由于具有轻量级的特点而被广泛用于个性化推荐领域,目前一般采用协同过滤等机器学习的方法,但此类方法并不能保证判定过程的可解释性以及判定结果的可信性。针对这一问题,提出一种基于相似学习者判定的个性化学习路径推荐及验证方法,采用进程互模拟的方式研究相似学习者的判定过程。首先,扩展CCS(Calculus of Communication System)的行为特性,提出LR-CCS(Learning Resources-Calculus of Communication System),用于建模学习者的学习行为序列;其次,通过进程代数中互模拟理论判定学习者学习行为序列相似性,提出学习行为序列强(弱)互模拟关系判定算法进行互模拟关系判定;再次,使用互模拟验证工具MWB(Mobile Workbench)验证学习者学习行为序列相似性,得到满足互模拟关系的候选推荐路径,以保证判定结果的正确性;最后通过一个基于相似学习者的推荐系统实例验证了该方法的有效性。关键词:学习行为序列相似性;进程代数;CCS;互模拟
一种基于时效近邻可信选取策略的协同过滤推荐方法
韩志耕, 范远哲, 陈耿, 周婷
计算机科学. 2023, 50 (11A): 220800199-11.  doi:10.11896/jsjkx.220800199
摘要 ( 249 )   PDF(2950KB) ( 225 )   
参考文献 | 相关文章 | 多维度评价
传统协同过滤推荐通常基于数据是静态的假设,在数据稀疏时存在推荐精度低下的问题。为解决该问题,一些研究尝试向推荐策略中添加有关用户兴趣变化、推荐能力可信度等补充信息,但对误导或干扰推荐的恶意用户兴趣策略变化和推荐能力波动等异常情况欠缺考虑,系统抗攻击性、推荐稳定性与可信性均难以得到保证。通过引入兴趣时效相似度和推荐信度重估两个概念,提出了一种基于时效近邻可信选取策略的协同过滤推荐方法。该方法充分考虑了影响目标用户近邻筛选质量的用户兴趣异常变化和推荐能力波动两个关键因素,构建了包含时效近邻筛选、可信近邻选取和评分预测3个策略的推荐流程。在MovieLens数据集和亚马逊video game数据集上,利用平均绝对误差,平均预测增量,攻击用户查准率、查全率和调和平均等评估指标,对所提策略与其他6种基准策略进行了比较。结果显示,新策略在推荐精度、抗攻击力和攻击者识别力上均有明显的性能提升。
基于课程学习和图嵌入的协同推荐
黄飞虎, 帅剑波, 彭舰
计算机科学. 2023, 50 (11A): 221100030-8.  doi:10.11896/jsjkx.221100030
摘要 ( 259 )   PDF(3025KB) ( 215 )   
参考文献 | 相关文章 | 多维度评价
推荐系统主要基于用户信息提供个性化服务。然而,用户对数据隐私泄露的广泛关注,给当前推荐算法提出了新的挑战。现有工作主要从差分隐私、匿名化、密码学和联邦学习的角度解决隐私泄露问题,但存在数据扰动和计算复杂的缺点。不同于现有工作,文中提出了基于课程学习和图神经网络的协同过滤模型(CLG-CF),充分利用评分表在隐式反馈的场景学习用户和物品嵌入。CLG-CF利用二部图建模评分表,基于图卷积网络实现用户和物品的表示学习,然后通过多层神经网络完成(用户,物品)对的预测。CLG-CF模型在训练过程中,采用负采样计算增强样本,为了解决样本的真伪问题,创新地引入课程学习指导模型学习。在3个真实的大规模数据集上进行了实验,结果表明 CLG-CF模型在不使用用户和物品信息的情况下,能够实现不错的推荐效果。
基于邻域系统的粗糙集模型的代数性质
刘银山, 王豪, 秦克云
计算机科学. 2023, 50 (11A): 220800051-6.  doi:10.11896/jsjkx.220800051
摘要 ( 183 )   PDF(1694KB) ( 203 )   
参考文献 | 相关文章 | 多维度评价
基于邻域系统的粗糙集模型是基于一般二元关系的广义粗糙集模型以及覆盖粗糙集模型的扩展。一般来说,不同的邻域系统可能生成相同的近似算子。给出不同邻域系统生成相同近似算子的条件,进而基于近似算子提出一种对邻域系统分类的方法。另外,给出基于邻域系统的粗糙近似算子的公理化描述方法。
聚类联邦学习簇间优化
李仁杰, 闫巧
计算机科学. 2023, 50 (11A): 221000243-5.  doi:10.11896/jsjkx.221000243
摘要 ( 248 )   PDF(2844KB) ( 268 )   
参考文献 | 相关文章 | 多维度评价
聚类联邦学习常用于解决联邦学习中数据异质性导致准确率下降的问题,通过聚类算法将数据分布相似的客户端划分到相同簇中,簇模型用于解决某个特定分布问题。当前聚类联邦学习中为了获得好的实验结果,研究者通常将相同的分布训练集和测试集分配到同一个簇中,然而现实中无法达到实验理想效果,本地客户端中使用模型的数据集与训练模型的数据集分布可能不同,当分布不同时聚类联邦学习的簇模型准确率会大幅下降,影响本地端设备的簇间准确率。文中提出两种方案提升聚类联邦学习中簇模型的簇间准确率。第一种方案是自适应聚类联邦学习(AWCFL),在簇内聚合时加入其他簇的模型,使得簇模型学习到其他分布的知识,有效提升簇模型的簇间准确率;第二种方案是多分布聚类联邦学习(MCFL),将簇模型同步到每个客户端,让客户端选择合适的模型使用,该方案相对于第一种方案簇内准确率不会下降,簇间准确率提升明显。上述两种方案在Mnist和EMnist数据集上进行实验,与IFCA,CFL(Clustered Federated Learning)和FedAvg进行比较,簇间准确率明显提升。
δ-sober空间及其性质
王武, 谭彬, 张舜
计算机科学. 2023, 50 (11A): 220900008-4.  doi:10.11896/jsjkx.220900008
摘要 ( 220 )   PDF(1688KB) ( 206 )   
参考文献 | 相关文章 | 多维度评价
文中讨论了δ-sober空间的一些基本性质,引入了s2-弱收敛空间的概念,并讨论了δ-sober空间和s2-弱收敛空间的关系。主要结论有:(1)δ-sober空间的子空间为δ-sober空间;(2)设(X,τ)为IDC空间,则(X,τ)s2-弱收敛空间当且仅当(X,τ)δ-sober空间;(3)s2-弱收敛的IDC空间上的拓扑τ与在特殊化序下的σ2-拓扑一致,并且O(X)=Oσ2(X)=OSI2(X);(4)设(X,τ)SI2-拟连续空间,则(X,τSI2)δ-sober空间;(5)设(X,τ)δ-sober的局部超紧空间,则(X,τ)s2-拟连续偏序集。
基于图嵌入的正交局部保持投影无监督特征选择
朱建勇, 李兆祥, 徐彬, 杨辉, 聂飞平
计算机科学. 2023, 50 (11A): 220900003-9.  doi:10.11896/jsjkx.220900003
摘要 ( 258 )   PDF(4238KB) ( 225 )   
参考文献 | 相关文章 | 多维度评价
传统的基于图学习的无监督特征选择算法通常采用稀疏正则化方法来选择特征,但这种方法过于依赖于图学习的效率,并且存在正则化参数调优困难等问题。为解决这些问题,针对性地提出了一种基于图嵌入学习的正交局部保持投影无监督特征选择(Orthogonal Locality Preserving Projection Unsupervised Feature Selection via Graph Embedding,OLPPFS) 算法。首先,利用能够保持数据局部几何流形结构的局部保持投影方法增强数据的线性映射能力,同时约束正交方向投影以方便数据重构;其次,通过图嵌入学习方法快速构建稀疏相似图来描述样本数据的内在结构;接着,采用$\ell$2,0范数约束投影矩阵的值,准确选择指定数目的判别性特征子集;最后,针对$\ell$2,0范数NP难题,设计一种有效求解$\ell$2,0范数问题的无参迭代算法求解该模型。仿真结果表明了所提算法的有效性和优越性。
贝叶斯网络结构学习的CMIHC算法
李晓晴, 于海征
计算机科学. 2023, 50 (11A): 220800046-7.  doi:10.11896/jsjkx.220800046
摘要 ( 262 )   PDF(2430KB) ( 228 )   
参考文献 | 相关文章 | 多维度评价
贝叶斯网络源于对人工智能领域不确定问题的研究,是进行不确定问题推理和数据分析的重要工具。自贝叶斯网络结构学习诞生以来,已有众多成熟的结构学习算法,包括基于依赖分析的方法、基于评分搜索的方法和混合搜索的方法。其中利用信息论进行结构修剪已成为常用手段,但条件互信息中条件集的选取并没有统一标准,导致网络结构的修剪不一致。爬山算法利用3种搜索算子对网络结构进行局部更新,通过评分函数得到最优结构。结合信息论和爬山算法思想,提出一种新的结构学习算法——CMIHC(Conditional Mutual Information Hill Climbing)算法。该算法利用互信息和创建的条件集修剪初始连通图,对其进行定向,进而得到初始网络结构,结合评分函数和爬山算法的贪婪搜索策略得到最优网络结构。通过实验分析,在精度和效率上,CMIHC算法效果优于其他对比算法。
基于深度时间对比的中断航迹关联方法
侯海轮, 雷艺, 魏博, 樊玉琦
计算机科学. 2023, 50 (11A): 220900164-9.  doi:10.11896/jsjkx.220900164
摘要 ( 113 )   PDF(2861KB) ( 258 )   
参考文献 | 相关文章 | 多维度评价
雷达在跟踪飞行目标时,常发生跟踪中断的现象。深度学习方法具有强大的学习能力,已被逐渐用于解决中断航迹关联问题。但已有基于深度学习的中断航迹关联方法未能充分考虑新老航迹特征之间的相似性,关联性能仍有待提升。因此提出一种基于深度时间对比的中断航迹关联算法(Track Segment Association based on Deep Temporal Contrasting,TSADTC),包括航迹特征提取模块、时间对比模块、航迹特征对比模块和分类器模块。航迹特征提取模块利用双向长短期记忆网络和编码器-解码器分别对新老航迹进行特征提取;时间对比模块分别使用一条航迹的特征预测另外一条航迹;航迹特征对比模块计算两条航迹的特征差别,并将此差别输入分类器中,以计算两条航迹关联的概率。算法将关联概率最大的航迹对作为关联航迹对。仿真实验表明,TSADTC算法能够有效提高中断航迹关联的正确关联率、错误关联率和航迹漏关联率性能。
频繁量化模式图挖掘及应用
沙雨济, 王欣, 何艳潇, 钟学燕, 方宇
计算机科学. 2023, 50 (11A): 230100041-12.  doi:10.11896/jsjkx.230100041
摘要 ( 242 )   PDF(4235KB) ( 222 )   
参考文献 | 相关文章 | 多维度评价
频繁模式挖掘(FPM)是图数据研究领域的一个经典问题,单一大图上的FPM问题近年来受到了更加广泛的关注。该问题被定义为根据用户给定的频率阈值查找在大图(Graph)中频繁出现的所有模式图(Pattern)。近年来,人们见证了FPM在多个领域的广泛应用,例如社交网络分析、欺诈检测等。然而,面对新兴的应用需求,人们需要更具语义表达力的模式图及其挖掘技术。为此,在传统模式图的基础上,首先提出了量化模式图(Quantified Graph Patterns,QGPs)——一类具有计数量词约束的模式图,实现了模式图语义的扩展;其次设计了一种在分布式场景下挖掘QGPs的算法,提出了量化图模式关联规则(Quantified Graph Pattern Association Rules,QGPARs)及其挖掘技术,用于预测(社交)网络中实体之间的潜在联系,然后利用真实图和合成图数据,通过翔实的实验验证了QGPs挖掘算法的计算效率,通过与经典链接预测方法进行对比,发现QGPARs可以取得更高的链接预测准确性;最后通过与传统图模式关联规则(Graph Pattern Association Rules,GPARs)的链接预测结果进行对比,验证了QGPARs与GPARs之间在链接预测结果方面存在显著差异,也进一步验证了QGPARs在链接预测中的有效性。
基于知识蒸馏和高效通道注意力的异常检测
周士金, 邢红杰
计算机科学. 2023, 50 (11A): 220900034-10.  doi:10.11896/jsjkx.220900034
摘要 ( 496 )   PDF(4277KB) ( 363 )   
参考文献 | 相关文章 | 多维度评价
基于知识蒸馏的异常检测方法通常将经过预训练的网络作为教师网络,并将与该教师网络的模型结构及规模大小相同的网络用作学生网络,对于待测数据,利用教师网络与学生网络之间的差异判定其为正常数据或异常数据。然而,教师网络与学生网络的结构和规模均相同,一方面,会使得基于知识蒸馏的异常检测方法在异常数据上产生的差异过小;另一方面,教师网络的预训练数据集在规模上远大于学生网络的训练集,这会使得学生网络产生大量的冗余信息。为了解决上述问题,将高效通道注意力(Efficient Channel Attention,ECA)模块引入到基于知识蒸馏的异常检测方法中,利用ECA的跨通道交互策略,设计比教师网络结构更简单且规模更小的学生网络,既可以有效地获取正常数据的特征,去除冗余信息,又能增大教师网络与学生网络之间的差异,提高异常检测的性能。在6个图像数据集上的实验结果表明,与其他5种相关方法相比,所提方法取得了更优的检测性能。
基于图卷积网络和注意力机制的诊断预测
杨仙明, 詹贤春, 程恒亮, 丁海燕
计算机科学. 2023, 50 (11A): 221100232-6.  doi:10.11896/jsjkx.221100232
摘要 ( 114 )   PDF(2297KB) ( 181 )   
参考文献 | 相关文章 | 多维度评价
诊断预测是医疗保健中一项重要的预测任务,其目的是根据患者的历史健康记录预测其未来的诊断。基于注意力机制和循环神经网络的预测模型被广泛应用于解决这一任务,但容易受到数据不足的影响。此外,医学领域知识在改进诊断预测模型性能上已经显示出重要作用,但现有方法还不能充分利用这些领域知识。因此,设计了一种基于图卷积网络和注意力机制的诊断预测模型。具体而言,首先利用医学本体对医学概念之间的相关性进行建模,并将患者就诊信息构建为一个图;其次,通过图卷积模块在图结构上获取患者每次就诊中各医学代码之间的空间特征;最后利用多头注意力机制来对就诊特征和多级医学知识之间的相互关系进行建模,从而对患者的未来健康状况进行预测。在两个公开的医疗数据集上的实验结果表明,该模型的诊断预测性能优于已有诊断预测模型,可以更有效地利用医学知识图中的潜在信息。
基于博弈动态影响图的股市趋势推理算法
姚宏亮, 尹致远, 杨静, 俞奎
计算机科学. 2023, 50 (11A): 221100039-7.  doi:10.11896/jsjkx.221100039
摘要 ( 240 )   PDF(2469KB) ( 225 )   
参考文献 | 相关文章 | 多维度评价
股票市场是一个复杂非线性动态系统,具有高度不确定性和多变性,股市趋势预测是数据挖掘领域的一个研究热点。针对基于数据驱动方法所生成的模型鲁棒性差,训练良好的模型不适应实际需要的问题,提出了一种多Agent博弈动态影响图模型( Mulit-Agent Game Dynamic Influence Diagrams,MAGDIDs)。首先,从博弈的角度引入多方和空方作为股市的行为主体(Agent),提取行为主体的相关特征;然后,利用能量表示博弈主体的力量大小,并对行为主体特征进行量化融合;进而引入博弈策略,构建多Agent博弈动态影响图模型,对于股市行为主体的博弈过程进行建模;最后,利用联合树的自动推理技术,预测股市趋势。在实际数据上进行实验,实验结果表明多空博弈趋势预测算法具有良好性能。
基于投影相关和随机森林融合模型的疾病诊断
韩怡梅, 李东喜
计算机科学. 2023, 50 (11A): 230200172-6.  doi:10.11896/jsjkx.230200172
摘要 ( 326 )   PDF(2333KB) ( 201 )   
参考文献 | 相关文章 | 多维度评价
针对高维数据的处理方法已成为当前研究大数据的热点问题之一。提出一种基于投影相关系数的两阶段随机森林模型(Projection Correlation-Random Forest,PC-RF),它将度量随机变量相关性的投影相关系数与随机森林算法相融合,在预测性能上表现出更优的结果。使用3种基因微阵列数据进行实证分析,在Leukemia和Colon数据集实验中,所提模型比现有算法准确率提升了2.4%~6.5%;在Breast数据集实验中,所提模型比传统随机森林模型准确率提升了3.55%~9.26%,同时在不同规模高维数据中的多种评价指标上表现稳定且优良。所提模型应用在基于微阵列数据的疾病诊断领域,将为疾病预防和诊断治疗提供更加科学有效的决策支持。
一种基于Meta-learning改进的特征交互算法
白静, 耿新宇, 易流, 穆禹锟, 陈琴, 宋杰
计算机科学. 2023, 50 (11A): 230100087-8.  doi:10.11896/jsjkx.230100087
摘要 ( 299 )   PDF(3403KB) ( 222 )   
参考文献 | 相关文章 | 多维度评价
特征交互在推荐系统领域的广告点击率(Click-Through Rate,CTR)预测任务中至关重要,当前业界做的特征交互往往是基于内积、外积等矩阵变换,这些操作没有引入额外的信息,可以作为衡量两个向量相似性的手段,但作为特征交互的表示不一定是可靠的,许多特征交互无法有效提高点击率预测性能。首先从改善特征交互方式的角度入手引入额外的参数来学习一个映射,假设这个映射能够将两个向量的表征映射成交互的表征。学习映射的过程能够通过元学习(Meta-learning)来实现,故构建一个学习器以函数的方式表征特征交互。另外,不同的特征对不一定采取相同的方式交互,不能通过同一种交互方式得到所有特征对,因此设计一组元学习器(meta-learner)来学习映射函数,引入门控网络(GateNet)学习模型中元学习器的分布,那么不同的特征嵌入可以由一组元学习器得到表征。基于以上两点提出了一种融合多个元学习器并结合门控网络(Multiple meta-learners combined with GateNet,gate-MML)的特征交互算法,通过学习不同特征的联系和差异提高每个特征交互的质量。为了验证所提算法的性能,在xDeepFM模型上采用gate-MML做进一步的特征交互,采用2个真实广告点击率预测的数据集进行实验,并使用Logloss作为损失函数,AUC作为评价指标。实验结果表明与传统的CTR预测模型相比,改进算法提升了广告点击率预测任务的预测性能。
基于配置语句树的网络设备配置异常检测算法
沈袁程, 班瑞, 陈昕, 华润多, 汪云海
计算机科学. 2023, 50 (11A): 230200128-10.  doi:10.11896/jsjkx.230200128
摘要 ( 185 )   PDF(3342KB) ( 241 )   
参考文献 | 相关文章 | 多维度评价
随着网络通信设备的发展,设备配置异常引发的问题日益显著。传统的检测工具通常只针对拼写、格式等进行检测,无法检测逻辑问题。因此,目前的配置异常检测工作高度依赖工程师经验。为了提高网络服务质量并减少工程师的重复工作,以及解决传统工具检测速度慢、检测能力弱、通用性差等问题,文中借鉴了抽象语法树的设计理念,创新性地提出了一种基于“配置语句树”的无监督异常检测算法。通过统计分析,该算法可以确定7种可检测异常类型,并支持异常定位和异常修改方案的推荐。文中采用运营商现网运营中的配置,根据算法可检测种类、运行时间、准确率和召回率这几个指标进行量化评估和对比分析。实验结果表明,该算法具有良好的鲁棒性,完全能够有效应对网络设备配置异常引发的网络通信问题。
基于遗传算法的生物启发频繁项集挖掘策略
赵学健, 赵可
计算机科学. 2023, 50 (11A): 220700200-8.  doi:10.11896/jsjkx.220700200
摘要 ( 111 )   PDF(2005KB) ( 226 )   
参考文献 | 相关文章 | 多维度评价
精确频繁项集挖掘算法时间效率低下,在处理大规模数据集时力不从心。针对该问题,提出一种基于遗传算法的频繁项集挖掘策略GAA-FIM(Genetic Algorithm combining Apriori property based Frequent Itemset Mining),给出了编码操作、交叉操作、变异操作和选择操作的详细操作规则。该算法将遗传算法与精确频繁项集挖掘算法的向下闭包特性融合,改进了传统的有性繁殖的交叉操作方式,将具有良好遗传基因的个体优先加入到新一代候选种群中,并通过变异操作扩展新一代候选种群的规模,以提升算法的时间效率,获取更佳质量的频繁项集。基于合成数据集和真实数据集对GAA-FIM算法的性能进行了验证,实验结果表明GAA-FIM算法与GAFIM和GA-Apriori等算法相比具有更好的时间效率,频繁项集质量也得到了进一步提升。
一种基于带标签时间约束Petri网扩展可达图的数据流通合规性检测
刘振宇, 董慧, 李华, 王璐
计算机科学. 2023, 50 (11A): 221000118-12.  doi:10.11896/jsjkx.221000118
摘要 ( 185 )   PDF(4004KB) ( 211 )   
参考文献 | 相关文章 | 多维度评价
随着社会制度的不断完善和法律法规的不断健全,企业的经营管理流程面临越来越多的合规性检测要求。利用带标签的时间约束Petri网(LTCPN)模型描述数据流通过程中所遵循的法律法规及行业规则。为了支持更多维度的规则表达,首先需要基于LTCPN可达图构造扩展可达图GNR,然后根据含时间戳的事件日志自动生成实际数据流通模型GNP。通过检测GNP|=GNR是否成立来判断基于含时间戳的事件日志的数据流通过程是否符合LTCPN描述的规则规范。针对语义信息不明的流程模型合规性检测问题,利用图的点与边连接结构是否相同来检测事件语义无关的功能性属性是否合规。对于语义信息明确的流程模型,可以通过节点或边的语义信息有效减少检测过程中探索的状态空间数量,同时可以进一步丰富合规性检测的非功能性属性检测。通过实验验证了该方法在进行合规性检测方面的可行性。
基于spike-and-slab先验的贝叶斯时间序列模型
郭晨蕾, 李东喜
计算机科学. 2023, 50 (11A): 221200131-6.  doi:10.11896/jsjkx.221200131
摘要 ( 156 )   PDF(3096KB) ( 274 )   
参考文献 | 相关文章 | 多维度评价
贝叶斯方法通过引入先验信息并结合似然的方法进行参数估计和变量选择,使模型估计和预测结果更为精确。在贝叶斯框架下考虑时间序列之间的相关性,将偏自相关系数融合先验信息,提出基于spike-and-slab先验的贝叶斯层次时间序列模型(Spike-and-slab Prior with Partial Autocorrelation Coefficients,SS-PAC)。SS-PAC模型采用spike-and-slab先验并结合偏自相关系数,实现时间序列滞后阶数的选择、参数估计和预测。基于模拟数据和真实数据的实证研究表明,该模型相较于以往模型在变量选择和预测结果上表现更优。
基于特征再抽象(FRA)的多元时序预测方法
王昊, 周建涛, 郝昕毓, 王飞宇
计算机科学. 2023, 50 (11A): 221100144-8.  doi:10.11896/jsjkx.221100144
摘要 ( 265 )   PDF(2229KB) ( 258 )   
参考文献 | 相关文章 | 多维度评价
科技领域的衍生行业因普遍存在强时间约束的特性而累积了海量的高维时间序列数据,严峻的数据压力导致传统的数据建模预测方法受制于数据规模和属性维度。支撑高质量的服务对大数据智能预测技术提出了更高的要求,如何在数据层面上实现预测性能的提升是现阶段亟待解决的主要问题。针对上述问题,提出了针对多元时序数据的特征再抽象(Feature Re-Abstraction,FRA)算法,首先通过RobustSTL分解算法提取趋势性和季节性特征(Trend and Seasonality Features,TSFs),实现多元数据的特征二阶抽象,以“抽象即特征”替代传统“标签即特征”的提取策略,再通过Pearson相关系数的运算结果评估再抽象技术捕捉的TSFs与目标参数间的相关强度,证实TSF的数据价值。在FRA算法的基础上结合深度学习模型构建基于数据驱动的多元时序预测算法,通过预测效果验证FRA算法的有效性。实验结果表明,引入TSFs作为数据驱动模型的训练向量能够兼具数据降维、降噪及强相关特性地维持,从而避免模型过拟合并缓解模型欠拟合,提高时序预测算法的准确性和鲁棒性。
基于粒度树和使用关系的大数据价值计算研究
马文胜, 侯锡林, 王宏波, 柳森
计算机科学. 2023, 50 (11A): 230300109-8.  doi:10.11896/jsjkx.230300109
摘要 ( 152 )   PDF(2278KB) ( 193 )   
参考文献 | 相关文章 | 多维度评价
文中研究了大数据最基本的核心“价值数值”。首先阐述了对大数据进行粒化的粗糙集方法、基于聚类的方法、商空间法、模糊信息方法和云模型方法等,并按它们的共同特性——“划分”,对大数据进行“粒化”,按划分的粗细在大数据中建立了“粒度树”,在“粒度树”中定义了“粒空间”。然后定义了粒空间与代表项目之间的使用关系,以及不同粒空间的使用关系满足的条件。最后按照在粒空间的使用关系中每个粒及每个粒集合的使用情况,将使用情况分为3种:“正则使用”“必然使用”“相关使用”。取它们的属性及对象的平均值,并圆整到0至100,作为大数据的“正则价值”“必然价值”“相关价值”的数值。给出大数据最基本的核心“价值数值”的有效计算方法,又给出大数据最基本的核心“价值数值”计算在远程医疗、城市管理、高等院校等多个领域的应用实例。
基于核技巧改进的Informer模型的长序列时间序列预测方法
潘立群, 吴中华, 洪标
计算机科学. 2023, 50 (11A): 221100186-6.  doi:10.11896/jsjkx.221100186
摘要 ( 168 )   PDF(2437KB) ( 321 )   
参考文献 | 相关文章 | 多维度评价
如今,学者们对长序列时间序列问题的预测主要基于类RNN模型,且其中大部分使用的损失函数是传统的均方误差(MSE)。但类RNN模型在预测任务中存在只能捕捉局部信息且计算开销会随着预测序列的增多迅速提升的问题。不仅如此,MSE损失函数无法捕捉长时间序列数据中普遍存在的非线性问题,且自身还存在对异常值敏感和鲁棒性较低的问题。基于以上背景,提出一种完全基于注意力机制的Informer模型,并在模型中使用基于核技巧改进的Kernal-MSE损失函数代替传统的MSE损失函数来解决长序列时间序列预测的问题。在多变量预测多变量的背景下,以3类数据中的8份数据集为例,对比改进后的Informer模型与经典的Informer模型,类RNN模型中的LSTM和GRU模型。结果表明,改进后的Informer模型预测精度更高,且精度的相对提升值随着原始数据量的增大而增大,适用于长序列时间序列预测问题。
基于异构信息网络的信贷反欺诈研究
刘华玲, 张国祥, 王柳月, 梁华璧
计算机科学. 2023, 50 (11A): 221100173-9.  doi:10.11896/jsjkx.221100173
摘要 ( 265 )   PDF(3981KB) ( 323 )   
参考文献 | 相关文章 | 多维度评价
近年来,移动终端设备的数字化程度陡升,信贷行业的欺诈行为呈现出动态发展、行为隐蔽和专业伪装等新特点,海量数据的跨量级增长为传统反欺诈算法的有效性和计算效率都带来了不小的挑战。因此,为了充分学习信贷场景中不同实体间的交互信息,降低算法计算消耗以使其适用于大规模图数据任务,提出了基于异构信息网络的特异群组挖掘算法BKH-(Bron-Kerbosh-H-II),即首先针对源数据中的信贷实体及实体间的关系进行界定和分类,并将不同实体间的相似度作为关系权重,以此构建信贷异构信息网络,对该网络采取了两阶段的基于H图的极大团枚举算法,用于挖掘特异群组,最终通过局部特征工程修正划分得到潜在的欺诈群体,经实验证明,BKH-II在4种评价指标上的准确度分别为 NMI=0.983,NRI=0.96,F-score=0.943,Omega=0.95,并表现出了良好的泛化性和较低的计算复杂性。
一种消除位置偏差的搜索自动补全深度学习排序算法
周明星, 闫湘洲, 于敬, 高昌举, 陈运文, 纪达麒, 金克
计算机科学. 2023, 50 (11A): 220800179-5.  doi:10.11896/jsjkx.220800179
摘要 ( 388 )   PDF(2119KB) ( 217 )   
参考文献 | 相关文章 | 多维度评价
搜索提示自动补全是正式提交搜索之前,影响用户输入搜索内容的关键手段之一,是商业搜索引擎不可或缺的核心功能之一。如何提供更好的提示词,是一个排序问题。在机器学习排序领域,收集的训练数据有位置偏差,且会影响训练模型的排序效果,已经是一个较为普遍的认知。针对以上训练数据有偏问题,对位置偏差和相关度使用深度学习分别建模,并结合改进后的上下文语义特征,新设计一种同时学习位置偏差和提示词相关度的深度学习排序算法(An Unbiased Deep Learning To Rank Algorithm for Suggestion Auto-completion,UDLTR-SAc)提升搜索提示自动补全的排序效果。UDLTR-SAc能自动学习训练数据中由于位置引入的偏差,从而学习到更为准确的相关度计算模型,在与没有考虑有偏问题的同类型算法及经典补全排序算法对比上分别获得显著增长;同时,在线上A/B测试上也获得+0.1%(p<0.1)的GMV增长。
基于注意力机制和ConvLSTM的船舶交通流量预测算法
李刚, 宋文, 陈致远
计算机科学. 2023, 50 (11A): 230800067-7.  doi:10.11896/jsjkx.230800067
摘要 ( 157 )   PDF(3241KB) ( 363 )   
参考文献 | 相关文章 | 多维度评价
船舶交通流量预测是港口智能交通系统的关键技术之一,对港口运输的效率和安全起到至关重要的作用。针对现有预测方法难以有效提取船舶交通流量数据中的时空相关性特征信息的问题,提出了一种基于注意力机制和ConvLSTM的预测方法(ACLN)。ACLN首先通过深度的ConvLSTM构建编码网络,有效提取船舶交通流量数据中的时空相关性特征信息;其次通过注意力机制对提取的时空相关特征信息进行重要性关注,使模型在预测的过程中自动关注更重要的特征信息;最后通过多层的ConvLSTM和CNN构建预测网络,对提取的时空特征信息进行解析并输出预测结果。在真实的港口船舶交通流量数据上验证了所提方法的有效性,实验结果表明,所提方法的预测性能明显优于目前公开的预测方法,能够对一定区域进行有效的长短时预测,具有一定的实用价值。
网络&通信
基于多模态融合和深度学习的调制信号识别
杨小蒙, 张涛, 庄建军, 乔晓强, 杜奕航
计算机科学. 2023, 50 (11A): 220900007-7.  doi:10.11896/jsjkx.220900007
摘要 ( 336 )   PDF(3636KB) ( 329 )   
参考文献 | 相关文章 | 多维度评价
针对现有的调制分类算法大多忽略了不同特征之间的互补性和特征融合的问题,提出了一种利用深度学习模型进行特征融合的方法。该方法试图融合调制信号的时序特征和空间特征,以获得差异性更加明显的识别特征。首先,获取调制信号的A/P信号和I/Q信号;然后,搭建卷积长短时记忆模块与复数密集残差卷积模块分别提取A/P信号的时序特征和I/Q信号的空间特征并将之进行融合,获取融合互补的识别特征;最后,将识别特征输入分类网络,得到识别结果。实验结果表明,基于开源数据集,当信噪比大于5 dB时,识别率达到了93.25%,与基于单一特征识别相比,识别准确率高出3%~11%;利用实际采集数据进行分类识别,进一步证实了所提特征提取模型与融合策略的有效性。
云边协同计算中基于强化学习的依赖型任务调度方法
胡晟熙, 宋日荣, 陈星, 陈哲毅
计算机科学. 2023, 50 (11A): 220900076-8.  doi:10.11896/jsjkx.220900076
摘要 ( 235 )   PDF(3509KB) ( 282 )   
参考文献 | 相关文章 | 多维度评价
云边协同计算中,计算资源分散在移动设备、边缘服务器和云服务器。将应用程序中的计算密集型任务从本地卸载到远程设备执行,利用远程资源来扩展本地资源,是解决移动设备资源受限问题的一个有效途径。针对云边协同计算中存在依赖关系的任务调度问题,提出一种基于强化学习的无模型方法。首先,将移动应用程序建模为有向无环图,建立云边协同计算中的任务调度问题模型。其次,将任务调度过程建模为马尔可夫决策过程,即使用Q学习通过与网络环境交互学习合理的调度策略。实验结果表明,所提出的基于Q学习的依赖型任务调度方法在不同场景下均优于所对比的基准算法,有效地减少了应用程序的执行时间。
基于深度强化学习的无线异构网络中继决策研究
周天玉, 官铮
计算机科学. 2023, 50 (11A): 221000088-5.  doi:10.11896/jsjkx.221000088
摘要 ( 90 )   PDF(2340KB) ( 234 )   
参考文献 | 相关文章 | 多维度评价
在物联网大规模多用户场景中,远端节点需通过中继接入网络。为解决中继在异构接入技术环境下的自适应接入控制问题,提出一种基于深度强化学习的智能中继接入控制策略,将中继对远端用户数据的收发过程视为一个部分可观察马尔可夫决策过程,通过动态决策中继工作状态,以实现最大化系统的总吞吐量和节点公平性目标。首先,建立具有中继的无线异构网的上行链路模型,以提高系统总吞吐量为优化目标,建立中继动态决策优化模型;其次,构建含有LSTM隐藏层的深度Q网络(DQN)作为行为状态值函数,以优化系统总吞吐量。测试结果表明深度强化学习无线异构网络中继决策方案(DRL-RAP)可在确保原有用户服务质量的前提下,为远端用户提供网络接入,系统总吞吐量在原有网络基础上显著提高,吞吐量最大可提高30%。
毫米波MU-MIMO系统中自适应混合预编码器的设计
薛建彬, 王佳豪
计算机科学. 2023, 50 (11A): 221200047-5.  doi:10.11896/jsjkx.221200047
摘要 ( 91 )   PDF(2795KB) ( 204 )   
参考文献 | 相关文章 | 多维度评价
基于毫米波通信和大规模多输入多输出(Multi-input Multi-output,MIMO)技术,构建了适用于蜂窝车联网(C-V2X)等多用户多数据流场景的毫米波大规模MIMO系统,以降低系统的总功耗、硬件复杂度和计算复杂度。设计一种基于比特流的自适应连接大规模MIMO架构,与其他自适应连接架构相比,所提自适应连接架构在阵列分组更小的情况下,使用的移相器和交换开关更少;并且随着阵列分组数的增加,该架构在毫米波多用户MIMO(MU-MIMO)系统中的功耗逐渐降低。仿真结果表明,在采用该架构的毫米波MU-MIMO-OFDM系统中,随着数据流总数的增加,一些现有混合预编码方案可以获得更高的数据传输速率。
基于车流密度的车载边缘计算任务动态卸载策略
赵宏伟, 尤静月, 王阳阳, 赵西珂
计算机科学. 2023, 50 (11A): 220900199-7.  doi:10.11896/jsjkx.220900199
摘要 ( 344 )   PDF(2899KB) ( 275 )   
参考文献 | 相关文章 | 多维度评价
针对车辆边缘计算的问题与挑战,提出了一种车-路-边协同的场景模型。以车辆密度为切入点,定义通信链路中断概率最小化问题,建立关于车流密度的通信速率模型。结合车辆卸载、定价以及资源分配3种策略将系统优化目标描述为车辆侧成本最小化,同时最大化RSU侧效用值的问题,引入问题分解的思想降低问题耦合度,将原始优化目标转换为卸载与定价之间的平衡问题以及资源分配问题。验证卸载与定价博弈的Nash均衡点的存在性,并提出一种基于Stackelberg博弈的分布式算法(SDA)求解优化问题。最后通过仿真实验验证了车流密度对于传输速率的影响,以及SDA为车辆降低了24%的卸载成本,为RSU提高了11%的收益。
车载边缘计算网络中基于MAB的动态任务卸载方案研究
薛建彬, 王海牛, 关向瑞, 郁柏文
计算机科学. 2023, 50 (11A): 230200186-9.  doi:10.11896/jsjkx.230200186
摘要 ( 142 )   PDF(2884KB) ( 267 )   
参考文献 | 相关文章 | 多维度评价
将移动边缘计算技术应用到车载网络所形成的车载边缘计算系统,能够通过任务卸载为其他移动设备提供计算服务。然而,由于车载设备的移动性,导致了车载任务卸载环境是动态变化和不确定的,具有快速变化的网络拓扑、无线信道状态和计算负载,这些不确定性让任务卸载过程非理想化。针对这些不确定性,考虑将MEC服务器的计算资源下沉到车载设备,研究车辆之间的任务卸载,并提出了一种解决方案,使得车辆能够在未知状态信息的前提下学习周围车辆的服务性能并卸载任务。基于多臂老虎机框架,设计了一种二阶探索的强化学习算法,以最大化用户平均卸载回报,并且在一个卸载阶段结束后提出了一种服务集更新方式,以保证用户的服务质量。仿真结果表明,与现有的基于置信上限的算法相比,所提方案下的卸载回报提高了约34%。
用户公平保障的边缘服务缓存与任务卸载算法
吴纯, 陈龙, 孙一飞, 武继刚
计算机科学. 2023, 50 (11A): 230200095-8.  doi:10.11896/jsjkx.230200095
摘要 ( 314 )   PDF(2843KB) ( 263 )   
参考文献 | 相关文章 | 多维度评价
在边缘服务器中缓存服务可缩短请求响应时间,提升用户体验。现有研究主要从整体上优化系统性能,例如最大化系统吞吐量,而无法保障个体用户请求异构服务的公平性。针对用户异构计算任务的不公平服务问题,研究边缘协同计算中的服务缓存和任务卸载策略,基于最大最小公平原则,构建了一个最大化最小服务完成率问题,并证明了其NP难解性。为此,利用线性松弛将原问题从0-1整数规划转化为线性规划,设计了一种近似比为MS/N(S-2 ln S)的随机舍入算法,其中S为边缘服务器数,N为服务数,M为终端设备数。同时,基于优先缓存和卸载完成率最小的服务及其任务,提出了一种快速高效的贪心算法。实验结果表明,与已有最大化系统吞吐量算法相比,提出的随机舍入算法和贪心算法将最小服务完成率分别提升至少44.1%和90.6%,并且其额外的系统吞吐量损失分别不超过22.4%和27.0%。
基于博弈论的多边缘服务器负载均衡策略
翁杰, 林兵, 陈星
计算机科学. 2023, 50 (11A): 221200150-8.  doi:10.11896/jsjkx.221200150
摘要 ( 290 )   PDF(2686KB) ( 229 )   
参考文献 | 相关文章 | 多维度评价
移动边缘计算(Mobile Edge Computing,MEC)作为一种新兴的计算范式,旨在弥补物联网中移动设备的计算、存储和带宽等资源的不足。由于地域、时间等因素,边缘服务器间的负载差异大,因此边缘服务器的负载均衡至关重要。文中提出了一种基于博弈论的边缘服务器负载均衡策略,其满足边缘服务器间的负载均衡需求。首先,将MEC服务器负载均衡问题建模为非合作博弈,引入基于近端分解算法(Proximal Decomposition Algorithm,PDA)的正则化方法来得到唯一的纳什均衡解。然后,根据建立的博弈模型,提出了一种分布式边缘服务器负载均衡算法(Distributed Load Balancing Algorithm,DLBA),优化系统响应时间与能耗。实验结果表明,DLBA能够通过较少的迭代次数快速达到纳什均衡点,且DLBA得到的策略在平均响应时延方面较本地计算策略、基于计算能力分配策略降低了18.39%和9.91%;在平均能耗方面较本地计算策略、基于计算能力分配策略降低了2.42%和7.33%;与粒子群遗传算法得到的最优策略差距较小,但计算时间仅为粒子群遗传算法的1.81%。因此,该策略可以有效降低系统响应时间和能量消耗,且执行时间较短,适用于真实场景。
一种基于延迟与负载的最优边缘服务器放置方法
袁培燕, 马伊雯
计算机科学. 2023, 50 (11A): 220900260-8.  doi:10.11896/jsjkx.220900260
摘要 ( 196 )   PDF(2713KB) ( 214 )   
参考文献 | 相关文章 | 多维度评价
当前边缘服务器放置问题已成为边缘计算发展的关键环节。现有边缘服务器放置方法结合放置成本、网络延迟与系统能耗等指标进行优化,但大多数工作忽略了边缘服务器之间的负载均衡。文中以最小化边缘服务器服务延迟与负载均衡为优化目标,建立边缘服务器放置优化模型,根据该优化模型选择最佳放置位置,并提出了一种基于改进的元启发式算法的边缘服务器放置方案MIWOA-ESP,完成模型中多目标优化并确定基站到边缘服务器映射关系,给出最优放置与分配方案。最后,使用上海电信基站数据集进行性能分析。实验结果表明,与其他基准方案相比,所提MIWOA-ESP放置策略在网络延迟和服务器负载均衡方面具有更好性能。
LN-ERCL闪电网络优化方案
孙敏, 续森炜, 陕童
计算机科学. 2023, 50 (11A): 230200115-5.  doi:10.11896/jsjkx.230200115
摘要 ( 403 )   PDF(2351KB) ( 207 )   
参考文献 | 相关文章 | 多维度评价
近年来区块链发展迅速,交易频率低成为限制区块链进一步发展的障碍。闪电网络作为解决区块链交易频率问题的最优解决方案之一,具有确认时间短、费用低的优点;但也存在着通道容量低、路由代价大、通道易发生拥堵的问题。现有优化方案多是采用第三方托管,延长交易等待时间,但不能从根源解决通道拥堵问题。针对上述问题,文中提出了一种新的闪电网络优化方案。首先在闪电网络内设置超级节点,并赋予超级节点代币用于相互构建通道,用户通过Ethereum Request for Comment标准将比特币转化为代币进入闪电网络;其次提出逃逸值概念,用户节点通过逃逸值计算选择加入一个超级节点;最后改进landmark算法对网络通道进行修剪,提升网络可扩展性,解决通道拥堵问题。仿真结果表明,此方案对闪电网络内交易量较大时的网络拥堵、路径寻优时间长等问题有良好效果。
一种噪声容忍的网络流量分类方法
马继烨, 朱国胜, 卫操, 曾堉萱
计算机科学. 2023, 50 (11A): 220800120-7.  doi:10.11896/jsjkx.220800120
摘要 ( 144 )   PDF(1903KB) ( 208 )   
参考文献 | 相关文章 | 多维度评价
针对传统基于机器学习的网络流量分类方法中样本标签的正确性会直接影响结果精度的问题,提出一种噪声容忍的网络流量分类方法。该方法基于深度残差网络的方法,首先,对网络流量数据进行归一化以及数据增强处理后映射成灰度图片,并对其样本标签进行不同程度的加噪;然后,基于Res2Net深度残差神经网络设计适用于网络流量噪声干扰下的维度模块,构造可以适用于流量标签噪声容忍的深度神经网络模型。基于公开数据集的实验结果表明,与传统的噪声容忍分类算法相比,基于改进的深度残差神经网络在不同噪声率下均提升了分类精度,并且在高噪声率下提升更为显著。
应急通信场景下基于JTORATPAIA的NOMA-MEC系统研究
薛建彬, 安娜, 王琪, 张寒
计算机科学. 2023, 50 (11A): 221000240-8.  doi:10.11896/jsjkx.221000240
摘要 ( 299 )   PDF(2684KB) ( 208 )   
参考文献 | 相关文章 | 多维度评价
在移动边缘计算(MEC)与非正交多址接入(NOMA)技术相结合的应急通信场景中,针对用户自身电池电量受限所导致的无法满足用户业务需求的问题,提出了一个以最小化用户总能耗为目标的无人机辅助NOMA-MEC应急通信系统,设计了一种低复杂度的联合任务卸载比例和传输功率分配迭代算法(JTORATPAIA)。仿真结果表明,与其他基准方案相比,该方案更有效地降低了所有用户的能耗。特别是当输入数据大小为7.5Mbits时,本文所提方案下的能耗与文献[30]相比降低了约40%左右。可见,该方案对于改善应急通信场景下的用户能耗是非常适用的。
基于LSTM神经网络的QPSK智能接收机设计
朱力, 韩会梅, 翟文超
计算机科学. 2023, 50 (11A): 230200219-5.  doi:10.11896/jsjkx.230200219
摘要 ( 117 )   PDF(2805KB) ( 253 )   
参考文献 | 相关文章 | 多维度评价
针对正交相移键控(Quadrature Phase Shift Keying,QPSK)接收机检测信号准确率低以及复杂度高的问题,提出了一种基于长短期记忆(Long Short-term Memory,LSTM)神经网络的QPSK智能接收机设计方案。该方案中的神经网络模型由LSTM和全连接层构成,其利用LSTM提取接收信号的时间相关性,具有较低复杂度。仿真实验结果表明,在加性高斯白噪声、同相和正交( Inphase and Quadrature,IQ)失衡、频率偏差信道因素影响下,与现有QPSK接收机相比,所提出的QPSK智能接收机显著提高了检测性能。
计算机软件&体系架构
一种基于变量隐藏抽象的IC3硬件验证算法
杨柳, 范洪宇, 李东方, 贺飞
计算机科学. 2023, 50 (11A): 230200112-6.  doi:10.11896/jsjkx.230200112
摘要 ( 297 )   PDF(1769KB) ( 274 )   
参考文献 | 相关文章 | 多维度评价
随着硬件设计复杂性和规模的大幅度提升,硬件验证工作更加具有挑战性。模型检验技术作为一种自动化验证技术,可以自动构建反例路径,也因此成为硬件验证领域内最重要的研究方向之一。IC3算法是近些年来最成功的比特级别的硬件验证算法。为了提高验证的规模和效率,硬件验证算法设计逐渐从底层的比特级向更高的抽象级别转变。研究目标是设计一个新型有效的字级IC3算法。针对研究目标,提出了一种将变量隐藏抽象和隐式抽象结合的字级IC3算法IC3VA。该方法尝试将变量隐藏抽象和IC3算法相结合,并设计了对应的泛化和精化方案。在开源社区和硬件验证大赛收集的测试集上和基于谓词抽象的方法进行对比,实验结果显示了基于变量隐藏抽象的IC3算法的有效性。
基于SA-UCB算法的Android应用程序自动化测试方法
王嬉, 赵春蕾, 步志亮, 杨艺
计算机科学. 2023, 50 (11A): 221200145-7.  doi:10.11896/jsjkx.221200145
摘要 ( 211 )   PDF(2557KB) ( 183 )   
参考文献 | 相关文章 | 多维度评价
针对传统强化学习算法需要行为准则学习导致测试效率偏低这一问题,提出一种基于模型的Android应用程序自动化测试方法——SA-UCB。使用Sarsa算法对测试过程进行指导,采取Q表作为动作策略的选取参照。并针对经典Sarsa算法使用的ε-greedy策略随机性过强的问题,引入上界置信算法(the Upper Confidence Bound Algorithm,UCB算法)来平衡测试过程中的“探索-利用窘境”,从而对Sarsa算法进行改进,使动作决策更加分散化,并将其应用于Android自动化测试过程,提高了测试效率。将SA-UCB方法与其他5种测试方法从测试覆盖率、测试效率、故障检测3个方面进行了测试性能的对比实验,结果表明,在相同的实验条件下,SA-UCB策略在测试覆盖率和测试效率方面具有一定优势。
基于智能体的舰船任务可靠度仿真系统设计
文昊林, 狄鹏, 陈童
计算机科学. 2023, 50 (11A): 220800272-7.  doi:10.11896/jsjkx.220800272
摘要 ( 285 )   PDF(5228KB) ( 253 )   
参考文献 | 相关文章 | 多维度评价
针对舰船任务期间保障资源配置对任务可靠度的复杂作用,利用智能体技术的自治性、反应性、社会性等优势解决任务可靠度建模中诸多复杂影响关系的建模和计算问题。通过模拟舰船任务流程、装备可靠性结构、故障及维修保障资源等要素的关联关系,实现了多要素、模块化、可灵活配置、易于使用的舰船任务可靠度仿真系统,能计算出多样化任务条件下的任务可靠度、保障资源配置数量等指标,可为舰船使用阶段的随舰保障资源优化配置以及研制阶段的舰船装备保障性设计等工作提供技术支撑。
一种基于流场物理信息的CFD网格密度优化方法
刘江, 曾志勇
计算机科学. 2023, 50 (11A): 230200019-8.  doi:10.11896/jsjkx.230200019
摘要 ( 217 )   PDF(2964KB) ( 206 )   
参考文献 | 相关文章 | 多维度评价
CFD计算网格的生成及优化技术是计算流体力学数值计算的关键技术之一,很大程度上决定了数值计算的最终精度及计算效率。CFD模拟实际工程问题所采用的网格规模可达千万级别,在给定的计算时间内获得更高的数值计算精度,是当前CFD急需发展的关键技术。已有研究表明,不同类型的流场误差产生的主要区域与其特征物理量的梯度正相关。有鉴于此,提出了一种基于流场物理信息的网格密度优化方法,使用该方法以及OpenFOAM与cfMesh工具对不可压缩流体案例、燃烧流案例和多相流案例分别进行数值计算。实验结果表明,对于具有不同特征的案例,基于所提方法优化的网格均能够在计算时长差别不大的情况下,比较明显地提升计算精度。
DSMC/PIC耦合模拟的大规模高效混合并行计算研究
汪青松, 邱昊中, 林拥真, 杨富翔, 李洁, 王正华, 徐传福
计算机科学. 2023, 50 (11A): 230300146-9.  doi:10.11896/jsjkx.230300146
摘要 ( 227 )   PDF(4209KB) ( 336 )   
参考文献 | 相关文章 | 多维度评价
DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负载均衡研究。首先设计了基于嵌套双重非结构网格的MPI并行算法,实现了集中式和分布式两种并行通信策略,支持粒子在任意并行进程间的动态迁移。然后提出了加权负载性能模型,设计了动态负载均衡算法及高效网格重映射机制,大幅提升了耦合模拟并行效率,进一步设计了MPI+OpenMP混合并行算法,有效降低了纯MPI并行计算中动态负载均衡的网格重剖分和通信开销。在北京北龙超级云HPC系统上,针对10亿粒子规模脉冲真空弧等离子体羽流开展了数千处理器核心DSMC/PIC耦合并行模拟,验证了并行算法和动态负载均衡的效果。
面向边缘计算的轻量级网络硬件加速设计
余运俊, 张鹏飞, 龚汉城, 陈敏
计算机科学. 2023, 50 (11A): 220800045-7.  doi:10.11896/jsjkx.220800045
摘要 ( 277 )   PDF(2885KB) ( 309 )   
参考文献 | 相关文章 | 多维度评价
随着边缘设备数据的增多和神经网络的不断落地应用,边缘计算为以云计算为核心的大数据技术分担了压力。现场可编程门阵列(FPGA)因灵活的体系结构和低功耗,在边缘计算以及构建神经网络加速器中显示出优异的特性。但是,传统的基于传统卷积算法的 FPGA 解决方案往往受到片上计算单元数量的限制。使用 Zynq 作为硬件加速平台,对参数进行定点量化,利用数组分区提高流水线运行速度。采用 Winograd 快速卷积算法对传统的卷积进行改进,将卷积运算中的乘法运算转换为加法运算,降低了模型的计算复杂度,极大提高了所设计的加速器的计算性能。实验表明,XC7Z035工作在150MHz时钟下获得了 43.5GOP/s 的性能,能效是 Xeon(R) Silver 4214R 的 129倍,是双核 ARM 的 159 倍。所提方案在资源和功耗受限的情况下可以提供较高的性能,适用于网络边缘端对轻量级神经网络的落地应用。
基于FT-M7002的复数域行向量矩阵乘法移植与优化
莫尚丰, 周振芬, 胡勇华, 徐敏敏, 毛春献, 袁钰迪
计算机科学. 2023, 50 (11A): 220900277-6.  doi:10.11896/jsjkx.220900277
摘要 ( 251 )   PDF(3016KB) ( 238 )   
参考文献 | 相关文章 | 多维度评价
FT-M7002是我国自主研发的高性能DSP,具有强大的向量处理能力。为有效地发挥它的性能优势,亟待优化移植面向FT-M7002的高效VSIP函数库。复数域行向量矩阵乘法是VSIP库中频繁使用的算法,在数字通信、图像处理等应用领域中大量使用。文中在FT-M7002 DSP上研究优化复数域行向量矩阵乘法算法,通过改变计算矩阵列向量为计算矩阵行向量、向量化、循环展开和软件流水等手段提升算法性能。测试结果表明:优化后的向量C算法相比VSIP库函数获得了6.2~20.6的加速比,汇编优化算法相比向量C算法获得了3.4~14.3的加速比,加速效果明显。
异地高速互联环境下的海气耦合模式应用
韩琦琦, 刘鑫
计算机科学. 2023, 50 (11A): 221000136-5.  doi:10.11896/jsjkx.221000136
摘要 ( 294 )   PDF(3023KB) ( 218 )   
参考文献 | 相关文章 | 多维度评价
随着超级计算机的发展,大规模数值计算、大数据分析对算力基础设施的能力和数量的要求日益增长,受成本与功耗等因素的制约,单个超算中心不能无限制扩大规模,异地超算互联互通为解决这个问题提供了一种新的思路。文中基于济南至青岛10 Gbps DWDM光纤网络,搭建了济青跨地域500 km高速互联的计算集群,实现了两地计算资源的统一调度,利用海气耦合模式COAWST中的海洋分量模式ROMS和大气分量模式WRF进行了多组同地和异地不同资源规模和配置的对比实验。实验结果表明,耦合模式在异地高速互联环境下协同计算是可行的,WRF模式和ROMS模式在济南同地和济青异地运行同一算例的模拟结果相同,WRF模式在济南集群运行、ROMS模式在青岛集群运行时,运行时间比二者都在济南集群运行时增加5%,单分量模式拆分在济南集群和青岛集群协同计算时通信耗时较长,异地高速互联环境更适合有分量模块的耦合模式。
信息安全
旁路攻击与故障攻击的关联性研究综述
吴童, 周大伟, 欧庆于, 褚潍禹
计算机科学. 2023, 50 (11A): 220700223-7.  doi:10.11896/jsjkx.220700223
摘要 ( 108 )   PDF(1731KB) ( 251 )   
参考文献 | 相关文章 | 多维度评价
旁路攻击与故障攻击是当前应用较广泛的攻击方式。文中分析比对了其泄漏模型,并从算法层面和物理层面阐述了二者本质上的一致性。最后,从如何构建统一的物理泄漏函数模型,提出统一的物理安全测评标准,设计通用防御策略等角度分析了当前研究热点,这对从二者的关联性角度出发继续做好深入研究具有重要意义。
自动化红队测试中强化学习策略的实现与验证
陈宇飞, 李赛飞, 张丽杰, 赵越
计算机科学. 2023, 50 (11A): 230200162-6.  doi:10.11896/jsjkx.230200162
摘要 ( 121 )   PDF(2399KB) ( 247 )   
参考文献 | 相关文章 | 多维度评价
红队测试是一种通过模拟真实黑客攻击行为来对网络系统进行安全测评的方法。然而,目前人工测试存在成本较高与适应性较差的问题。红队测试智能化与自动化是当前研究的热点问题,旨在降低红队测试的成本,提高网络安全测评的测试性能与测试效率。自动化攻击策略是自动化红队测试的核心,其作用是替代安全专家进行攻击技术的决策。文中将红队攻击技术映射到强化学习,从而将红队测试过程建模为马尔可夫决策模型,通过有限状态机模型实现了固定策略与强化学习策略;在真实网络环境中对不同的强化学习策略进行训练和测试,验证了强化学习策略的收敛性和可行性。实验结果表明,基于SARSA(λ)算法的强化学习策略优于其他强化学习策略,收敛速度最快;3种强化学习策略均能在测试实验中稳定完成测试目标,且性能远优于固定策略。
基于替代模型的批量零阶梯度符号算法
李炎达, 范纯龙, 滕一平, 于铠博
计算机科学. 2023, 50 (11A): 230100036-6.  doi:10.11896/jsjkx.230100036
摘要 ( 221 )   PDF(2690KB) ( 211 )   
参考文献 | 相关文章 | 多维度评价
在面向神经网络的对抗攻击领域中,针对黑盒模型进行的通用攻击,如何生成导致多数样本输出错误的通用扰动是亟待解决的问题。然而,现有黑盒通用扰动生成算法的攻击效果不佳,且生成的扰动易被肉眼察觉。针对该问题,以典型卷积神经网络为研究对象,提出基于替代模型的批量零阶梯度符号算法。该算法通过对替代模型集合进行白盒攻击来初始化通用扰动,并在黑盒条件下查询目标模型,实现对通用扰动的稳定高效更新。在CIFAR-10和SVHN两个数据集上的实验结果表明,与基线算法对比,该算法攻击能力显著提升,其生成通用扰动的性能提高了近3倍。
基于I-SM4和SM2的混合加密算法
孙敏, 陕童, 续森炜
计算机科学. 2023, 50 (11A): 221100116-4.  doi:10.11896/jsjkx.221100116
摘要 ( 114 )   PDF(2191KB) ( 245 )   
参考文献 | 相关文章 | 多维度评价
近年来,数据泄露事件频发,信息安全问题日益突出。由于单一的加密算法无法满足信息在传输过程中的安全需求,因此一般采用混合加密算法进行数据加密。现有的混合加密算法主要基于国外设计的加密算法,不符合网络空间安全自主可控的要求。针对这一问题,结合改进的SM4算法(I-SM4)与SM2算法,设计了一种新的混合加密算法。该算法改进了SM4加密算法的密钥扩展部分,采用线性同余序列代替原有的密钥扩展方式对轮密钥进行扩展,降低了轮密钥之间的相关性,提高了密钥的安全性。此外,采用将I-SM4与SM2相结合的方法,一方面可以加强对I-SM4密钥的管理,提高安全性;另一方面可以缩短单独使用SM2加密算法所需的时间。通过实验与分析证明,文中提出的混合加密算法能够有效提高网络传输过程中信息的保密性、完整性和不可否认性。
基于综合赋权的网络安全等级灰色评价方法
秦富童, 袁学军, 周超, 樊永文
计算机科学. 2023, 50 (11A): 230300144-6.  doi:10.11896/jsjkx.230300144
摘要 ( 358 )   PDF(1773KB) ( 199 )   
参考文献 | 相关文章 | 多维度评价
网络安全等级评价是信息系统等级保护的关键,进行网络安全等级评价需要依据网络安全等级保护的国家标准或行业标准建立指标体系,并设置指标权重,选择合适的模型进行综合评判。基于层次分析法和粗糙集理论对指标进行综合赋权,消除了指标权重设置的主观性和样本数据的突发性。以灰色关联度为测度去评价指标数列与目标数列的关联程度,更能体现信息系统实际网络安全水平与评价标准之间的符合度。实例分析表明,该方法能够有效地对网络安全等级进行综合评价。
抵御背景信息推理攻击的假位置生成算法
张学军, 杨依行, 李佳乐, 田丰, 黄海燕, 黄山
计算机科学. 2023, 50 (11A): 221000036-9.  doi:10.11896/jsjkx.221000036
摘要 ( 329 )   PDF(3622KB) ( 233 )   
参考文献 | 相关文章 | 多维度评价
针对已有的假位置生成算法,设计了一种多次查询请求攻击算法(Multiple Query Request Attack algorithm,MQRA)来测试其安全性。为有效保护用户的位置隐私,提出了一种抵御背景信息推理攻击的假位置生成算法(Dummy Location Ge-neration Algorithm against Side Information Inference Attack,DLG_SIA),该算法综合考虑了查询概率、时间分布、位置语义和物理分散度等背景信息来生成有效的假位置集以抵御概率分布攻击、位置语义攻击和位置同质攻击,避免攻击者结合背景信息过滤掉假位置。用户首次请求时,DLG_SIA算法先利用位置熵和时间熵选取当前请求时间下查询概率相似的位置点来生成假位置集,并通过调整的余弦相似度生成满足语义差异性的位置点;然后通过距离熵保证选取的位置点间具有更大的匿名范围,并将当前请求位置的最佳假位置集进行缓存。安全性分析和仿真实验结果表明:MQRA算法能以很高的概率识别出假位置集中用户的真实位置;与已有的假位置生成算法相比,DLG_SIA算法能有效抵御背景信息推理攻击,保护用户的位置隐私。
面向工业物联网的轻量级群组密钥协商方案
王子宸, 袁程胜, 王一力, 郭萍, 付章杰
计算机科学. 2023, 50 (11A): 230700075-10.  doi:10.11896/jsjkx.230700075
摘要 ( 232 )   PDF(2852KB) ( 311 )   
参考文献 | 相关文章 | 多维度评价
近年来,基于群组信息共享的工业物联网技术因具有实时、安全和信息互通等特性,被广泛应用于工业制造和金融贸易等领域。但是,该技术大多基于群组密钥协商协议,存在开销大、安全性弱、可拓展性低等缺陷。因此,如何设计安全高效的群组密钥协商协议成为当前亟需解决的科学难题,为此文中利用平衡不完全区组设计的数学结构和椭圆曲线Qu Vanstone认证协议,提出了一种全新的基于结构化的群组密钥协商协议。首先,为了降低协议的计算开销,使用ECQV认证协议,避免执行配对运算。然后,为了证明协议的安全性,借助ECDDH假设,对所提协议进行了安全性证明。最后,为了降低协议的通信开销,提高协议的可拓展性,利用非对称平衡不完全区组设计,对现有的群组密钥协商协议进行了拓展,将所支持的成员数从p2拓展为p2p2+p+1。实验结果表明,所提协议能够将计算开销降低至O(nnm),将通信开销降低至O(nn)。该协议在保证抵抗选择明文攻击时安全性的同时,还能使参与群组密钥协商的人数灵活地自适应扩展,进一步提升了群组密钥协商协议的安全性和执行效率。
基于MILP的GIFT积分区分器搜索及优化
祖锦源, 刘杰, 石一鹏, 张涛, 张国群
计算机科学. 2023, 50 (11A): 220900231-8.  doi:10.11896/jsjkx.220900231
摘要 ( 278 )   PDF(1758KB) ( 269 )   
参考文献 | 相关文章 | 多维度评价
Banik等提出的轻量级分组密码GIFT算法已经入选了NIST针对国际轻量级密码算法开展的标准化竞赛的最终轮。目前已有针对其的线性分析、差分分析等的相关研究,但针对GIFT的积分分析仍待进一步研究。针对GIFT在积分密码分析过程中可分路径表达冗余的问题,提出了基于混合整数线性规划模型的积分区分器搜索求解和优化算法。 首先对GIFT算法创建MILP积分分析模型,利用可分性质分别对GIFT算法的线性层和非线性层进行刻画。 对线性层利用传播规则进行表达;对非线性S盒在传播规则的基础上使用贪心算法对表达式进行精简优化,得到了15个不等式作为约束条件。 经过MILP求解后,得到64个9轮积分区分器。 在此基础上,针对基于贪心算法的MILP求解模型精确度不足问题,引入MILP模型对S盒的可分性质进行重新表达,设计基于MILP的约简算法对GIFT积分区分器搜索进行优化,并重新求解MILP模型,最高得到了3个13轮的积分区分器。因此,基于MILP的S盒新约简算法可以优化S盒可分性质的表达,有效增加对GIFT算法的积分区分器攻击轮数,提高积分攻击效果。
一种安全高效的去中心化移动群智感知激励模型
周玉莹, 马苗, 申琪琪, 任杰, 张明瑞, 杨波
计算机科学. 2023, 50 (11A): 221000184-10.  doi:10.11896/jsjkx.221000184
摘要 ( 323 )   PDF(3998KB) ( 216 )   
参考文献 | 相关文章 | 多维度评价
针对现有群智感知激励模型因依赖中央机构而存在的信任安全隐患问题和如何高效地完成感知任务问题,提出一种安全高效的去中心化群智感知激励模型。该模型利用区块链技术实现去中心化的用户管理,通过参与者控制智能合约PCSC和任务控制智能合约TCSC,完成任务发布者、参与者和矿工之间的交互和链上交易,实现任务发布、参与者优选和数据质量评估及报酬支付。在参与者优选环节,提出基于BP神经网络的“任务-参与者集合”匹配策略,即分别利用历史数据中参与者的时间和位置属性,找出最适合当前任务的参与者集合,并采用“对胜出者给予报酬、信誉双激励,对愿意参加的非胜出者给予信誉补偿,对适合当前任务而连续不参与者给予信誉惩罚”的自适应信誉更新机制。安全性分析和在国际公开基准数据集Brightkite上对所提模型在任务完成率、感知数据质量、参与者收益及用户参与度方面的高效性测试结果以及在区块链上用Solidity语言对PCSC和TCSC合约的有效性测试结果,均表明所提模型是一种安全高效的去中心化群智感知激励模型。
基于量化数据特征统计的深伪图像检测研究
谢菲, 高树辉
计算机科学. 2023, 50 (11A): 230300013-9.  doi:10.11896/jsjkx.230300013
摘要 ( 92 )   PDF(5232KB) ( 234 )   
参考文献 | 相关文章 | 多维度评价
深度伪造技术因“低门槛、高效率、高仿真”等特性而被滥用于伪造身份,引发的个人信息安全问题给公共安全治理带来了严峻挑战。目前深度伪造图像主流检测以卷积特征为主,量化特征应用较少,基于量化特征占用空间小,运行成本低等优点,探究图像各颜色分量上的纹理、颜色特征与图像真伪的关联程度,筛选有效特征进行深伪图像自动检测,研究量化特征在深伪图像鉴定方面的应用价值。对深度伪造人脸数据集ForgeryNet中的40 000幅实验样本图像进行分组实验,提取各组图像在Gray,YCrCb,Lab,HSV和RGB颜色空间上的纹理特征和颜色特征,利用多元统计法筛选既具有显著差异又具有相关性的特征,然后用XGBoost、逻辑回归分类器、线性SVM、多层感知机和TabNet进行算法验证,并与主流卷积神经网络进行对比分析。在5类算法中,XGBoost和LSVM分类效果较好;MLP和LP效果较差;TabNet效果不稳定,受分类类型影响较大,检测精度在52%~89%之间。数理统计筛选所得特征下的深伪图像检测精度显著提高,在真伪图像组,在真伪图像组,XGBoost算法在筛选特征和纹理特征时的检测精度比所有特征时分别提高1.10%和1.43%,LSVM和MLP两种算法在纹理特征时的检测精度比在所有特征时分别提高了0.12%和0.10%。利用颜色空间下筛选的量化特征,其检测精度均高于主流卷积神经网络的检测精度,且纹理特征的检测结果优于颜色特征,对身份替换深伪图像更易识别。相比图像卷积特征,量化特征具有较强的解释性,在鉴定领域具有较高的利用价值。
一种基于CutMix的增强联邦学习框架
王春东, 杜英琦, 莫秀良, 付浩然
计算机科学. 2023, 50 (11A): 220800021-8.  doi:10.11896/jsjkx.220800021
摘要 ( 139 )   PDF(3430KB) ( 251 )   
参考文献 | 相关文章 | 多维度评价
联邦学习(Federated Learning)的出现解决了传统机器学习中存在的“数据孤岛”问题,能够在保护客户端本地数据隐私的前提下进行集体模型的训练。当客户端数据为独立同分布(Independently Identically Distribution,IID)数据时,联邦学习能够达到近似于集中式机器学习的精确度。然而在现实场景下,由于客户端设备、地理位置等差异,往往存在客户端数据含有噪声数据以及非独立同分布(Non-IID)的情况。因此,提出了一种基于CutMix的联邦学习框架,即剪切增强联邦学习(CutMix Enhanced Federated Learning,CEFL)。首先通过数据清洗算法过滤掉噪声数据,再通过基于CutMix的数据增强方式进行训练,可以有效提高联邦学习模型在真实场景下的学习精度。在 MNIST和 CIFAR-10标准数据集上进行了实验,相比传统的联邦学习算法,剪切增强联邦学习在Non-IID数据下对模型的准确率分别提升了23%和19%。
一种面向多模态医疗数据的联邦学习隐私保护方法
张连福, 谭作文
计算机科学. 2023, 50 (11A): 230800021-8.  doi:10.11896/jsjkx.230800021
摘要 ( 184 )   PDF(2965KB) ( 443 )   
参考文献 | 相关文章 | 多维度评价
电子健康记录(Electronic Health Records,EHRs)数据已成为生物医学研究的宝贵资源。通过学习隐藏在EHRs数据中的人类难以区分的多维特征,机器学习方法可以获得更好的结果。然而,现有的一些研究只考虑了模型训练过程中或模型训练后可能面临的一些隐私泄露,导致隐私防护措施单一,无法实现覆盖机器学习全生命周期。此外,现有的方案大多是针对单模态数据的联邦学习隐私保护方法的研究。因此,提出了一种面向多模态数据的联邦学习隐私保护方法。为防止敌手通过反向攻击窃取原始数据信息,对每个参与者上传的模型参数进行差分隐私扰动。为防止在模型训练过程中各参与方的局部模型信息泄露,利用Paillier密码系统对局部模型参数进行同态加密。从理论的角度对该方法进行了安全性分析,给出了安全模型定义,并证明了子协议的安全性。实验结果表明,该方法在几乎不损失性能的情况下,保护了训练数据和模型的隐私。
基于TCN-BiLSTM的入侵检测算法研究
白万荣, 魏峰, 郑广远, 王宝会
计算机科学. 2023, 50 (11A): 230300142-8.  doi:10.11896/jsjkx.230300142
摘要 ( 156 )   PDF(2547KB) ( 287 )   
参考文献 | 相关文章 | 多维度评价
网络安全直接关系到国家安全,如何准确高效地检测到电网中的网络威胁至关重要。针对传统CNN感受野较小以及未考虑数据时序特征的问题,结合网络流量数据的空间特征和时间特征,提出了一种基于时间卷积网络(TCN)和双向长短期记忆网络(BiLSTM)的注意力入侵检测算法。首先将网络流量特征进行特征编码,再使用森林优化特征筛选算法,减少数据的冗余性;然后进行重采样,解决数据不平衡问题;最后将数据输入到深度神经网络中,处理后的数据经过TCN和BiLSTM网络进行特征学习,通过自注意力机制进行权重分配,最终进行分类,实现入侵检测。在NSL-KDD数据集上进行对比实验,相比CNN-BiLSTM注意力模型,所提方法的准确率提升4.3%,F1值提升1.8%,实验结果表明,该算法能有效地对网络入侵检测进行识别。
交叉&应用
接诉即办智能派单业务调度算法研究
贾经冬, 张敏南, 赵祥, 黄坚
计算机科学. 2023, 50 (11A): 230300029-7.  doi:10.11896/jsjkx.230300029
摘要 ( 272 )   PDF(2113KB) ( 277 )   
参考文献 | 相关文章 | 多维度评价
随着国家数字化建设的发展,社会治理的智能化、专业化也成为城市科技进步的基本要求,各政府系统须要对人民的诉求做到高效精确的处理。而从当前的各大政府门户网站的诉求通道收集的民众诉求信息,均是通过人工方式判断责任部门,然后将其手动分配给相关部门进行后续问题的核实和处理,大大限制了诉求处理的效率和准确性。而接诉即办智能派单算法利用人工智能和深度学习方法,基于真实的民众诉求信息数据进行训练,自动精准而高效地将诉求分派到相关部门进行后续审查处理,加快了政务处理流程的速度并大大降低了不必要的人力成本,因此该智能调度算法的研究有着重要意义。首先,通过数据去噪和脱敏,将数据进行层级拼接,构建数据标签和标准流程库以进行标签对齐。然后,基于公开数据集训练地址识别基线模型,在工单分类中提出基于类别比例采样的标签融合方法解决数据类不平衡问题,实验结果显示在基线模型的基础上提高了数十个百分点。最后,结合分类模型和地址识别模型,构建智能回复模板,完成接诉即办智能派单的全流程。
一种基于因果推理的垃圾分类方法
袁振, 刘进锋
计算机科学. 2023, 50 (11A): 220800218-6.  doi:10.11896/jsjkx.220800218
摘要 ( 317 )   PDF(2700KB) ( 225 )   
参考文献 | 相关文章 | 多维度评价
垃圾分类是保护环境,提高资源利用率的有效措施。近年来,深度学习以其引入强大的建模能力在各个领域都有成功的表现,利用深度学习进行垃圾分类也成为一个新兴方向。垃圾分类数据集大多存在类别图片数量不均衡(长尾分布)的问题。针对垃圾分类中的长尾数据集TrashNet,提出了一种基于因果推理分类方法。该方法通过引入因果推理找出由输入样本引起的直接因果效应,缓解了TrashNet数据集的长尾问题。在训练中采用了迁移学习的方法,减少了训练参数量,并在其中使用了因果干预与反事实推理,进行了去混淆训练。对所提出的方法进行了类激活图(Class Activation Map)验证,实验结果表明,所提出的模型有较好的特征提取能力。模型对TrashNet数据集中的尾部类有较优的识别效果,并在其上取得了94.23%的最好精度。
二维多边形物体剖分研究
金建国
计算机科学. 2023, 50 (11A): 230300237-5.  doi:10.11896/jsjkx.230300237
摘要 ( 114 )   PDF(2376KB) ( 188 )   
参考文献 | 相关文章 | 多维度评价
文中对二维多边形物体有意义剖分进行了研究。心理学家通过研究后发现对物体进行有意义的剖分是人类识别物体的一个重要过程。研究对二维多边形物体的剖分,对于图像识别具有重要意义。在进行图像识别时可首先提取图像中物体的边缘,并用封闭多边形表示。研究如何对该多边形进行有意义的剖分,是正确识别该图像中的物体很关键的一步。文中首先用谱分析结合K-均值的方法,对要剖分的多边形的顶点进行聚类,然后用计算多边形剖分线段适合度的方法,递归地在顶点类内部和顶点类之间选择最佳剖分线段,实验结果表明了该方法的有效性。该算法剖分结果和知名的人工剖分结果的定量分析比较表明,算法剖分结果符合人类思维,取得了较好的剖分结果。
离散事件系统弱可预测性的验证算法
曹卫华, 刘富春
计算机科学. 2023, 50 (11A): 220800224-6.  doi:10.11896/jsjkx.220800224
摘要 ( 291 )   PDF(2040KB) ( 203 )   
参考文献 | 相关文章 | 多维度评价
对故障检测来说,预测比诊断更能降低故障对系统造成的损失,但即使大多数的故障事件串是可预测的,只要有一个故障事件串是不可预测只能诊断的,整个系统就是不可预测的,只能用诊断的方法处理,这对大多数的故障事件串是不利的。为此,提出了弱可预测性的概念。弱可预测性是对系统未来是否一定会处于故障状态这一情况的预测。相比可预测性,弱可预测性不要求所有故障事件串都是可预测的。对可预测的故障事件串,弱可预测性能够在故障发生之前发出警报,而对不可预测只能诊断的故障事件串,其也能在故障发生之后发出警报。文中构造了证明器来测试系统的弱可预测性,并基于这个证明器给出了测试系统弱可预测性的多项式复杂度的算法,给出了弱可预测性的充分必要条件。
基于模型融合思想的程序化交易投资者识别研究
袁钰坤, 徐刚, 吴畏, 徐力
计算机科学. 2023, 50 (11A): 230300131-6.  doi:10.11896/jsjkx.230300131
摘要 ( 400 )   PDF(1980KB) ( 312 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着信息化、电子化技术在金融市场中快速发展,程序化交易成为了越来越多金融机构选择的交易方式,对证券期货市场的影响力也逐渐增强,已受到监管层及广大投资者的关注。文中基于模型融合的思想,构建了程序化交易投资者的识别模型,将专家规则与机器学习算法进行叠加融合,并在中国A股市场投资者交易数据上验证了模型的有效性。研究表明,模型能以超过90%的准确率和召回率识别出程序化交易投资者账户,超过了当下的前沿效果,相关研究成果可以为证券期货行业程序化交易识别相关的科技监管工作提供支持。
基于动态演化博弈的装备采购模型仿真研究
李蕴哲, 董鹏, 叶卫民, 文昊林
计算机科学. 2023, 50 (11A): 220900051-10.  doi:10.11896/jsjkx.220900051
摘要 ( 116 )   PDF(4156KB) ( 299 )   
参考文献 | 相关文章 | 多维度评价
针对装备采购,建立了以采购方、承包商为主体的双方采购模型和以采购方、主承包商、分承包商为主体的三方采购模型。基于动态演化博弈理论,分析了两种采购模型下各主体的策略选择及博弈均衡,运用AnyLogic动态模拟博弈演化过程并进行数值仿真分析。双方博弈模型中,承包商的演化均衡策略为不积极履行合同;而三方博弈模型可通过适当设计,使得主承包商积极履行合同,从而更好地保证质量。故采购方在进行采购模式选择时,选择采购方、主承包和分承包商的模式更有利,并且需要合理设置监管正确率、合同罚金、抽查率等条款。
供需双方均受资金约束的低碳供应链决策研究
汪敏, 李莉英, 周俊
计算机科学. 2023, 50 (11A): 221200130-9.  doi:10.11896/jsjkx.221200130
摘要 ( 150 )   PDF(1853KB) ( 235 )   
参考文献 | 相关文章 | 多维度评价
为了解决低碳环境下受资金约束的供需双方融资难的问题,在“碳限额与交易机制”下,构建了以银行为主领导者、供应商为次领导者和碳排放依赖型制造商为跟随者的双层Stackelberg博弈模型。在随机需求情形下,研究了供应商的最优批发价格决策、制造商的最优订购决策和减排决策,以及银行的最优利率决策。通过理论和算例分析表明:当政府分配的排放上限较低时,会增加制造商的破产风险,具有有限责任能力的制造商会采取更加冒进的订购策略;为减少借款方的破产风险带来的损失,银行会加强对整个供应链运作的监管;供应商的自由资金越多,对制造商和整体供应链的绩效越有利。
基于GRU与自注意力网络的声源到达方向估计
何儒汉, 陈一帆, 余永升, 姜艾森
计算机科学. 2023, 50 (11A): 220900135-7.  doi:10.11896/jsjkx.220900135
摘要 ( 250 )   PDF(2103KB) ( 250 )   
参考文献 | 相关文章 | 多维度评价
基于神经网络的声源定位近年来受到广泛的关注,但如何缓解隐含DOA位置信息丢失、小样本数据等问题仍然是目前面临的挑战,因此提出了一种基于GRU和自注意力网络的声源到达方向估计方法。该方法采用对小型数据集效果较好的GRU作为骨干网络,弥补了纯净的声音数据采集困难的问题;同时,该方法使用多声道录音的声源形成训练集,经过短时傅里叶变换特征提取得到梅尔频谱图和声学强度矢量,进而形成由多通道语谱图以及归一化的主特征向量叠加的输入特征,避免了对语谱图与GCC-PHAT特征结合的隐式DOA信息的破坏,有效缓解了隐含DOA位置信息丢失问题;将其作为输入进入卷积循环神经网络模型进行监督学习获得模型参数。模型输出使用三维笛卡尔积坐标回归获得DOA位置估计,并增加自注意力网络在模型训练时进行参数回传,使得网络在训练的同时计算损失并预测关联矩阵,以解决预测定位和参考定位之间的最优分配。实验结果表明,该网络在不同混响条件和信噪比的环境下,均具有较高的定位准确率和鲁棒性。
基于统一注意力融合网络的耕地变化检测
李滔, 王海瑞, 朱贵富
计算机科学. 2023, 50 (11A): 221100060-6.  doi:10.11896/jsjkx.221100060
摘要 ( 110 )   PDF(2764KB) ( 236 )   
参考文献 | 相关文章 | 多维度评价
为了快速摸清农村乱占耕地建房底数,实现对侵占耕地房屋的检测,提出了一种统一注意力融合网络(Unified Attention Fusion Network)用于农村占用耕地建房识别。为了解决不同时相遥感影像特征相互影响的问题,首先使用孪生网络代替VGG16网络进行特征提取。其次,为了在增大网络感受野并获取更多多尺度信息的前提下减小网络模型大小,在编码阶段最底层使用了简易金字塔池化(Simple Pyramid Pooling Module,SPPM);在解码阶段,为了提高分割精度,突出有用特征,提高边缘分割精度,使用统一注意力融合模块(Unified Attention Fusion Module,UAFM)替换原始的上采样部分进行解码,获取变化检测结果。网络在占用耕地建房数据集上进行了训练和测试。实验结果表明,统一注意力融合网络在测试集上准确率(Accuracy)达到98.82%、精确率(Precision)达到89.69%、召回率(Recall)达到82.14%、F1分数(F1 Score)达到85.74%,能够快速识别不同尺度的疑似占用耕地的违建房屋,为农村乱占耕地建房整治工作提供一种技术检测方法。
一种基于EEG信号的抑郁症早期筛查方法
任书瑶, 宋江玲, 张瑞
计算机科学. 2023, 50 (11A): 221100139-6.  doi:10.11896/jsjkx.221100139
摘要 ( 345 )   PDF(3890KB) ( 436 )   
参考文献 | 相关文章 | 多维度评价
抑郁症作为一类常见的、可治愈型的精神类疾病,若能在早期阶段对其进行有效筛查(即早期筛查)并及时采取相应的治疗手段,则可有效控制病情的进一步加重,甚至彻底治愈。传统的抑郁症诊断方法主要是医生通过患者的临床表现及临床检查(主要为诊断量表)进行综合判断,但诊断结果的准确与否严重依赖于医生的临床经验以及患者的高度配合。同时,由于抑郁症早期患者往往缺乏明显的病症表征,也极大增加了漏诊误诊的可能性。相关研究表明,脑电图(Electroencephalogram,EEG)能够反应受试者的精神状态,这为抑郁症的早期筛查提供了一种有效途径。基于此,以EEG信号为数据源,提出了一种基于EEG信号与深度学习的抑郁症早期筛查方法。首先,结合分段处理、频域转化等方法,对EEG信号进行时-频-空特征序列的提取;其次,基于所提特征序列与深度学习,构建了一种深度混合模型,通过训练模型完成正常人与轻度抑郁症患者的有效识别;最后,在公开数据集MODMA上验证所提方法的可行性与有效性。实验结果显示,早期筛查准确率为82.64%,召回率为78.42%,灵敏度为75.37%。
基于语义注意力的医学图像超分辨率方法
林毅, 周芃, 陈彦明
计算机科学. 2023, 50 (11A): 221200107-6.  doi:10.11896/jsjkx.221200107
摘要 ( 310 )   PDF(3326KB) ( 214 )   
参考文献 | 相关文章 | 多维度评价
在医学图像领域,清晰的医学图像能够帮助医生更好地诊断疾病。然而,由于受到成像设备的限制,生成的医学图像往往分辨率较低并可能影响后期诊断。因此,使用超分辨率方法提高图像的分辨率显得尤为重要。近些年来,随着深度学习的发展,基于深度学习的自然图像超分辨率方法被广泛研究,并取得了一定效果。然而,不同于自然图像超分辨率,医学图像超分辨率往往是为下游医学任务服务。许多下游医学任务,例如疾病诊断、语义分割等等,往往会对某些区域感兴趣。但是传统图像超分辨率方法往往平等地对待图像中所有区域,没有考虑到感兴趣区域对于下游医学任务的重要性。针对此问题,提出了一种基于语义注意力的医学图像超分辨率方法。该注意力机制通过加权方式对图像中感兴趣区域进行额外关注,从而使得超分辨率图像更有助于下游医学任务。该方法在新冠肺炎数据集COVID_19和胃肠息肉数据集Kvasir-SEG上都取得了领先于其他主流超分辨率方法的效果。
一种融合CNN和Swin Transformer的医学显微图像分割模型
孙开鑫, 刘斌, 苏曙光
计算机科学. 2023, 50 (11A): 230200119-8.  doi:10.11896/jsjkx.230200119
摘要 ( 322 )   PDF(4868KB) ( 362 )   
参考文献 | 相关文章 | 多维度评价
医学显微图像分割在临床诊断和病理分析中具有重要应用价值。然而,由于显微图像具有形状、纹理、大小等复杂的视觉特征,因此要精确分割显微图像是一项困难的任务。文中提出了一种新的分割模型UMSTC,该模型基于U型结构,并通过将U-net模型和Swin Transformer模型进行融合来兼顾图像的细节特征和宏观特征,并保持建模完整性。具体来说,UMSTC模型的下采样部分采用Swin Transformer网络来优化其内含的注意力机制,以提取微观和宏观特征;上采样部分基于CNN网络反卷积操作,并通过残差机制接收和融合下采样阶段的特征图,以减小图像合成精度损失。实验结果表明,所提出的UMSTC分割模型比目前主流的医学图像语义分割模型具有更好的分割效果,其中mPA提高了约3%~5%,mIoU提高了约3%~8%,且分割结果具有更高的主观视觉质量和更少的噪点。因此,UMSTC模型在医学显微图像分割领域具有广泛的应用前景。
基于级联动态注意力U-Net的脑肿瘤分割方法
陈柏年, 韩雨童, 何涛, 刘斌, 张建新
计算机科学. 2023, 50 (11A): 221100180-7.  doi:10.11896/jsjkx.221100180
摘要 ( 139 )   PDF(3128KB) ( 300 )   
参考文献 | 相关文章 | 多维度评价
脑肿瘤是一种严重威胁人类健康的疾病,脑肿瘤精确分割在临床诊疗中非常重要。由于脑肿瘤形状大小各异、位置不固定和边界模糊等,实现高精度脑肿瘤自动分割仍是一项具有挑战性的任务。近年来,U-Net凭借其简洁的架构和优秀的性能成为解决医学图像分割任务的主流模型,但其也存在局部感受野有限、空间信息丢失和未充分利用上下文信息等问题。为此,提出一种基于动态卷积和非局部注意力机制的级联U-Net新模型(CDAU-Net)用于脑肿瘤分割任务。首先,将两阶段级联三维U-Net作为主体架构,来重建更精细的高分辨率脑肿瘤空间信息;进而,在级联网络横向连接上添加期望最大化注意力,通过提高网络捕获长距离依赖能力来更好利用肿瘤上下文信息;最后,在级联网络中将普通卷积替换为具有局部自适应能力的动态卷积,可进一步增强网络局部特征捕获能力。在公开的BraTS2019-2020数据集上进行了大量实验并与其他代表性方法进行对比,实验结果表明了所提方法在脑肿瘤分割任务上的有效性。其中,在BraTS2019/2020验证集上获得的全部肿瘤、肿瘤核心和增强肿瘤分割Dice值分别为0.897/0.903,0.826/0.828和0.781/0.786,表现出了良好的脑肿瘤分割性能。
基于边缘引导的多尺度医学影像分割方法
姜灏天, 王琦智, 黄扬林, 章雅琴, 胡凯
计算机科学. 2023, 50 (11A): 220900059-7.  doi:10.11896/jsjkx.220900059
摘要 ( 278 )   PDF(3460KB) ( 279 )   
参考文献 | 相关文章 | 多维度评价
医学影像的灰阶变化小,分割目标与背景不易区分,因此,进行影像分割是充满挑战性的问题。现有网络模型大多将高频的分割边缘与低频的主体部分统一学习,忽视了高频与低频信息的差异性和两者在图像中占比不同的差别。针对这一问题,提出了基于边缘引导的多尺度卷积神经网络Edge Guided V-Shape Network(EGV-Net),从低频分割主体和高频分割边缘两个特征角度进行针对性学习。其中,低频特征通过编码-解码方式进行特征传递,学习分割目标的主体部分;高频特征则通过边缘提取方法,首先将高频语义信息从分割图谱中提取出来,再将分割边缘过滤分离。高频边缘通过边缘引导模块指导模型对低频特征做出精准的分割,并恢复边缘细节精度。在肝脏影像与ISIC2016数据集上进行的实验结果表明,所提算法对整体分割的把控能力更强,在边缘细节处有更好的分割效果,优于其他模型。