1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2022年第11A期, 刊出日期:2022-11-16
  
目录
第49卷第11A期目录
计算机科学. 2022, 49 (11A): 0-0. 
摘要 ( 165 )   PDF(528KB) ( 267 )   
相关文章 | 多维度评价
人工智能
群体智能中的协作与对抗
朱迪迪, 吴超
计算机科学. 2022, 49 (11A): 210900249-7.  doi:10.11896/jsjkx.210900249
摘要 ( 681 )   PDF(2277KB) ( 562 )   
参考文献 | 相关文章 | 多维度评价
群体智能有着丰富的内涵和外延,其算法既包括早期基于生物群体特征规律的算法(粒子群优化和蚁群算法等),也包括后期基于网络互联的大规模群体算法(多智能体系统、群智感知和联邦学习等)。这些群体智能算法均蕴含着协作或对抗的核心思想。协作能够把个体的有限智慧耦合汇聚成群体的强大智能,但是协作本身具有一定的局限性,可能会导致个体间过分依赖和系统的不公平性等问题。对抗可以突破这种局限性,其基本思想是个体通过博弈等手段谋取自身最大利益。因此,协作和对抗缺一不可,以对抗促协作,协作中存对抗。通过聚焦群体智能算法的协作和对抗方法,对经典群体智能算法的思想进行阐述,并对新兴的群体智能算法的下一步发展方向进行展望,总结了构建协作与对抗并存的群体智能生态,是群体智能的必然发展趋势。
面向金融科技的深度学习技术综述
周帆, 陈晓蝶, 钟婷, 吴劲
计算机科学. 2022, 49 (11A): 210900016-17.  doi:10.11896/jsjkx.210900016
摘要 ( 663 )   PDF(2406KB) ( 695 )   
参考文献 | 相关文章 | 多维度评价
近年来,深度学习技术被广泛应用于金融领域,并受到了国内外学术界和商业界的广泛关注。研究人员利用深度学习技术对各种金融数据进行发掘和分析,取得了大量的研究成果。深度学习在多个金融关键应用上的表现超过了传统的统计机器学习模型,包括金融市场预测、交易策略改进和金融文本信息挖掘等。为了更全面地把握深度学习技术在金融领域中的研究和应用趋势,促进它们之间的深层次融合和发展,着重梳理了近年来深度学习技术在金融科技研究中的发展脉络及前沿动态,分析和总结了深度学习模型在金融领域的主要应用和最新算法。根据金融领域中的具体应用场景将现有的深度学习金融研究进行详细分类,分析并总结各个领域的最新研究,并展望了金融科技领域未来的研究热点、技术难点和发展趋势等。
基于深度学习与文本计量的技术趋势分析
韦入铭, 陈若愚, 李晗, 刘旭红
计算机科学. 2022, 49 (11A): 211100119-6.  doi:10.11896/jsjkx.211100119
摘要 ( 363 )   PDF(3429KB) ( 449 )   
参考文献 | 相关文章 | 多维度评价
传统的技术趋势分析工作需要由经验丰富的从业者完成,涉及到大量的文献调研和分析,工作耗时耗力。针对上述问题,提出一种基于深度学习与文本计量的技术趋势分析模型,设计基于BERT_BiLSTM_CRF模型的领域文献命名实体识别算法,优化BERT的掩码机制。以集成电路领域的新闻和论文为数据集,开展BiLSTM_CRF、BERT_BiGRU_CRF等模型以及文中所提BERT_BiLSTM_CRF*模型的对比研究,研究命名实体识别技术在集成电路等领域的数据识别效果。相比于其他算法,文章所提的领域文献命名实体识别算法在F1值上达到了88.6%,奠定了技术趋势分析的基础。基于知识图谱易表达关联关系的特点,创新性提出知识图谱与文本计量技术结合的方法,并从不同角度以可视化的形式展示技术趋势分析效果,最终辅助从业者开展技术趋势智能分析工作。
预训练语言模型的扩展模型研究综述
阿布都克力木·阿布力孜, 张雨宁, 阿力木江·亚森, 郭文强, 哈里旦木·阿布都克里木
计算机科学. 2022, 49 (11A): 210800125-12.  doi:10.11896/jsjkx.210800125
摘要 ( 454 )   PDF(2450KB) ( 538 )   
参考文献 | 相关文章 | 多维度评价
近些年,Transformer神经网络的提出,大大推动了预训练技术的发展。目前,基于深度学习的预训练模型已成为了自然语言处理领域的研究热点。自2018年底BERT在多个自然语言处理任务中达到了最优效果以来,一系列基于BERT改进的预训练模型相继被提出,也出现了针对各种场景而设计的预训练模型扩展模型。预训练模型从单语言扩展到跨语言、多模态、轻量化等任务,使得自然语言处理进入了一个全新的预训练时代。主要对轻量化预训练模型、融入知识的预训练模型、跨模态预训练语言模型、跨语言预训练语言模型的研究方法和研究结论进行梳理,并对预训练模型扩展模型面临的主要挑战进行总结,提出了4种扩展模型可能发展的研究趋势,为学习和理解预训练模型的初学者提供理论支持。
基于后状态强化学习的最优订单接受决策
钱静, 吴克宇, 陈超, 胡星辰
计算机科学. 2022, 49 (11A): 210800261-9.  doi:10.11896/jsjkx.210800261
摘要 ( 427 )   PDF(3720KB) ( 442 )   
参考文献 | 相关文章 | 多维度评价
随着客户多样化需求不断提升,根据客户对订单的不同需求来组织生产的订单生产型(Make-To-Order,MTO)模式在企业生产活动中越来越重要。根据企业有限的生产能力和订单状态来确定是否接受到达的订单,对企业提高利润至关重要。在传统的订单接受问题基础上,提出了更完备的MTO企业订单接受问题的模型:在延期交货成本、拒绝成本、生产成本传统模型要素的基础上,进一步考虑了订单的库存成本、多种顾客优先级因素,并将最优订单接受决策问题建模为马尔可夫决策过程(Markov Decision Process,MDP)。此外,由于经典的MDP求解方法依赖于对高维状态价值函数的求解和估计,其计算复杂性较高,为了降低复杂性,证明了经典的MDP问题中基于状态价值函数的最优策略可以等价地用基于后状态的价值函数进行定义和构造,将多维控制问题转化为一维控制问题。同时,为了解决连续状态空间问题,结合神经网络对后状态价值函数进行参数化标表征,解决了状态空间较大的问题。最后,通过仿真验证了所提出的订单接受策略模型和算法的适用性和优越性。
基于子网融合的贝叶斯网络结构学习算法
钟坤华, 陈芋文, 秦小林
计算机科学. 2022, 49 (11A): 210800172-7.  doi:10.11896/jsjkx.210800172
摘要 ( 335 )   PDF(2221KB) ( 511 )   
参考文献 | 相关文章 | 多维度评价
针对贝叶斯网络结构学习K2算法要求提供实际难以获得的准确先验节点顺序信息以及爬山算法对初始网络结构依赖性强且容易陷入局部最优的问题,提出了一种基于子网融合的贝叶斯网络结构学习算法Sub-BN-Merge。该算法首先为每个节点构造一个子网,并以Voting的方式融合生成每个节点的候选父节点集,然后基于评分函数在候选集中为每个节点搜索最优父节点集合,最后消除所得网络结构中的环路,并以此为初值进一步采用启发式搜发方法对其进行优化。在小型网络Asia、中型网络Alarm和大型网络Win95pts上进行了实验验证,同时分析了算法在数据存在缺失值情况下的性能。实验结果证明了算法的有效性,Sub-BN-Merge算法在结构汉明距和算法正确率方面优于对比算法。
基于transformer的门控双塔模型预测H1N1流感抗原性
李川, 李维华, 王迎晖, 陈伟, 文俊颖
计算机科学. 2022, 49 (11A): 211000209-6.  doi:10.11896/jsjkx.211000209
摘要 ( 448 )   PDF(2629KB) ( 395 )   
参考文献 | 相关文章 | 多维度评价
流感病毒血凝素蛋白的快速演变导致新的病毒株不断产生,新的病毒株可能引起季节性流感甚至全球流感大爆发。及时检测出抗原变异体对疫苗的筛选和设计至关重要。鲁棒的抗原性预测模型是应对疫苗挑战的有效方法。各种端到端的特征学习工具为蛋白组学提供了良好的特征表示方法,但是现有的甲型流感预测模型还不能有效地提取并利用血凝素蛋白氨基酸序列中的特征。基于transformer设计一个门控双塔模型,通过输入甲型流感病毒血凝素蛋白的氨基酸序列,利用两个并行的编码器分别从血凝素蛋白氨基酸序列的时间维和空间维上捕捉抗原特征,并学习特征与预测结果间的非线性关系。为了减少数据中的噪声,融合时间维与空间维上的特征时,通过门机制自适应地获取衡量它们相对重要性的权重进行选择性融合,最后使用融合特征预测H1N1流感抗原变异株。在H1N1数据集上的实验结果表明,该模型利用优秀的非线性特征学习能力提高了抗原变异的预测性能,同时具有良好的鲁棒性。
基于类间和类内密度的多视角距离度量学习
任双艳, 郭威, 范昌琪, 王喆, 吴松洋
计算机科学. 2022, 49 (11A): 211000131-6.  doi:10.11896/jsjkx.211000131
摘要 ( 353 )   PDF(2148KB) ( 487 )   
参考文献 | 相关文章 | 多维度评价
几何信息可以为分类方法提供先验知识和直观解释。从几何角度观察样本是一种新的样本学习方法,密度则是几何信息中非常直观的表现形式。提出了基于类间和类内密度的多视角距离度量学习方法来学习一个度量空间。在这个空间内,异类样本更加分散,同类样本更加紧密。首先,在大边际框架下引入类间密度,通过最小化类间密度来约束度量空间中的样本,从而实现类间分散,提高分类性能。其次,引入类内密度,通过最大化类内密度来达到同类样本互相靠近的效果,从而实现类内紧凑。最后,为了更好地挖掘多视角样本的互补信息,最大化度量空间中各视角之间的相关性,使各视角自适应地相互学习,探索视角之间的互补信息。在真实数据集上的大量实验结果证明了该方法的优越性。
基于行为树调度的多无人机未知室内空间探索方法
史殿习, 苏雅倩文, 李宁, 孙亦璇, 张拥军
计算机科学. 2022, 49 (11A): 210900083-11.  doi:10.11896/jsjkx.210900083
摘要 ( 350 )   PDF(4482KB) ( 430 )   
参考文献 | 相关文章 | 多维度评价
文中提出了一种在无GPS信号的未知室内空间中利用行为树框架调度多无人机和路径规划算法进行协作探索的方法。该方法的核心是提出了一种未知区域动态目标追踪算法Tracking-D*Lite对未知地形中的运动目标进行跟踪,同时结合基于Bug算法的Wall-Around算法在未知室内空间中导航无人机,最后利用行为树对多架无人机以及这两种算法进行调度和切换。该方法基于ROS,使用 Gazebo 进行模拟和可视化。设计并实现该方法与其他未知室内空间探索方法的对比实验,结果表明它可以有效地完成探索任务并最终绘制出整个未知室内空间的边界轮廓图。一旦扩展到现实世界中,该方法可以应用于地震后的危险建筑、危险气体工厂、地下矿井或其他搜救场景。
图着色问题禁忌搜索改进算法
汪建昌, 王硕, 李壮, 江华
计算机科学. 2022, 49 (11A): 211000128-5.  doi:10.11896/jsjkx.211000128
摘要 ( 636 )   PDF(1983KB) ( 631 )   
参考文献 | 相关文章 | 多维度评价
图着色问题是一个NP-hard问题,在现实中有广泛的应用,比如寄存器分配、机场调度等。禁忌搜索算法是一种经典的启发式搜索算法,在图着色问题的算法设计中广泛使用。禁忌搜索算法作为一个底层算子,也常被用于诸如混合进化算法(Hybrid Evolutionary Algorithm,HEA)的图染色算法设计中,对算法的性能起到了关键作用。因此,对禁忌搜索算法的改进对于促进图染色算法的研究具有现实意义。针对图着色问题,提出一种改进版禁忌搜索算法Tabucol+以增强搜索的集中性。算法在传统禁忌搜索策略的基础上,引入新的评分策略。实验结果显示,新的算法能够显著减少迭代次数和搜索时间,在个别算例上甚至取得了颜色数改进的效果。
结合情感信息的个性化对话生成
徐晖, 王中卿, 李寿山, 张民
计算机科学. 2022, 49 (11A): 211100019-6.  doi:10.11896/jsjkx.211100019
摘要 ( 396 )   PDF(2473KB) ( 434 )   
参考文献 | 相关文章 | 多维度评价
如今,人机对话系统受到了越来越多的关注,但目前主流的人机对话系统很少考虑说话者的个性化特征。对话系统的一个重要且有待探索的方面是根据交互人员的个性来提升对话的响应质量。个性化是创建智能对话系统的关键,可以最大程度地适应到人类的生活中。然而,在自然语言处理中体现人物个性是很困难的,在个性化对话生成中,情感也是一个很重要的因素,因此文中提出了融合属性级情感的个性化对话生成模型。该模型使用BERT-MRC模型抽取人物个性和历史对话的情感词属性词信息,采用改进的UNILM神经网络模型对人物个性以及历史对话进行编码,同时在编码表征时结合情感词信息和属性词信息,最终生成符合人物个性的对话。实验证明,结合情感信息的个性化对话生成方法能够有效地提升个性化对话生成的质量,增加生成回复的多样性。
基于视频的在线学习情感识别研究
魏艳涛, 罗洁琳, 胡美佳, 李文昊, 姚璜
计算机科学. 2022, 49 (11A): 211000049-6.  doi:10.11896/jsjkx.211000049
摘要 ( 399 )   PDF(3178KB) ( 485 )   
参考文献 | 相关文章 | 多维度评价
随着疫情防控的常态化开展,在线学习已成为日常教学活动的主要形式之一。然而,随着在线学习活动的大规模开展,“情感缺失”问题日益凸显,已成为阻碍在线学习成效的主要原因之一。针对上述问题,探讨利用视频数据的非侵入式在线学习情感状态识别方法。首先采集了22名学生在线学习的面部视频和心率数据,构建了双模态在线学习情感数据库。其次,采用帧注意网络从学习视频中提取表情特征,识别在线学习情感状态,识别精度达到了87.8%。最后,探讨了视频心率识别方法在在线学习情感分析中的应用,研究结果表明,困惑状态下的心率水平具有显著性。本文从学习视频数据挖掘出发,重点探讨了基于表情和视频心率的学习情感识别,为提高在线学习情感状态感知提供了新思路。
基于双重指针网络的车货匹配双重序列决策研究
蔡岳, 王恩良, 孙哲, 孙知信
计算机科学. 2022, 49 (11A): 210800257-9.  doi:10.11896/jsjkx.210800257
摘要 ( 746 )   PDF(2931KB) ( 404 )   
参考文献 | 相关文章 | 多维度评价
由于我国对公路运输资源利用不均,车货供需问题成为如今的热点问题。车货供需匹配平台为最大化总体运力资源利用率,需要整合运输需求和运力,降低成本并提高效率。大部分平台通常采用启发式算法求解车货匹配问题,此类算法面对大规模的问题时存在寻优瓶颈。针对上述问题,首次将车货供需匹配问题转变成一种双重序列决策问题,据此研究适用于当今车货供需匹配环节的一种高效算法。首先,提出了一种车货匹配的数学模型,并将该模型抽象为双重序列决策问题,再创新性地提出双重指针网络算法求解该问题。本实验使用Actor-Critic算法作为模型的训练框架来训练双重指针网络,并评估了模型。经实验得,双重指针网络的车货匹配求解方法的寻优能力在小问题规模中与传统启发式算法相当,在大问题规模中超越启发式算法,同时时间消耗都大大下降。
基于注意力机制与集成学习的甲型H5N1流感病毒抗原相似性预测
王迎晖, 李维华, 李川, 陈伟, 文俊颖
计算机科学. 2022, 49 (11A): 210900032-6.  doi:10.11896/jsjkx.210900032
摘要 ( 464 )   PDF(2012KB) ( 361 )   
参考文献 | 相关文章 | 多维度评价
甲型流感病毒可能导致季节性流感病毒疫情甚至全球大爆发。流感病毒血凝素蛋白的持续和累积变化会产生新的抗原株,致使疫苗效力降低甚至失效。抗原相似性预测对流感疫情监测和疫苗选择是至关重要的。甲型H5N1病毒源于禽类,可引起人类肺炎和多器官衰竭。针对流感病毒及其抗原特点,设计一个预测病毒抗原相似性的神经网络模型,该模型分别基于K-mer嵌入与位置特异性矩阵表示序列信息并进行融合;在此基础上,设计融合注意力机制的集成深度学习模型用于抗原相似性预测。实验结果表明,相比基准模型,该模型显著提高了模型预测的准确率、精确率、F1值和MCC值。从实验中可以看出该模型具有良好的鲁棒性和扩展性,在抗原相似性预测领域有很好的应用潜力。
基于Kernel-XGBoost的跨语言术语对齐方法
于娟, 张晨
计算机科学. 2022, 49 (11A): 211000111-6.  doi:10.11896/jsjkx.211000111
摘要 ( 689 )   PDF(2599KB) ( 365 )   
参考文献 | 相关文章 | 多维度评价
跨语言术语对齐是跨语言文本数据分析与知识发现的关键基础。针对跨语言术语对齐研究多为单词术语对齐且严重依赖向量空间对齐的现状,提出一种能够实现跨语言单词及多词术语间一对多对齐的Kernel-XGBoost方法。给定跨语言平行语料库,该方法分两步得到同义的跨语言术语对:1)跨语言术语提取与候选术语对生成;2)基于跨语言词嵌入的术语对齐。汉语-西班牙语以及汉语-法语的术语对齐实验表明,该方法在Top-5的准确率可达到80%,能有效支持跨语言信息检索、本体构建等跨语言文本数据挖掘任务。
基于论据边界识别的立场分类研究
陈孜卓, 林夕, 王中卿
计算机科学. 2022, 49 (11A): 210800180-5.  doi:10.11896/jsjkx.210800180
摘要 ( 420 )   PDF(3282KB) ( 378 )   
参考文献 | 相关文章 | 多维度评价
在线辩论中作者通常会使用情绪化的语言来阐述自己的观点,表达方式较为随意。而论据作为对观点的佐证,则更多地包含了作者的立场倾向,因此论据信息对于立场识别有很大的帮助。基于BERT构建了论据边界识别模型,以提升在线辩论中文本立场分类的效果。首先利用BERT从辩论文本中抽取出与辩论主题相关的论据;然后将论据信息与文本信息进行融合,利用BERT模型得到辩论文本的立场分类结果。在英文在线辩论数据集上进行实验,与仅使用文本信息的BERT立场分类模型和其他机器学习模型相比,基于论据边界识别的模型在文本立场的分类效果上有更好的表现。
基于DE-lightGBM模型的上市公司高送转预测实证研究
岑健铭, 封全喜, 张丽丽, 佟锐超
计算机科学. 2022, 49 (11A): 211000017-7.  doi:10.11896/jsjkx.211000017
摘要 ( 402 )   PDF(2816KB) ( 353 )   
参考文献 | 相关文章 | 多维度评价
“高送转”现象指上市公司转增较大比例的股票。针对上市公司实施“高送转”现象的预测问题,文中提出了一种基于差分进化算法超参数优化的lightGBM模型(简记为DE-lightGBM)。该模型主要包括两个方面:首先,利用差分进化算法调整lightGBM模型的损失函数中少数类别的权重以及正则项系数,以处理数据类别不平衡的问题;其次,以F1和AUC作为评价指标,再次利用差分进化算法优化li-ghtGBM模型的重要超参数变量,找到一组预测效果最优的参数组合。数值结果显示,DE-lightGBM模型取得了较好的效果,F1和AUC值分别为0.536 8和0.873 4。提出的DE-lightGBM模型能够有效识别下一年将会实施“高送转”的上市公司。
基于知识蒸馏模型ELECTRA-base-BiLSTM的文本分类
黄玉娇, 詹李超, 范兴刚, 肖杰, 龙海霞
计算机科学. 2022, 49 (11A): 211200181-6.  doi:10.11896/jsjkx.211200181
摘要 ( 705 )   PDF(2970KB) ( 455 )   
参考文献 | 相关文章 | 多维度评价
文本情感分析常用于口碑分析、话题监控、舆情分析,是自然语言处理最活跃的研究领域之一。深度学习中的预训练语言模型能解决文本情感分类任务中的一词多义、受词性及其位置影响等问题。但其模型复杂,参数繁多,导致消耗巨大资源,模型难部署。针对上述问题,采用知识蒸馏的思想,使用ELECTRA预训练模型作为教师模型,BiLSTM作为学生模型,提出基于ELECTRA-base-BiLSTM的蒸馏模型。将文本“one-hot”编码的词向量表示作为蒸馏模型的输入,进行中文文本情感分类。通过实验验证,分别比较加入ALBERT-tiny,ALBERT-base,BERT-base,BERT-wwm-ext,ERNIE-1.0,ERNIE-GRAM,ELECTRA-base这7种教师模型的蒸馏结果。研究发现ELECTRA-base-BiLSTM蒸馏模型的准确率、精确率和综合评价指标最高,情感分类效果最好,可以获得接近ELECTRA语言模型的文本情感分类结果,比轻量级浅层网络BiLSTM模型的分类准确率高5.58%。此模型在降低ELECTRA模型复杂度,减少资源消耗的同时,提升了轻量级BiLSTM模型的中文文本情感分类效果,对后续文本情感分类的研究具有一定的参考价值。
一种基于超网络的多目标回归方法
孙开伟, 郭豪, 曾雅苑, 方阳, 刘期烈
计算机科学. 2022, 49 (11A): 211000205-9.  doi:10.11896/jsjkx.211000205
摘要 ( 631 )   PDF(3924KB) ( 406 )   
参考文献 | 相关文章 | 多维度评价
多目标回归(Multi-target Regression,MTR)是一种同时预测多个相互关联的连续型输出目标的机器学习问题。在多目标回归中,多个输出目标共享同一个特征表示,其主要挑战在于如何有效地发掘和利用输出目标之间的关联,以提高所有输出目标的预测准确性。文中提出了一种基于超网络的多目标回归方法(Multi-target Regression Method based on Hypernetwork,MTR-HN)。首先采用k-means算法对每个连续型输出目标进行一维聚类,然后根据聚类结果将多目标回归问题转化成多类别多标签分类问题,最后采用超网络模型对多类别多标签分类问题进行建模,构建最终的多目标回归预测模型。MTR-HN方法的优点在于:1)对输出空间离散化,能够降低模型过拟合的风险;2)采用超网络模型,能更有效地对输出目标之间的关联进行建模。在18个多目标回归数据集上进行的对比实验表明,文中提出的MTR-HN方法能够取得比现有方法更高的预测准确性。
融合多层次信息的海关同义词识别方法
刘大为, 车超, 魏小鹏
计算机科学. 2022, 49 (11A): 210800197-5.  doi:10.11896/jsjkx.210800197
摘要 ( 360 )   PDF(2756KB) ( 425 )   
参考文献 | 相关文章 | 多维度评价
在海关进出口商品文本信息中,往往会用不同的词语描述同一商品的特征,识别这些商品的特征同义词能更好地进行观点汇总,进而对同一类特征的商品进行涉税风险的防控。针对海关申报要素短语的特点,提出一种融合多层次信息的卷积神经网络模型,构建并训练了一个基于孪生和三级网络结构的Sentence-BERT,其对相近的要素短语具有更好的语义表示,弥补了word2vec短文本词嵌入特征离散稀疏的不足。利用多尺寸卷积核提取要素短语的不同特征。通过BiLSTM神经网络学习要素短语的语序信息,并利用注意力机制分配关键词权重。获得的全连接融合同义词语义特征和关键词特征,通过softmax层进行预测。实验证明,融合多层次信息的卷积模型比其他模型有更好的表现。
改进蚁群算法求解多目标单边装配线平衡问题
吴晓雯, 郑巧仙, 徐鑫强
计算机科学. 2022, 49 (11A): 210900165-5.  doi:10.11896/jsjkx.210900165
摘要 ( 171 )   PDF(2069KB) ( 398 )   
参考文献 | 相关文章 | 多维度评价
针对目前工业生产中存在的第二类单边装配线平衡问题,从实际角度出发,考虑人力资源如当前操作工熟练程度以及操作工疲劳程度,在这两种约束条件下,建立以最小化工位节拍和最小化平衡损失率为优化目标的数学模型。使用蚁群算法与模拟退火算法结合的改进蚁群算法求解单边装配线平衡问题的可行解。算法采用操作选择机制和操作分配机制,对操作集中的操作进行选择并将其分配至工位。采用仿真算例验证该算法的可行性,通过8个实例验证所提出的算法对求解该问题的有效性,并对实际的工业生产产生一定的技术方法支持。
急件订单插入下生产系统的重调度
黄鹏鹏, 赵春, 郭煜
计算机科学. 2022, 49 (11A): 211100193-6.  doi:10.11896/jsjkx.211100193
摘要 ( 356 )   PDF(2770KB) ( 480 )   
参考文献 | 相关文章 | 多维度评价
针对急件订单的扰动,对生产系统的重调度问题进行了研究。首先,根据产品工艺及所用设备计算急件订单与原有虚拟单元的相似度。然后,将相似的急件订单插入现有单元,调整生产资源调度方案,安排其优先生产。为了减小重调度对生产系统的冲击,兼顾生产的高效性与稳定性,构建以完成所有任务订单总流程时间及产品工序次序扰动最小为目标的数学模型,设计一个遗传-蚁群算法,借助遗传算法求得较优解后,再利用蚁群算法的正反馈求解问题。最后,将实例代入所建模型,借助MATLAB编程求解。实验结果表明,该方法能够优化重调度的生产资源分配,保证企业生产的效率与稳定。
基于预算时变的多臂赌博机模型
林宝玲, 贾日恒, 林飞龙, 郑忠龙, 李明禄
计算机科学. 2022, 49 (11A): 210800212-6.  doi:10.11896/jsjkx.210800212
摘要 ( 209 )   PDF(2161KB) ( 312 )   
参考文献 | 相关文章 | 多维度评价
目前已有很多有关预算的多臂赌博机模型,但这些模型能解决的实际问题具有局限性,即这些问题必须都是全程受一个总预算限制。对此,文中提出基于预算时变的多臂赌博机模型,该模型能够打破这种局限性,并被用于解决其他更多的实际问题。该模型抓住了学习者每一轮的动作都受到相应这一轮预算限制的情况。更具体地说,每一轮,玩家都需要在相应这一轮预算的限制下选择拉L(L≥1)个臂(L不是一个固定值)。玩家的目标就是在每一轮预算的限制下,最大化总的平均奖励。根据这个模型,文中提出基于置信界的动态规划算法。该算法利用模型的特点,每一轮都以臂的经验平均奖励的置信上界为依据,然后使用动态规划算法进行拉臂操作。文中进一步引入遗憾的概念,并从理论上推导得出该算法遗憾的上界与最终预算的总和存在一定的关系。最后,通过实验,将所提算法在不同场景下和其他几个传统的预算受限的多臂赌博机算法(ε-first,KUBE,BTS)进行比较,验证了所提算法的可行性。
EGOS-DST:对话现象感知和模式引导的一步对话状态追踪算法
朱若尘, 杨长春, 张登辉
计算机科学. 2022, 49 (11A): 210900246-7.  doi:10.11896/jsjkx.210900246
摘要 ( 283 )   PDF(2506KB) ( 331 )   
参考文献 | 相关文章 | 多维度评价
为了平衡过度依赖本体和完全舍弃本体两种极端方式,近期的对话状态追踪工作专注于混合方式。目前,这些混合方式忽略了一些特殊现象,比如值共享和推荐接受。此外,被广泛使用的槽位门机制使模型很难并行处理槽位,并且还会将误差传播到槽值生成步骤。针对以上问题,提出一种新的混合方式,它能够处理多样性表达、未知值、值共享和推荐接受4种不同对话现象。通过修改候选值集合和模型输入,模型不再依赖槽位门机制并且能够一步并行处理槽位。实验结果显示,模型在英文数据集MultiWOZ 2.2和2.3上分别达到了57.7%和59.5%的联合目标准确率,在中文数据集RiSAWOZ上达到了68.1%,并且推理一次仅需10ms。最后还分析了模型的鲁棒性,在MultiWOZ 2.2上的结果显示即使推荐错误率达到15%,联合目标准确率仍有55.4%。
基于分层学习和差分进化的混合PSO算法求解车辆路径问题
陈莹, 黄佩萱, 陈锦萍, 王祖怡, 沈映珊, 樊小毛
计算机科学. 2022, 49 (11A): 210800271-7.  doi:10.11896/jsjkx.210800271
摘要 ( 434 )   PDF(2519KB) ( 384 )   
参考文献 | 相关文章 | 多维度评价
车辆路径问题旨在求解每辆车的服务路线,使其在完成配送任务的情况下行驶距离之和最短,是运筹学中经典的组合优化问题,属于NP难问题,且具有较高的理论意义与实际应用价值。针对该问题,提出了一种基于分层学习和差分进化的混合粒子群优化算法(Hybrid Particle Swarm Optimization Algorithm Based on Hierarchical Learning and Different Evolution,DE-HSLPSO)。DE-HSLPSO中引入了分层学习策略,以适应度值和迭代次数为依据将种群粒子动态划分为3层,在前两层粒子的进化过程中引入了社会学习机制,而第三层粒子进行差分进化,通过变异和交叉有效地增加粒子的多样性,从而开拓空间,有利于跳出局部最优。通过在经典的CVRP数据集上进行仿真实验,来探究DE-HSLPSO各部分对整体性能的影响,实验证明分层策略与差分进化均可提升算法的整体性能。另外,在7个基本算例上对DE-HSLPSO与其他优化算法进行了测试,综合时间与最优解进行对比,结果表明DE-HSLPSO的求解性能优于其他对比算法。
突发事件中网络评论的情感-主题随时间的演变研究
史伟, 付月
计算机科学. 2022, 49 (11A): 211000193-6.  doi:10.11896/jsjkx.211000193
摘要 ( 190 )   PDF(2557KB) ( 346 )   
参考文献 | 相关文章 | 多维度评价
网络评论的情感主题演变分析对突发事件中网络舆情的控制极具价值。针对情感主题动态性的特点,构建一个基于LDA的情感主题模型,通过对时间与主题和情感的联合建模来分析情感主题随时间的演变,推导了基于Gibbs抽样过程的推理算法,最后通过微博突发事件数据集的分析结果显示了联合模型较高的准确性和情感主题随时间演变过程中良好的应用性。
一种基于层次聚类和模拟退火的选择性集成算法的风控模型研究
王茂光, 冀昊悦, 王天明
计算机科学. 2022, 49 (11A): 210800105-7.  doi:10.11896/jsjkx.210800105
摘要 ( 197 )   PDF(2253KB) ( 421 )   
参考文献 | 相关文章 | 多维度评价
集成学习模型可有效解决单一模型出现的模型结构单一、稳定性和预测能力弱的问题。但是由于结构复杂,其常出现运行效率低下、存储代价过大等问题,一般使用选择性集成算法优化集成学习模型来解决这些问题。目前提出的选择性集成算法仍存在运行效果和效率提升不够明显的现象。为解决这些问题,提出一种基于Stacking集成框架的选择性集成算法,算法主要使用了凝聚型层次聚类(AHC)算法和模拟退火的Metropolis准则对基学习器的种类和个数进行筛选。在实证分析方面,分别使用了国内外网贷对模型进行搭建。实验结果证明,AHC-Metropolis选择性集成模型可有效提升计算效率、预测能力、稳定性和泛化能力,有助于规范互联网金融行业秩序,协助开展金融监管任务,为建立我国金融风控管理体系和保障国家金融安全提供有效依据。
大数据&数据科学
复杂网络社团发现综述
潘雨, 王帅辉, 张磊, 胡谷雨, 邹军华, 王田丰, 潘志松
计算机科学. 2022, 49 (11A): 210800144-11.  doi:10.11896/jsjkx.210800144
摘要 ( 230 )   PDF(3022KB) ( 557 )   
参考文献 | 相关文章 | 多维度评价
在复杂网络中,社团结构是广泛存在的重要潜在结构。挖掘复杂网络中的社团结构,对探索网络潜在特性、理解网络组织结构、发现网络隐藏规律和交互模式等具有重要的理论和现实意义,是网络分析任务的关键研究内容。介绍了社团发现的背景和意义,并从静态网络社团发现和动态网络社团发现两个方面对社团发现的方法进行了总结和梳理。其中,静态网络的社团发现包括基于划分的社团发现方法、基于层次聚类的社团发现方法、基于模块度的社团发现方法、基于非负矩阵分解的社团发现方法和基于深度学习的社团发现方法。动态网络社团发现包括增量聚类的社团发现方法和演化聚类的社团发现方法。另外介绍了常用的社团发现评价指标,并在最后讨论了社团发现所面临的一些挑战及未来的发展方向。
基于规则链的网络协同制造数据融合方法研究
胡楚阳, 柳先辉, 赵卫东
计算机科学. 2022, 49 (11A): 220300175-7.  doi:10.11896/jsjkx.220300175
摘要 ( 268 )   PDF(5118KB) ( 359 )   
参考文献 | 相关文章 | 多维度评价
对制造资源数据进行高效组织利用,施以有效的数据融合手段进而提取更多的有利信息,是当今智能制造领域的研究热点。同时,基于事件流的规则链技术开始崭露头角,其高自由度为与数据融合相结合提供了可能。针对当下制造资源组织模型较少、数据融合模型应用范围辖制在同架构系统内、与规则链结合的研究较少的问题,对复杂制造资源的组织方法进行建模,改进了基于MROM-VMC的调度流程,总结了制造资源数据存储链结构,并针对数据链中的数据处理环节提出了一种基于规则链的数据融合方法,以处理大量同构与异构的传感器数据,最终在网络协同制造资源平台中的数据处理环节得到验证,提升了制造资源数据利用的效率以及数据融合方法的可操作性,为用户提供辅助决策支持。
基于k-shell熵的影响力节点的排序与识别
原慧琳, 冯宠
计算机科学. 2022, 49 (11A): 210800177-5.  doi:10.11896/jsjkx.210800177
摘要 ( 429 )   PDF(3741KB) ( 415 )   
参考文献 | 相关文章 | 多维度评价
节点的影响力排序一直是复杂网络领域中最具有吸引力的一个问题,其对于衡量节点的传播能力有着重要的作用。由于网络中的节点的规模很大,研究者们希望能够更准确地估计节点的传播能力。文中基于信息论的基本概念和k-shell方法提出了一种新的影响力节点的排序方法,根据节点所在网络中的位置的拓扑信息来测量节点的传播能力。实验结果表明,该方法可以有效地识别网络中有影响力的节点,并且可以有效避免 k-shell法的“富人俱乐部现象”。
基于多源健康感知数据动静态关系融合的疾病诊断
霍甜媛, 顾晶晶
计算机科学. 2022, 49 (11A): 211100241-9.  doi:10.11896/jsjkx.211100241
摘要 ( 272 )   PDF(3300KB) ( 363 )   
参考文献 | 相关文章 | 多维度评价
疾病诊断是电子健康记录数据挖掘的热门研究领域,也是实现医疗诊断智能化的一个重要环节。但是,电子健康记录中健康感知数据的来源多样、数据结构复杂,且不同类型的数据之间有着潜在的相关性,在进行特征提取和挖掘分析过程中存在着异构数据应该如何融合的问题。只有对医学感测数据、个人体质记录数据、疾病间关系数据进行综合考虑,挖掘其中的相关隐藏特征,才能对多种类别疾病进行更准确的诊断。因此,基于多源健康感知数据动静态关系融合的疾病诊断模型(DSRF)首先通过动静态关系融合算法解决动态医学感测数据和静态体质记录数据的异构性问题并挖掘其相关关系,然后计算多类别疾病的关联矩阵来提取疾病间依赖关系,最后在门控循环单元网络架构的基础上将多种健康感知数据进行融合,完成了多源异构数据的综合分析。在美国MIMIC-III临床数据集上的实验结果证明,相比同类型主流模型,该模型可以更准确地对多种类别疾病进行联合诊断。
基于核心节点影响力的社区发现方法
原慧琳, 韩真, 冯宠, 黄碧, 刘军涛
计算机科学. 2022, 49 (11A): 211100002-7.  doi:10.11896/jsjkx.211100002
摘要 ( 282 )   PDF(3274KB) ( 398 )   
参考文献 | 相关文章 | 多维度评价
社区发现是复杂网络研究领域的一个热点问题,目前已经有许多局部社区发现算法被提出用于快速发现高质量的社区,不过它们往往存在种子节点依赖或是稳定性问题。因此,部分算法试图根据核心节点被邻居高度包围且相互之间距离较远的拓扑特性来精确地锁定种子节点以避免上述问题,但距离的计算使得其时间复杂度较高。文中提出了一种基于核心节点影响力的社区发现方法CDIC,该方法首先根据核心节点的拓扑特性和网络邻接信息寻找所有可能是核心的节点,之后利用真正核心节点影响力较高的性质和标签传播的思想来扩张社区,并淘汰被误选为核心的节点以避免种子依赖问题,同时不涉及最短距离的计算也保证了较低的时间复杂度,最后依据相似度理论提出了一种社区对节点的吸引力来合并特异节点,以保证算法结果的稳定性。将CDIC与6种经典算法以及2种近年来提出的算法在64个人工网络和4个真实网络上进行仿真实验,并对其社区划分结果对应的标准化互信息值和纯度进行了比较,结果表明了CDIC的有效性。
空间co-location模式的主导特征挖掘
熊开放, 陈红梅, 王丽珍, 肖清
计算机科学. 2022, 49 (11A): 211000126-7.  doi:10.11896/jsjkx.211000126
摘要 ( 232 )   PDF(3167KB) ( 377 )   
参考文献 | 相关文章 | 多维度评价
空间co-location模式是空间特征的子集,它们的实例在邻域内频繁并置出现。传统co-location模式不区分模式中特征的重要性,忽略了特征间的主导关系。主导特征co-location模式考虑模式中特征的不平等性,分析特征间的主导关系,具有重要的应用意义。然而,现有主导特征模式挖掘没有从特征实例分布的角度综合考虑一个特征主导其他特征的可能倾向和影响强度,使得挖掘的主导特征及模式没有较好地反映特征间的主导关系。首先分析co-location模式中特征实例的空间分布,提出模式主导度,用以度量模式中某个特征主导其他特征的可能倾向;提出主导影响度,用以度量模式中某个特征主导其他特征的影响强度;基于这两个新度量,提出co-location模式的主导特征挖掘。然后通过优化新度量的计算,提出有效的主导特征co-location模式挖掘算法。在真实数据集和合成数据集上开展大量实验,验证了所提方法能够有效地识别co-location模式中的主导特征,所提算法能够高效地挖掘主导特征及模式。
基于分数线预测的多特征融合高考志愿推荐算法
王泽卿, 季圣鹏, 李鑫, 赵子轩, 王鹏旭, 韩霄松
计算机科学. 2022, 49 (11A): 211100266-7.  doi:10.11896/jsjkx.211100266
摘要 ( 827 )   PDF(2646KB) ( 864 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着我国高考人数逐年增多,考生对高考志愿填报服务的需求日益增加。面对海量的院校填报信息,考生往往很难在短期内做出比较符合自身意愿的合理选择,进而导致报考事故的发生。因此,针对高考志愿报名问题,在爬取历年高考录取数据的基础上,提出一种基于分数线预测的多特征融合推荐算法(Reco-PMF)。该算法首先利用历年高校最低投档位次,通过BP神经网络预测报考年份各高校最低投档位次以及最低投档分数线,然后根据考生分数进行院校初筛,进而构建3种与录取分数相关的特征,结合院校软科排名,通过遗传算法进行权值寻优,得到不同院校的录取概率,并在此基础上定义推荐度实现为考生进行不同录取风险层次的高校推荐,形成完整的推荐结果。实验结果表明,基于BP神经网络的高校录取分数预测算法在不同误差限下的表现均优于其他算法;相比百度和夸克的已有服务,所提算法在多层次测试分数下,平均录取率分别提升14.8%和24.1%,同时成功录取院校的平均位次分别提升了99名和87名。
基于记忆增强 GAN 的异常检测
周士金, 邢红杰
计算机科学. 2022, 49 (11A): 211000202-9.  doi:10.11896/jsjkx.211000202
摘要 ( 683 )   PDF(3189KB) ( 511 )   
参考文献 | 相关文章 | 多维度评价
基于生成式对抗网络(Generative Adversarial Networks,GAN)的异常检测方法在训练阶段训练集仅由正常数据构成,当训练数据较为充分时,它在该训练集上能够取得较小的重构误差。然而在测试阶段,正常数据的重构误差和部分异常数据的重构误差之间的差别很小,使得基于GAN的异常检测方法的判别性能较差。为了解决该问题,提出了基于记忆增强GAN的异常检测方法。在基于GAN的异常检测方法中加入记忆增强模块,使模型能够记忆正常数据的特征,从而使得异常数据的重构误差变大,该方法的判别性能得到增强。在MNIST,Fashion-MNIST和CIFAR-10上的实验结果表明,与相关方法相比,所提方法具有更优的检测性能。
DCPFS:分布式轨迹流伴随模式挖掘框架
张康威, 张敬伟, 杨青, 胡晓丽, 单美静
计算机科学. 2022, 49 (11A): 211100268-10.  doi:10.11896/jsjkx.211100268
摘要 ( 419 )   PDF(3802KB) ( 437 )   
参考文献 | 相关文章 | 多维度评价
随着定位技术的广泛使用,产生了以轨迹流形式收集的海量时空数据,如何从中挖掘有用的信息得到越来越多学者的关注。从轨迹流中挖掘伴随模式指在同一时间内发现具有高度相似行为的群体,对于交通管理、推荐系统的实时应用至关重要。然而,现有的研究只达到秒级响应,面对大规模轨迹数据难以在毫秒级的时间内快速响应。因此,提出了分布式轨迹流挖掘框架DCPFS。框架的主要模块包括:1)为了减少基于密度的聚类算法DBSCAN由于大规模数据带来的大量时间消耗,研究基于分布式部署方案,设计了数据分区策略和聚类合并算法,确保聚类的并行性及准确性;2)由于现实中轨迹移动具有方向性,在聚类阶段增加方向维度以减少冗余聚类;3)鉴于模式挖掘阶段涉及对聚类结果的交叉,设计了并行交叉算法来提高挖掘效率;4)基于Flink分布式大数据流处理平台实现了DCPFS。以成都市出租车GPS数据集和谷歌生活数据集为例进行实验,验证了所提框架比基准方法具有更快的响应速度。
融合知识表示的关系型数据库操作框架
姜宗林, 李志军, 顾海军
计算机科学. 2022, 49 (11A): 211200030-9.  doi:10.11896/jsjkx.211200030
摘要 ( 151 )   PDF(4556KB) ( 426 )   
参考文献 | 相关文章 | 多维度评价
关系型数据库指采用关系模型来组织数据的数据库,需要使用结构化查询语言(SQL)来操作其中的数据,面向应用时只能按照开发者设定好的程序规则进行数据库操作,程序规则的修改和新增过程繁琐且需要一定专业度,对普通用户不友好。为提高关系型数据库应用的扩展性和普适性,利用知识表示理论对数据库操作相关知识进行概念建模,使用框架结合规则的知识表示法建立数据库操作的一般化范式,基于关系型数据库的操作特点,结合关系模型及结构化查询语句的语法语义研究设计推理算法,将面向用户的数据库操作指令抽象成逻辑符号,并将事物之间的内在联系抽象为逻辑符号间的规则约束,使用求解系统根据逻辑符号表示的规则约束进行问题求解。基于上述理论及算法,设计并实现一种融合知识表示的关系型数据库操作框架,将用户输入转化成数据库操作语句,实现数据库系统操作。由应用实例可知,所提操作框架能在与关系型数据库友好兼容的基础上嵌入应用系统,程序规则易扩展,应用系统的使用和更新维护难度低,自适应性强,可以为用户提供更加灵活智能的数据库操作管控服务。
一种基于图注意力聚合的POI推荐新方法
蔡国永, 陈心怡, 王顺杰
计算机科学. 2022, 49 (11A): 210800149-5.  doi:10.11896/jsjkx.210800149
摘要 ( 237 )   PDF(2162KB) ( 405 )   
参考文献 | 相关文章 | 多维度评价
在基于位置社交网络(Location-based Social Network,LBSNs)的服务中,有效的兴趣点(Point-of-Interest,POI)推荐具有极大的经济和社会效用,但如何深入理解LBSN中的位置、结构和行为等相关信息,并进行推理以及实现POI推荐仍然是一项挑战性任务。针对LBSNs中的多种异构数据,提出了一种能够挖掘用户社交和POI多种特征信息的用于POI推荐的图神经网络模型——POIR-GAT。首先POIR-GAT利用社交关系构建用户-用户图,并结合用户-POI交互图共同抽取用户特征向量;其次,基于POI的不同地理特征构造不同的特征矩阵,并通过矩阵分解获得不同的潜在因子,将这些潜在因子融入POI的特征向量,以学习它们对用户行为的共同影响,并用于实现融合社交因素和POI特征的推荐模型。通过在2个公开数据集上进行的实验,验证了所提POIR-GAT模型可以有效融合用户社交信息和POI特征信息,提高POI推荐质量。
基于属性图注意力网络的电影推荐模型
孙开伟, 刘松, 杜雨露
计算机科学. 2022, 49 (11A): 211100106-8.  doi:10.11896/jsjkx.211100106
摘要 ( 342 )   PDF(3128KB) ( 406 )   
参考文献 | 相关文章 | 多维度评价
近年来,图网络被广泛应用于推荐领域并取得了较大进展,但是现有方法往往侧重于用户项目的交互建模,从而性能容易受到数据稀疏问题的限制。因此文中利用额外的属性信息,提出了一种基于属性图注意力网络的电影推荐模型。首先提出了一种基于注意力的GNN,采用显式反馈来计算实体和属性间的注意力得分,相比较使用拉普拉斯矩阵的聚合方式,能够更有效地区分不同属性对实体的影响,在属性和实体间信息聚合上更加有效。此外,由于不同实体受属性影响和行为影响的程度不同,文中设计了一种细粒度偏好融合策略,将属性群体偏好和个人行为偏好这两个方面的偏好更好地结合在一起,使实体的嵌入表示更加全面准确和个性化。在真实的数据集上进行实验,结果表明所提推荐方法充分利用属性图中蕴含的属性信息能够有效缓解数据稀疏问题,并且在电影推荐的两个评价指标召回率和nDCG上都明显优于其他基准算法。
基于加权马氏距离的模糊多核支持向量机
戴小路, 汪廷华, 周慧颖
计算机科学. 2022, 49 (11A): 210800216-5.  doi:10.11896/jsjkx.210800216
摘要 ( 289 )   PDF(1789KB) ( 360 )   
参考文献 | 相关文章 | 多维度评价
模糊支持向量机通过引入模糊隶属度有效区分不同样本的重要程度,降低了传统支持向量机对噪声数据的敏感性。针对基于欧氏距离设计的隶属度函数忽略了样本的总体分布,且未考虑样本特征重要性的区分,提出了一种基于加权马氏距离的模糊支持向量机方法。首先应用Relief-F算法计算样本特征权重,然后基于该权重计算样本距其类中心的加权马氏距离,最后根据该距离值度量样本隶属度。在此基础上,考虑到核函数及其核参数难以确定,将模糊支持向量机与多核学习方法相结合,提出基于加权马氏距离的模糊多核支持向量机,采用加权求和形式构建多核,并遵循中心核对齐原则确定每个核的权重。该方法不仅降低了弱相关特征对分类效果的影响,而且使数据表达更加全面准确。实验结果表明,基于加权马氏距离的模糊支持向量机的分类精度高于基于欧氏距离和基于马氏距离的模糊支持向量机,且基于加权马氏距离的模糊多核支持向量机的分类性能较单核模型更优。
基于Apriori算法填充数据及改进相似度的推荐算法
董云薪, 林耿, 张清伟, 陈颖婷
计算机科学. 2022, 49 (11A): 211000005-5.  doi:10.11896/jsjkx.211000005
摘要 ( 415 )   PDF(2228KB) ( 402 )   
参考文献 | 相关文章 | 多维度评价
针对协同过滤算法中存在的数据稀疏和算法精确度不高的问题,提出了一种融合关联规则的协同过滤算法。首先,利用关联规则Apriori算法挖掘出用户间潜在的联系,该潜在联系采用用户间的关联规则的置信度来表示,紧接着进一步构建用户置信度矩阵,用于填充用户评分矩阵。其次,利用置信度矩阵来改进传统的相似度计算公式,构建一个用户间的综合相似度计算公式。最后,利用填充过后的用户评分矩阵和用户间的综合相似度为用户进行推荐。所提算法相比传统算法具有更高的算法精度。此外,与其他算法相比,所提算法还能有效缓解推荐系统的长尾问题,从而进一步提高推荐系统的推荐质量。
带关注度模糊序决策数据集的分布约简
徐伟华, 张俊杰, 陈修伟
计算机科学. 2022, 49 (11A): 210700191-5.  doi:10.11896/jsjkx.210700191
摘要 ( 386 )   PDF(1759KB) ( 319 )   
参考文献 | 相关文章 | 多维度评价
随着大数据时代的到来,数据的结构变得越来越复杂,数据集的维度变得越来越高,这极大地影响了数据挖掘的效率。因此,很有必要进行数据压缩或对信息系统进行属性约简,即去掉不必要的冗余属性,降低数据维度,提高数据挖掘效率。在现实生活中,人们对数据集中每个条件属性的关注度往往是不一样的。首先,在经典模糊决策数据集的基础上,对不同的条件属性进行加权,定义加权得分函数,进一步建立带关注度的模糊序决策信息系统。然后在该系统中引入分布函数,并通过分布可辨识矩阵建立求分布约简的方法。最后,通过案例分析验证了该方法的可行性。
基于公理化模糊集合的模糊随机事件及其概率
谢健祥, 潘小东, 张波
计算机科学. 2022, 49 (11A): 211100242-7.  doi:10.11896/jsjkx.211100242
摘要 ( 241 )   PDF(1828KB) ( 398 )   
参考文献 | 相关文章 | 多维度评价
基于公理化模糊集合研究模糊随机事件的概率,定义了模糊随机事件以及相应的概率,讨论了模糊随机事件概率的一些基本性质,给出了模糊随机事件概率的乘法公式,证明了模糊随机事件的全概率公式和贝叶斯公式。
基于一种新的q-rung orthopair模糊交叉熵的属性约简算法
王志强, 郑婷婷, 孙鑫, 李清
计算机科学. 2022, 49 (11A): 211200142-6.  doi:10.11896/jsjkx.211200142
摘要 ( 374 )   PDF(2078KB) ( 337 )   
参考文献 | 相关文章 | 多维度评价
熵是刻画模糊集不确定性程度的一种重要手段。为了反映 q-rung orthopair 模糊集中隶属度与非隶属度力量对比所产生的模糊性,首先提出相关的得分函数。针对目前大多数 q-rung orthopair 模糊集的相似性度量的不足,提出了更符合人们直觉的 q-rung orthopair 模糊集交叉熵。目前对 q-rung orthopair 模糊信息系统的属性约简研究相对较少,通过性质讨论和理论证明,发现这种交叉熵可以较好地应用于 q-rung orthopair 模糊信息系统的属性约简,设计了相关的属性约简算法,并通过实例说明了这种算法的合理性。其次,给出了将普通信息系统转换为 q-rung orthopair 模糊信息系统的方法,最后通过计算UCI中多个数据库,验证了所提属性约简算法的合理性和有效性,为q-rung orthopair 模糊信息系统数据预处理提供了新的思路。
基于模糊邻域系统的模糊粗糙集模型
冉虹, 候婷, 贺龙雨, 秦克云
计算机科学. 2022, 49 (11A): 211100224-5.  doi:10.11896/jsjkx.211100224
摘要 ( 347 )   PDF(1773KB) ( 416 )   
参考文献 | 相关文章 | 多维度评价
针对模糊邻域系统,提出了基于一般模糊逻辑算子的模糊粗糙上、下近似算子并探讨了算子的基本性质。然后将邻域系统串行、自反、对称、一元、欧几里得的概念推广到模糊邻域系统。最后研究了当模糊邻域系统是串行、自反、对称、一元、欧几里得时模糊粗糙近似算子的相关代数结构。
网络信息体系信息流程有效低频路径挖掘方法
林文祥, 刘德生
计算机科学. 2022, 49 (11A): 211000001-6.  doi:10.11896/jsjkx.211000001
摘要 ( 173 )   PDF(3411KB) ( 324 )   
参考文献 | 相关文章 | 多维度评价
随着信息技术和网络技术的迅猛发展及其在军事领域的广泛应用,网络信息体系应运而生。网络信息体系以信息为主导,主要的表现为其内含的信息活动流程。信息活动流程的合理性、高效性,直接影响信息在作战体系中的作战效能。采用流程挖掘技术从信息活动事件日志中发现信息活动流程模型,可为信息活动流程的建模、检验和增强提供有效支持。简单通过事件频率分析过滤日志中的噪声,容易导致有效低频路径丢失,降低挖掘的信息活动流程的准确性。结合军事信息活动的特殊性和信息传递的有效性特征,提出了一种基于结构聚合度的有效低频路径挖掘算法。仿真分析表明,该方法可成功分离日志噪声和有效低频路径,对挖掘真实有效的信息流程具有重要意义。
图像处理&多媒体技术
视频识别深度学习网络综述
钱文祥, 衣杨
计算机科学. 2022, 49 (11A): 211200025-10.  doi:10.11896/jsjkx.211200025
摘要 ( 642 )   PDF(2351KB) ( 629 )   
参考文献 | 相关文章 | 多维度评价
视频识别是计算机视觉领域中最重要的任务之一,受到了研究者的广泛关注。视频识别指从视频片段中提取特征,并依据特征识别视频动作。相比于静态图片,视频的各帧间存在较大的关联性。如何高效地使用来自时空等不同维度的特征信息准确地识别视频,是当前研究的重点。以视频识别技术为研究对象,首先介绍了视频识别研究的背景信息及常用数据集。然后,详细地梳理了视频识别方法的演变过程;回顾了基于时空兴趣点、密集轨迹、改进的密集轨迹等传统的视频识别方法,以及近年来提出的可用于视频识别的深度学习网络框架。其中,分别介绍了基于2D卷积神经网络的视频识别框架、基于3D卷积神经网络的视频框架、伪3D卷积神经网络,以及基于Transformer结构的网络,介绍了这些框架的演变,并总结了它们的实现细节及特点;评测了各网络在不同视频识别数据集上的表现情况,分析了各网络的适用场景。最后,展望了视频识别网络框架未来的研究趋势。视频识别任务可以自动、高效地识别出视频所属的类别,基于深度学习的视频识别具有广泛的实用价值。
基于点云的室内结构三维重建综述
任飞, 常青玲, 刘兴林, 杨鑫, 李敏华, 崔岩
计算机科学. 2022, 49 (11A): 211000176-11.  doi:10.11896/jsjkx.211000176
摘要 ( 464 )   PDF(3577KB) ( 595 )   
参考文献 | 相关文章 | 多维度评价
室内结构三维重建本质上是一个还原室内布局的多任务问题,可以进一步对墙体细节和家具进行重建和语义分割。主要介绍基于点云数据的室内结构三维重建。首先概述了室内结构三维重建常用的数据集;然后对基于点云的室内结构3维重建的主要方法展开叙述和讨论,并分析总结了3种类型重建方法的优缺点;最后对当前室内结构三维重建研究所面临的困难和挑战进行阐述,并对未来的研究趋势做出展望。可以得出,目前大部分重建模型所针对的场景和完成任务的多样性较为贫乏,利用不同角度的冗余信息共同优化的多任务协调方案在室内结构重建中具有较大潜力。此外,模型对于室内外环境的无缝融合以及实现内外建筑的充分表现仍需要进行改善。
基于卷积神经网络的乳腺癌组织病理学图像分类研究综述
张喜科, 马志庆, 赵文华, 崔冬梅
计算机科学. 2022, 49 (11A): 210800232-9.  doi:10.11896/jsjkx.210800232
摘要 ( 695 )   PDF(2708KB) ( 635 )   
参考文献 | 相关文章 | 多维度评价
乳腺癌组织病理学检查是确诊乳腺癌的“金标准”。基于卷积神经网络的乳腺癌组织病理学图像分类已经成为医学图像处理与分析领域的研究热点之一。自动且精确的乳腺癌组织病理学图像分类在临床上具有重要的应用价值。首先介绍了两个目前广泛应用于乳腺癌组织病理学图像分类的公开数据集及各自的评价标准。然后,重点阐述了卷积神经网络在两个数据集上的研究进展。在描述研究进展的过程中,分析了部分模型准确率较低的原因,并对提升模型性能给出了一些建议。最后,讨论了乳腺癌组织病理学图像分类目前存在的问题及对未来的展望。
基于数据增强和监督均衡的鱼眼图像行人检测优化方法
司绍峰, 张赛强, 李庆, 陈本瑶
计算机科学. 2022, 49 (11A): 210900070-6.  doi:10.11896/jsjkx.210900070
摘要 ( 306 )   PDF(3277KB) ( 383 )   
参考文献 | 相关文章 | 多维度评价
近年来,由于鱼眼相机被广泛应用于智能监控领域,不少学者提出了针对鱼眼图像的行人检测算法。然而,鱼眼图像场景复杂且存在畸变,其导致的数据集样本分布和算法监督分配的不均衡问题会降低检测器性能。针对上述问题,首先提出了一种针对鱼眼图像行人检测任务的数据增强方法,该方法由模式采样增强和角度直方图增强两部分组成。其中模式采样增强专注于鱼眼图像难例样本挖掘,生成的新样本丰富了鱼眼图像中心附近的行人模式;角度直方图增强基于直方图均衡的思想,对鱼眼图像样本角度分布做平滑处理,缓解了检测器对单一场景的过拟合问题。此外,基于鱼眼图像Anchor-Free行人检测器,提出将定位质量预测与监督信息融合,将Focal Loss推广到连续域用以优化检测器定位分支的监督分配。实验结果表明,所提数据增强算法能够有效缓解鱼眼图像数据集的分布不均衡,在Anchor-Based和Anchor-Free检测网络上均展现了较好的效果;连续Focal Loss结合定位质量优化监督,在不增加Anchor-Free检测器推理计算复杂度的前提下,将整体性能提升了3.8%。
基于注意力机制的糖尿病视网膜病变分类算法
孙福权, 邹彭, 崔志清, 张琨
计算机科学. 2022, 49 (11A): 211000213-5.  doi:10.11896/jsjkx.211000213
摘要 ( 195 )   PDF(2986KB) ( 404 )   
参考文献 | 相关文章 | 多维度评价
糖尿病视网膜病变是糖尿病的重要并发症之一,是工作人群失明的主要原因。视网膜图像类间差距小,易混淆,由于医疗资源不足和缺乏有经验的眼科医生,难以进行大规模的视网膜图像筛查。为此,提出了一种基于注意力机制的糖尿病视网膜病变分类算法,实现对视网膜图像病变程度的精确分类。对数据集进行数据增强和图像增强等预处理操作,利用EfficientNetV2作为主干分类网络,在网络中加入注意力机制对视网膜图像进行细粒度分类,同时采用迁移学习策略对网络进行训练。所提算法的分类准确率和二次加权Kappa值分别为97.8%和0.843,能够有效地对视网膜图像进行病变程度分类,与其他模型相比具有优越性,对于糖尿病视网膜病变的诊断和治疗具有重要意义。
基于子空间特征相互学习的MRI与PET/SPECT图像融合
张瑛, 聂仁灿, 马朝振, 余仕双
计算机科学. 2022, 49 (11A): 211000171-6.  doi:10.11896/jsjkx.211000171
摘要 ( 333 )   PDF(3470KB) ( 447 )   
参考文献 | 相关文章 | 多维度评价
在医学图像中,MRI图像提供包含细节的纹理结构信息和较好的分辨率,而PET/SPECT图像保留了分子活性信息以及颜色功能信息,因此,将它们进行融合是一项重要的任务。大部分现有的方法在融合过程中存在颜色失真、模糊和噪声等问题。为此,提出了一种新的基于子空间注意力孪生自编码网络(Subspace Attention-Siamese Auto-encoding Network,SSA-SAEN)来融合MRI和PET/SPECT图像中有意义的信息。在图像融合网络中提出SSA-SAEN,引入了子空间特征相互学习概念,利用子空间注意力模块,使MRI和PET/SPECT图像能够在学习自己特征的同时互相学习彼此的特征,同时减少信息冗余,保证高效、完整的特征提取。此外,通过条件概率模型对所提取的特征进行互补融合,同时将加权保真项、梯度损失项加入到训练网络中,以达到网络优化的目的。在公共数据集上进行的大量定性和定量实验表明,该方法能够得到一幅清晰的融合图像,表明了该方法与其他先进方法相比的优越性和有效性。
基于改进多层卷积神经网络的水体富营养化遥感监测算法研究
封雷, 封丽, 方芳, 郭劲松, 潘江, 余由, 陈瑜
计算机科学. 2022, 49 (11A): 210200160-5.  doi:10.11896/jsjkx.210200160
摘要 ( 276 )   PDF(2979KB) ( 481 )   
参考文献 | 相关文章 | 多维度评价
随着水环境质量监测技术的高速发展,水环境质量数据的种类、数量均都呈现爆炸式增长。原位监测与遥感监测是水环境监测的重要数据来源,如何快速高效地理解海量的监测数据是人工智能技术在生态环境研究领域的热点。因此,以三峡库区境内的国家良好水体——长寿湖为例,研究改进WRCNN卷积神经网络算法模型直接对遥感影像中的水环境数据进行特征提取,结合原位在线监测数据对遥感影像数据进行标注,增加CNN网络的宽度,提高遥感数据的水环境特征提取的能力,消除函数选择的不确定性,减少参数确定带来的计算步骤和抑制过拟合的影响,实现对大尺度水环境遥感特征的利用。结果表明,改进WRCNN卷积神经网络算法模型能有效识别长寿湖富营养化表征指标叶绿素a的浓度,为库区水体富营养化监测提供高效手段。
基于多尺度双注意力的人体姿态估计方法研究
马皖宜, 张德平
计算机科学. 2022, 49 (11A): 220100057-5.  doi:10.11896/jsjkx.220100057
摘要 ( 295 )   PDF(2817KB) ( 376 )   
参考文献 | 相关文章 | 多维度评价
针对人体姿态估计中人体与背景区分度不高,基于HRNet网络的人体姿态估计中重要特征信息利用不完全的问题,利用通道与空间注意力机制,提出了一种基于多尺度双注意力(Multiscale Dual Attention,MDA)的人体姿态估计方法MDA-HRNet。该方法从通道域和空间域出发,分别设计了结合通道注意力的Ca-Neck,Ca-Block模块和结合空间注意力的Sa-Block模块,将其融入到高分辨率网络结构中,使网络能够重点关注图像中的人体区域。在Sa-Block模块中采用3×3和7×7的卷积核推导两种不同尺度的空间注意力映射,使网络区分人体特征和背景特征的能力更加显著,从而对人体及其关键点进行准确定位。该方法在MPII数据集上进行了实验验证,结果表明MDA-HRNet能有效地提高人体姿态估计关节点定位的准确度。
简单背景下基于OpenCV的静态手势识别
徐玥, 周辉
计算机科学. 2022, 49 (11A): 210800185-6.  doi:10.11896/jsjkx.210800185
摘要 ( 533 )   PDF(3000KB) ( 491 )   
参考文献 | 相关文章 | 多维度评价
手势识别是人机交互中极为重要的一项技术,具有较高的理论和实践探究价值。但由于手势所处背景的复杂性、个体的差异性等原因,手势识别成为一个富有挑战性的课题。因此迫切需要设计一种高效准确的手势识别算法,用以对目标手势进行有效的检测和识别。文中提出了一种改进的手势分割和手势特征提取方法,利用SVM分类器构建手势模型,对手势进行分类识别。在YCrCb颜色空间的基础上,融合OTSU阈值处理法选取阈值分割手势,提高分割的准确度;在边缘检测的基础上,使用椭圆傅里叶描述子拟合边缘,提取手势特征。实验结果表明,运用上述算法所建立的系统能够十分高效地提取手势特征信息,且在简单背景下对13种常见手势的平均识别准确率达到89.96%,能够基本满足对手势识别的精确度和稳定性的要求。
结合稳像补帧与VIBE算法的抖动视频前景目标提取方法
刘新富, 蒋慕蓉, 黄亚群, 张占伟, 周莹瑛
计算机科学. 2022, 49 (11A): 210800195-8.  doi:10.11896/jsjkx.210800195
摘要 ( 430 )   PDF(6642KB) ( 403 )   
参考文献 | 相关文章 | 多维度评价
在动态场景下进行目标检测与跟踪处理时,提取的前景目标往往会因受到背景抖动干扰而出现目标误判、轮廓不完整等问题,为此提出结合稳像与补帧、VIBE算法与连通域修正的抖动视频前景目标提取方法。首先利用ORB对相邻两帧图像进行特征匹配,使用RANSAC剔除误匹配点,以运动目标为中心调整图像边距,裁剪与修补不重合的部分,通过统计法求相邻两帧的偏移均值,完成视频稳像处理;其次利用稠密光流法计算相邻两帧图像的位移,通过位置重映射生成中间帧,实现视频补帧;然后将VIBE算法增加形态学处理与连通域修正,结合Canny算子进行边缘检测,增加目标轮廓的完整性;最后使用视频实例进行测试,与其他视频目标提取算法进行比较分析,精度、召回率至少提高10%,漏检率、错分率至少降低15%。实验结果表明,所提方法能有效去除抖动带来的影响,提取的目标完整性较高。
基于改进EfficientNetV2的有害垃圾图像分类方法
原慧琳, 刘军涛, 黄碧, 韩真, 冯宠
计算机科学. 2022, 49 (11A): 211100100-5.  doi:10.11896/jsjkx.211100100
摘要 ( 401 )   PDF(2894KB) ( 413 )   
参考文献 | 相关文章 | 多维度评价
随着工业的迅速发展,垃圾产生的数量呈爆炸式上升,使得垃圾处理成为一个世界性的难题。我国政府对环境的关切也逐渐加深,不断推出了各种垃圾分类政策以及法律法规以监督市民进行垃圾分类。垃圾处理特别是有害垃圾处理,如电子废弃物等,如果处理不当,会对环境产生恶劣影响。有害垃圾图像数据具有数据质量低、图像不清晰的特点,采集来自不同设备的图像样本又有明显差异,因此有害垃圾图像处理面临巨大挑战,同时有害废弃物分类结果关系到环境污染问题,且目前产出的垃圾数量巨大,要求具有较高的处理速度和准确度。文中提出了一种基于卷积神经网络和注意力机制的垃圾图像分类方法。该方法不需要对输入的图像进行手工提取特征,通过深度学习模型框架,弥补传统图像处理算法的不足,实现对有害垃圾准确、高效的分类,可以较好地识别多种类型的有害垃圾。经实验验证,所提方法在harmful-waste数据集上的准确率达到97.46%,相比其他算法模型,其模型训练时间更短,性能更优。利用深度学习的方法,部署自动化垃圾分类模型,对于环境保护有重要意义。
基于PCPNET的点云特征线提取算法
喻孟娟, 聂建辉
计算机科学. 2022, 49 (11A): 210800017-6.  doi:10.11896/jsjkx.210800017
摘要 ( 174 )   PDF(4104KB) ( 459 )   
参考文献 | 相关文章 | 多维度评价
特征线提取是几何模型处理的基础操作,其对三维模型的表达具有重要意义。文中基于PCPNET提出了一种对噪声和非均匀采样具有鲁棒性的曲率值和主曲率方向的计算方法,并在其基础上提出了一种特征线提取算法。该算法利用加权二次曲线拟合局部曲率分布,并通过判定在最大主曲率方向上与二次曲线极值点的距离来实现脊谷特征点的识别;最后,通过建立细化后潜在特征点的最小生成树(MST)实现特征点的连接,完成特征线的提取。实验结果表明,所提算法能够利用PCPNET对点云曲率和主曲率方向信息进行较为准确的估计,并且根据所提出的特征点识别方法可以弥补传统采用简单阈值截断导致平坦区域特征线线无法正常提取的缺陷,最终能准确、完整地从清洁点云和噪声点云中提取特征线。
基于动态金字塔和子空间注意力的图像超分辨率重建网络
何鹏浩, 余映, 徐超越
计算机科学. 2022, 49 (11A): 210900202-8.  doi:10.11896/jsjkx.210900202
摘要 ( 543 )   PDF(4660KB) ( 444 )   
参考文献 | 相关文章 | 多维度评价
针对现有单图像超分辨率卷积神经网络存在模型参数过多以及重建失真过大的问题,提出了一种基于动态金字塔结构与子空间注意力模块的轻量级单图像超分辨率网络模型。首先,所采用的动态多尺度金字塔特征组合模块的网络主体由动态卷积和金字塔分组卷积构成。其次,动态卷积可以根据不同的图像内容自适应地进行不同的卷积操作,从而对不同的图像提取出不同的特征;金字塔分组卷积不仅可以更好地提取多尺度图像特征信息,而且能够有效降低网络模型的参数量。最后,在网络模型末端采用子空间注意力模块,将图像的通道空间分为多个子空间,并为每个子空间学习不同的注意力图,这样不仅可以更好地捕获图像的跨通道相关信息,而且可以有效融合各子空间的图像特征信息。与现有主流算法相比,所提方法不仅具有更小的网络模型参数量,而且重建出的超分辨率图像在视觉效果和定量分析方面均能取得更好的表现。
基于注意力和视觉语义推理的枸杞虫害检索
韩会珍, 刘立波
计算机科学. 2022, 49 (11A): 211200087-6.  doi:10.11896/jsjkx.211200087
摘要 ( 186 )   PDF(3119KB) ( 360 )   
参考文献 | 相关文章 | 多维度评价
针对传统作物虫害检索模态单一的问题,将注意力与视觉语义推理相结合,对常见的17种枸杞虫害进行图文跨模态检索研究。首先利用Faster R-CNN+ResNet101实现注意力机制来提取枸杞虫害图像局部细粒度信息;接着,引入视觉语义推理,建立图像区域连接并采用图卷积网络(GCN)进行区域关系推理来增强区域表示;然后,进一步进行全局语义推理,选择具有判别性的特征,过滤掉不重要的内容,以捕获更多的关键语义信息;最后通过模态交互深入挖掘枸杞虫害图像和文本不同模态间的语义关联。在自建的枸杞虫害数据集上,采用平均准确率均值(MAP)作为评价指标对所提方法进行对比实验和消融实验。实验结果表明,图检文和文检图的平均MAP值达到了0.522,与8种主流方法相比提升了0.048~0.244,具有更好的检索效果。
基于多模态注意力的噪声事件分类模型
吴贺祥, 王中卿, 李培峰
计算机科学. 2022, 49 (11A): 211000161-7.  doi:10.11896/jsjkx.211000161
摘要 ( 371 )   PDF(2588KB) ( 455 )   
参考文献 | 相关文章 | 多维度评价
如今,社交媒体因其低成本、易于访问和快速传播而成为人们获取新闻资讯和了解实时事件的主要渠道之一。社交媒体为分析特定事件提供了包含文本和图像等多种模态的信息,这其中包含了大量无关事件和虚假信息。为此,结合文本-图像对来判断文本和图像是否提供了与特定事件相关的信息,从而筛选出与之无关的噪声事件。由于文本中的描述往往与相对应的图像中的情景相关联,因此提出了一个基于多模态注意力的结合文本和图像信息的方法进行事件分类。该方法能很好地关注到文本和图像中的重要信息并促进不同模态的信息交互。在CrisisMMD数据集上的实验结果表明,该方法优于6种强的基线方法,证明了所提多模态注意力模型能够有效融合不同模态的特征,得到更优的联合表示。
基于迁移学习和模型压缩的玉米病害识别方法
邓朋飞, 官铮, 王宇阳, 王学
计算机科学. 2022, 49 (11A): 211200009-6.  doi:10.11896/jsjkx.211200009
摘要 ( 641 )   PDF(3510KB) ( 320 )   
参考文献 | 相关文章 | 多维度评价
传统的图像识别方法在对玉米病害图像进行识别时准确率低,而卷积神经网络对图像识别有很好的效果,但其网络模型计算量大、参数量多,使其难以依托算力有限的移动端设备在小样本应用中推广使用。因此,以提高玉米病害图像的准确率、降低网络参数和模型大小为目的,提出了一种结合迁移学习和模型压缩的卷积神经网络用于玉米病害识别。为提高模型的泛化性,对数据集进行增强,构建基于迁移学习的卷积神经网络结构。通过迁移学习,利用在ImageNet上预先训练改进的VGG16-Inception网络模型,对常见玉米病害图像进行迁移识别。实验表明,在ImageNet数据集上,利用迁移学习对玉米病害图像的平均识别准确率达到93.38%。在迁移完成后,结合通道剪枝和知识蒸馏的方法对模型进行压缩,压缩后的模型再利用迁移学习进行玉米病害图像识别。实验表明:压缩后对玉米病害图像的平均识别准确率达到92.40%,准确率下降了0.98%,模型大小由73.90 MB压缩到9.45 MB,参数量减少了87.80%。本方法能够在小样本场景下确保识别准确率,并进一步实现模型轻量化。
基于改进YOLOv4-tiny的人脸关键点快速检测
付博闻, 李闯闯, 梁爱华
计算机科学. 2022, 49 (11A): 211100290-5.  doi:10.11896/jsjkx.211100290
摘要 ( 547 )   PDF(2666KB) ( 414 )   
参考文献 | 相关文章 | 多维度评价
人脸关键点检测作为人脸识别的重要环节,一直是计算机视觉领域的研究热点。为了满足高效轻量级的人脸关键点检测需求,提出了一种基于改进YOLOv4-tiny的人脸关键点快速检测算法。模型输入采用608*608*3的彩色图像,使用CSPDarknet53-tiny网络对输入图像进行主干特征提取,对提取到的特征进行上采样和特征融合,在特征融合之前添加注意力机制来提高检测准确度,同时对YOLOv4-tiny网络的损失函数进行调整,添加人脸关键点的损失计算,实现在人脸目标检测的同时对关键点进行标定定位。模型输出包括人脸标记框和人脸5个关键点。实验结果表明,相比其他网络的人脸关键点检测方法,所提模型在保证识别准确度的基础上,具有更高的识别效率和更低的配置要求,可以满足快速实时检测的需求,且更易部署在边缘设备或者移动设备上。
结合深度学习与改进的极限学习机的集成学习胸腺瘤CT图像预测方法
徐坤财, 冯宝, 陈业航, 刘昱, 周皓阳, 陈相猛
计算机科学. 2022, 49 (11A): 211200097-6.  doi:10.11896/jsjkx.211200097
摘要 ( 269 )   PDF(3580KB) ( 407 )   
参考文献 | 相关文章 | 多维度评价
针对胸腺瘤患者术前危险程度的预测问题,提出了结合深度学习与改进的极限学习机的集成学习计算机辅助分析方法。首先,将胸腺瘤CT图像通过小波多尺度变换到不同的尺度下并计算小波能量图,以增加图像信息的丰富性和多样性;其次,利用小波能量图训练卷积神经网络模型,并利用卷积核提取小波能量图中与任务相关的特异性深度特征;最后,基于改进的极限学习机为基分类器训练具有差异性的子模型并构建集成学习分类模型,以提高模型的稳定性和预测精度。多中心实验结果表明,所提方法有较好的泛化性能和稳定性,3个验证集的AUC分别为0.833,0.771,0.784。
基于TK能量算子和包络融合的心音分割算法
张欣, 孙静, 杨宏波, 潘家华, 郭涛, 王威廉
计算机科学. 2022, 49 (11A): 210900135-6.  doi:10.11896/jsjkx.210900135
摘要 ( 578 )   PDF(2964KB) ( 329 )   
参考文献 | 相关文章 | 多维度评价
为了更有效地对心音按成分进行分割,实验采用一种基于Teager-Kaise能量算子(Teager-Kaise Energy Operator,TKEO)以及多包络特征融合的心音分割算法。首先,利用多尺度小波软阈值对PCG信号进行去噪,然后进行TKEO运算,由于TKEO对瞬时能量变化极其敏感,可以有效提取包络峰值,得到TKEO信号。其次,对TKEO信号提取归一化香农能量包络和维奥拉积分包络,计算出两者包络与TKEO信号之间的皮尔逊相关系数,根据相关关系进行融合。然后,用区间搜索法对包络进行峰值搜索,并且对搜索结果的方差进行比较。最后,根据S1和S2的最大持续时间消除伪峰。用PhysioNet-2016数据集对所提算法进行测试,实验结果显示平均精确度为0.922,证实了该算法能较有效地对心音信号进行分割,为临床环境下采集的心音信号的特征提取与分析提供了新方法。
改进型FCOS目标检测算法
陈金令, 程茂凯, 徐紫涵
计算机科学. 2022, 49 (11A): 210900220-6.  doi:10.11896/jsjkx.210900220
摘要 ( 487 )   PDF(3434KB) ( 405 )   
参考文献 | 相关文章 | 多维度评价
针对经典无锚框目标检测算法FCOS( Fully Constitutional One-Stage Object Detection)难以充分提取目标特征,位置与内容信息结合能力不足,正负样本区分不充分导致性能减弱等问题,提出了一种改进型FCOS目标检测算法。该方法首先在ResNet50特征提取网络中加入可变形卷积模块与全局注意力模块,提高特征信息捕获能力;然后,将FPN特征金字塔与深层链路层相结合,构成多尺度特征融合模块,提升特征提取效果。最后,加入自适应划分正负样本模块,增强检验框的准确性以达到提高回归精度的效果,从而提升检测结果。为了测试算法的检测效果,分别使用了COCO数据集与VOC数据集进行实验。与原FCOS算法相比,所提算法在两个数据集上的平均精度分别提高了2.3%和1.8%,其中,对COCO数据集中的小目标检测的效果有明显提升。
基于SiameseFC的双模板异步更新追踪方法
马汉达, 殷达
计算机科学. 2022, 49 (11A): 211200133-7.  doi:10.11896/jsjkx.211200133
摘要 ( 154 )   PDF(3024KB) ( 311 )   
参考文献 | 相关文章 | 多维度评价
全卷积孪生神经网络SiameseFC有着追踪速度快、精度高等优势,但在较为复杂的场景下仍然存在一定的缺陷,并且模板不更新的追踪模式也会在快速变化下的场景中出现较大的误差。因此,提出了一种基于全卷积孪生神经网络的双模板异步更新的追踪算法。首先基于VGG-16网络提取深层与浅层两种特征,分别使用两套对应的模板,两套模板独立且异步地更新,从而节约计算资源。然后对于模板的更新,同时考虑初始模板、前一次追踪所用模板,以及前一帧追踪结果提取的模板,并且使用了基于APCE的判断机制,更新时动态地分配三者的比例。所提算法在OTB100的基准测试结果上优于SiamRPN和SiamDW等主流算法,成功率与精确度均提升了约4%~5%,并且速度达到了44 fps左右,可以满足实时追踪的要求。
基于心电信号的先心病肺动脉高压识别分类研究
韩宇森, 杨宏波, 孙静, 潘家华, 王威廉
计算机科学. 2022, 49 (11A): 210900144-8.  doi:10.11896/jsjkx.210900144
摘要 ( 307 )   PDF(5169KB) ( 385 )   
参考文献 | 相关文章 | 多维度评价
先天性心脏病相关性肺动脉高压(Pulmonary Arterial Hypertension,PAH)在临床上有着很高的发病率、致残率和病死率,其确诊主要采用右心导管测量平均肺动脉压,这种方法有创且操作性要求高,不便在筛查中采用,因此探索一种非介入式CHD-PAH智能辅助诊断方案意义重大。在先心病的基础上对CHD-PAH进行研究,从分析ECG入手,通过预处理、心拍分割、波形检测、特征提取、数据扩充、分类识别等手段对CHD-PAH进行建模预测。在Christov_segmenter算法基础上,利用差分阈值和局部峰值改进,检测QRS波、P波和T波,最后提取基于时间和幅度的双模态特征。为了拟合出最佳的分类模型,实验采用了支持向量机、随机森林及K邻近等分类器,并设计基于T分布的麻雀搜索算法改进支持向量机。实验共使用460段时长为20 s的1导联ECG信号进行训练和测试。实验结果表明,所提算法优化的支持向量机模型预测准确率、特异度和灵敏度分别可达99.76%,99.80%,99.73%。
基于注意力机制与混合监督学习的钢轨表面缺陷检测模型
赵晨阳, 张辉, 廖德, 李晨
计算机科学. 2022, 49 (11A): 210800241-6.  doi:10.11896/jsjkx.210800241
摘要 ( 445 )   PDF(4781KB) ( 393 )   
参考文献 | 相关文章 | 多维度评价
钢轨表面缺陷检测是保障铁路安全运行的重要一环,通过分析钢轨表面缺陷检测的必要性和现有检测方法的不足,提出了一种基于注意力机制与混合监督学习的钢轨表面缺陷检测模型。针对现有模型参数量大、部署成本高的问题,提出了端到端的钢轨缺陷检测模型,利用注意力模块引导特征丛的生成,提高缺陷检测速度,降低模型部署成本;针对实际应用中存在的异常样本少、标注成本高等问题,研究粗糙标签与混合监督对模型的影响,对像素级标签进行数据处理,使标签的不同区域获得不同的关注,降低模型对标签的依赖性。最终在实际钢轨数据集上进行实验验证,结果表明在图像级标签样本中加入少量像素级标签样本的混合监督学习可获得与全监督学习相当的性能,模型的分类准确率达99.7%。
有监督相似性保持的深度二阶哈希方法
张建新, 吴悦, 张强, 魏小鹏
计算机科学. 2022, 49 (11A): 210900021-8.  doi:10.11896/jsjkx.210900021
摘要 ( 380 )   PDF(4705KB) ( 355 )   
参考文献 | 相关文章 | 多维度评价
近年来深度哈希方法因其存储效率高和查询速度快的优势在大规模图像检索领域受到了广泛关注。为改善深度成对有监督哈希方法在图像检索上的性能,从提高深度哈希获取图像特征的全局性和同类样本相似性角度出发,提出了一种有监督相似性保持的深度二阶哈希方法。该方法采用成对样本图像进行特征建模,并利用协方差估计来捕获样本图像的深度二阶信息,以获取具有良好全局表达能力的深度二阶哈希码;在此基础上,借鉴类哈希近似二值化来解决哈希映射过程中的非凸性问题,以更好地避免量化误差,同时基于多损失函数集成思想构建类别监督和相似性保持的联合约束,进而采用交替迭代的优化方式实现网络的端到端训练,最终确定样本图像的最优哈希码。在3个通用数据集上进行了广泛的实验,结果有效表明了所提出有监督相似性保持的深度二阶哈希方法的有效性。
MIF-CNNIF:一种基于CNN的交叉特征的多分类图像数据框架
王盼红, 朱昌明
计算机科学. 2022, 49 (11A): 210800267-8.  doi:10.11896/jsjkx.210800267
摘要 ( 167 )   PDF(3241KB) ( 297 )   
参考文献 | 相关文章 | 多维度评价
近年来,图像多分类任务和深度学习受到越来越多学者的重视,基于卷积神经网络(Convolutional Neural Network,CNN)的多分类图像数据框架也得到了广泛应用。传统的基于卷积神经网络的多分类图像数据学习(MIF-CNN)普遍存在图像处理复杂、特征维数大、时间复杂度高等问题。针对这一问题,提出了一种基于CNN的交叉特征的多分类图像数据框架(MIF-CNNIF)。MIF-CNNIF是一种基于多种特征选择算法得到相交特征并以此交叉特征代替原特征集处理图像多分类任务的框架。在10个多类图像数据集上进行了丰富的对比实验,结果验证了MIF-CNNIF的有效性。MIF-CNNIF的贡献在于:1)使用预先训练好的CNN模型,避免了设置过多参数;2)与MIF-CNN相比,有效降低了特征维度和时间复杂度;3)具有比MIF-CNN更好的平均分类准确率;4)在多分类图像数据集上成功验证了组合特征算法的有效性。
基于深度神经网络的块压缩感知图像重构
潘泽民, 覃亚丽, 郑欢, 王荣芳, 任宏亮
计算机科学. 2022, 49 (11A): 210900118-9.  doi:10.11896/jsjkx.210900118
摘要 ( 666 )   PDF(6444KB) ( 386 )   
参考文献 | 相关文章 | 多维度评价
压缩感知(CS)是根据由信号的线性投影获得的少量测量值有效地重建信号的一种信号处理框架,用低的采样率重构出高质量图像,是基于CS的计算成像实用化的持续挑战。图像重构模型的改进多是在信号稀疏约束下加入更多稀疏先验,其迭代优化过程复杂且耗时。神经网络作为深度学习的应用模型,可实现对任意复杂函数的逼近,为图像高质量实时重构提供了新的技术路线。文中用深度神经网络(DNN)进行重构,避免了CS繁杂的算法求解过程,且通过分块处理缩短了重构时间以及减少了网络节点数目,通过对上万幅不同类型的图像进行训练以得到DNN模型,再将分块CS的测量和DNN非线性求解联合来实现高效重构。结果表明,所提方法与6种不同的重构方法相比,图像的峰值信噪比(PSNR)和结构相似度(SSIM)都有不同程度的提高。与先进的CS算法相比,不仅重构质量能与之媲美,而且DNN极大减少了时间复杂度,重构时间在3s内。当采样率低至0.01时,该方法仍能较清晰地重构图像而其他算法难以恢复。当采样率为0.1时,该方法与先进的残差网络方法相比,PSNR最大(小)增益达到6.7(1.97)dB,SSIM最大(小)增益达到0.354(0.122)。
面向算法模型的语音数据集质量评估方法研究
李荪, 曹峰, 刘姿杉
计算机科学. 2022, 49 (11A): 210800246-6.  doi:10.11896/jsjkx.210800246
摘要 ( 382 )   PDF(4253KB) ( 398 )   
参考文献 | 相关文章 | 多维度评价
随着智能语音技术和产品应用大规模的成熟落地,对高质量语音数据集的需求与日俱增。目前,针对结构化数据的质量评估方法有一定的研究,但尚未形成面向非结构化的语音数据集质量评估标准。通过研究语音算法模型的构建原理,分析语音数据集的建设需求,建设统一的语音数据集质量评估体系。该评估体系从4个维度对面向算法模型训练的语音数据集进行质量评价,包括广度覆盖性、选集区分性、领域深入性和数据完整性。通过提出具体的语音数据集质量评估指标、计算方法和评估步骤等,对车载应用领域语音数据集的质量进行评估并对结果进行分析,对评估语音数据集质量、促进数据集建设提供参考。考虑了语音数据集构建的多样化适用能力、隐私问题、效率要求、自动化需求等,提出了构建高质量的语音数据集的未来发展建议。
基于t-SVD的结构保持多视图子空间聚类
张华伟, 陆新东, 朱小明, 孙军涛
计算机科学. 2022, 49 (11A): 210800215-6.  doi:10.11896/jsjkx.210800215
摘要 ( 459 )   PDF(2521KB) ( 375 )   
参考文献 | 相关文章 | 多维度评价
针对基于张量的多视图子空间聚类算法不能很好地保持样本之间的流形几何结构和多视图之间相似性的缺点,提出了一种结构保持的t-SVD多视图子空间聚类算法。首先将重构系数作为数据构造描述流形结构的邻接矩阵,其次通过图正则限制多视图数据的重构系数,然后利用各个视图的重构系数计算描述视图之间关系的相似矩阵,最后通过交替优化的方式来分别优化邻接矩阵及相似矩阵和多视图数据的重构系数,直至收敛。在3个数据库上分别进行了聚类实验,准确率分别达到了97.25%,96.97%,100%。实验结果表明,所提算法在聚类任务上具有较高的准确率。
基于大型场景下的多相机标定方法
廖德, 张辉, 赵晨阳
计算机科学. 2022, 49 (11A): 211200054-6.  doi:10.11896/jsjkx.211200054
摘要 ( 598 )   PDF(3932KB) ( 467 )   
参考文献 | 相关文章 | 多维度评价
在计算机视觉领域,在实现大型目标物体的检测定位、尺寸估计等系列测量时,需要用到多个相机传感器获取物体的三维信息。但在复杂环境下,会出现相机之间存在非重叠视场情况而无法进行有效视觉测量的问题。为了解决非重叠视场下多相机的标定问题,提出了一种无需改变机械结构,且在带约束条件下的多相机标定方法。首先将相机安装在相互固定的位置,并确保相机之间不存在振动等情况,通过建立多相机优化数学模型以及相机同时采集多组相机对应标定板的位姿参数关系,采用SVRG优化算法实现对相机坐标系之间的位姿参数优化,进而求得多相机之间的位姿矩阵。最后利用相机之间的坐标系变换矩阵,求得对应目标之间的相对位姿参数作为评估精度指标。结合实际大型盾构机进行仿真实验与实际测试,结果表明,所提方法抗干扰性较强,优化效果稳定,且在实际应用中能够达到毫米级别的准确度。
小视场星敏感器的三角形改进算法
陆涵, 林宝军, 张永合, 丁国鹏, 王新宇
计算机科学. 2022, 49 (11A): 211000223-5.  doi:10.11896/jsjkx.211000223
摘要 ( 226 )   PDF(2321KB) ( 432 )   
参考文献 | 相关文章 | 多维度评价
在科学探测、卫星高精度定位等领域中,星敏感器需要快速获得姿态信息,为了提高精度,通常需要提高角分辨率,降低视场,以更高的星等作为参考。星图识别算法是星敏感器快速获得姿态信息的关键,当传统的三角形算法面对星数较少、暗星占比更大的情况时,识别精度会迅速下降至70%~80%,识别精度有待提高。对现有星敏感器星图识别算法进行研究后,综合主流星图识别算法的优缺点,提出了一种基于三角形角距匹配的改进算法,结合星等区间差特征,在增加特征维数的同时引入第四颗星用于验证,以此减少冗余匹配。仿真实验结果表明,该方法在识别速度不低于经典三角形改进算法的同时,提高了识别率,达到了98.4%。在引入位置噪声和星等噪声的情况下,仍然保持93%以上的识别率,具有较强的鲁棒性。
基于YOLOv3与改进VGGNet的车辆多标签实时识别算法
顾曦龙, 宫宁生, 胡乾生
计算机科学. 2022, 49 (11A): 210600142-7.  doi:10.11896/jsjkx.210600142
摘要 ( 602 )   PDF(2663KB) ( 379 )   
参考文献 | 相关文章 | 多维度评价
为了能快速、有效地识别视频中的车辆信息,文中结合YOLOv3算法和CNN算法的优点,设计了一种能实时识别车辆多标签信息的算法。首先,利用具有较高识别速度和准确率的YOLOv3实现对视频流中车辆的实时监测和定位。在获得车辆的位置信息后,再将车辆信息传入经过简化与优化的类VGGNet多标签分类网络中,对车辆进行多标签标识。最后将标签信息输出至视频流,得到对视频中车辆的实时多标签识别。文中训练与测试数据集来源为KITTI数据集和通过Bing Image Search API获取的多标签数据集。实验结果证明,所提方法在KITTI数据集上的mAP达到了91.27,多标签平均准确率达到80%以上,视频帧率达到35 fps,在保证实时性的基础上取得了较好的车辆识别和多标签分类效果。
基于多尺度特征融合和双重注意力机制的肝脏CT图像分割
黄扬林, 胡凯, 郭建强, 彭诚
计算机科学. 2022, 49 (11A): 210800162-9.  doi:10.11896/jsjkx.210800162
摘要 ( 407 )   PDF(3598KB) ( 401 )   
参考文献 | 相关文章 | 多维度评价
肝脏疾病是医学上最常见的疾病之一,对其进行精确的分割是辅助肝脏疾病诊断及手术规划的必要步骤。然而,由于肝脏CT图像的复杂性,肝脏分割仍然是一个极具挑战性的问题。以往的研究大多简单地使用拼接或求和操作来融合不同语义,导致无法充分利用其互补性。针对这一问题,提出了一种基于多尺度特征融合和双重注意力机制的网络模型MD-AUNet。首先利用分层多尺度注意力下采样模块中分层级的双重注意力机制有效地融合不同尺度特征信息,提取富含空间信息的特征表示。然后通过全局注意力上采样模块获取高层特征的全局上下文用于对低层特征信息加权,从而选择更为精确的空间信息。同时在网络训练时采用深层监督策略,以学习不同解码层的层次表示。最后提出了一种简洁有效的后处理方法,用于进一步细化MD-AUNet粗分割结果。在医院采集的肝脏数据集(经专家手动标注)上的实验结果表明,所提算法在主观视觉感受和客观评价指标方面均优于其他现有肝脏分割算法,其平均像素精度、平均交并比和Dice相似系数分别为97.6%,95.4%和95.5%。
基于双流网络结构的深度伪造人脸的检测方法
李颖, 边山, 王春桃, 黄琼
计算机科学. 2022, 49 (11A): 220100106-9.  doi:10.11896/jsjkx.220100106
摘要 ( 393 )   PDF(3463KB) ( 495 )   
参考文献 | 相关文章 | 多维度评价
深度伪造技术(Deepfake) 是一种基于生成对抗网络(Generative Adversarial Networks,GAN)的深度网络模型,可以利用源和目标人脸生成高度逼真且难以鉴别的人脸视频。如果不法分子借此技术制造虚假视频并在互联网上传播谣言,将会侵犯个人肖像权,造成不良的社会影响,甚至引发严重的司法纠纷。面对深度伪造技术带来的严重威胁,国内外众多研究机构高度关注深度伪造检测技术的研究并提出了若干检测方法。现有的检测方法在高质量视频上可以取得良好的检测效果,然而日常应用中的视频通常会通过社交软件从而被压缩为低质量视频,在此类低质量数据集中,现有的大多数伪造人脸检测方法的准确率有着明显的下降,并且现有方法在跨库情况下的检测性能也不够理想。文中针对现有工作的局限性,提出了一种注意力机制下基于Xception 模型的双流网络结构。该网络结构中包含了使用多重注意力机制的RGB 分支,以及用于捕捉低质量视频伪影效应的频率域分支。通过研究发现,真实图像与伪造图像之间的微小差别更多地集中在局部位置,因此多重注意力机制下的RGB 分支将使得模型关注人脸的不同区域,并在注意力图的指导下得到由低层纹理特征及高层语义特征聚合的全局特征。频率域分支引入离散余弦变换作为频域变换手段,为图像提供与RGB 分支互补的特征表示,此分支能够反映细微的伪造痕迹或者压缩误差。为了验证该网络结构的有效性,所提算法在FaceForensics++,Celeb-DF 以及DFDC 3个公开数据集上进行了大量对比实验。实验结果表明,所提算法在低质量视频集上的性能优于现有的检测算法,并且所提模型在跨库场景下具有更好的检测性能,即验证了文中提出的注意力机制下的RGB和频率域双流特征的结合可以提高检测模型在低质量视频集及跨库情形下的鲁棒性。
基于点云数据的交通环境下单阶段三维目标检测方法
车爱博, 张辉, 李晨, 王耀南
计算机科学. 2022, 49 (11A): 210900079-6.  doi:10.11896/jsjkx.210900079
摘要 ( 410 )   PDF(3342KB) ( 371 )   
参考文献 | 相关文章 | 多维度评价
文中在CIA-SSD单阶段三维目标检测模型的基础上,将模型中空间语义特征融合方式进行改进,通过一种基于注意力机制的多通道融合模块对两特征进行融合,提出了单阶段检测方法TFAF-SSD(Two-Feature Attentional Fusion Single-Stage object Detector),该方法主要由流形稀疏卷积网络提取点云的稀疏特征后,再由空间语义卷积层分别提取检测对象的空间语义特征,对融合后的输出特征进行预测,最后通过检测头输出最终的检测框。同时,文中还运用了不同于以往方法的数据增强方法,增强了模型的泛化性能,达到了提升检测精度的效果。在KITTI 3D公开数据集上进行了验证,在测试集中汽车检测方面得到了中等检测难度AP值为83.77%的检测结果,相比CIA-SSD模型的80.28%,所提方法提升了3.49%。
基于改进Transformer的连续手语识别方法
王帅, 张淑军, 叶康, 郭淇
计算机科学. 2022, 49 (11A): 211200198-6.  doi:10.11896/jsjkx.211200198
摘要 ( 436 )   PDF(1457KB) ( 568 )   
参考文献 | 相关文章 | 多维度评价
连续手语识别是一项具有挑战性的任务,当前大多数模型忽略了对长序列的整体建模能力,导致对较长手语视频的识别和翻译准确率较低。Transformer模型独特的编解码结构可用于手语识别,但其位置编码方式以及多头自注意力机制仍有待改善。因此,文中提出了一种基于改进Transformer模型的连续手语识别方法,通过多处复用的带参数位置编码对连续手语句子中的每个词向量进行多次循环计算,准确掌握各个词之间的位置信息;在注意力模块中添加可学习的记忆键值对形成持久记忆模块,通过线性高维映射等比例扩大注意力头数与嵌入维度,最大程度地发挥Transformer模型的多头注意力机制对较长手语序列的整体建模能力,深入挖掘视频内部各帧中的关键信息。所提方法在最具权威的连续手语数据集PHOENIX-Weather2014[1]和PHOENIX-Weather2014-T[2]上取得了有竞争力的识别结果。
基于面部视频的非接触式心率检测方法研究
曾梓琳, 胡志刚, 尚鹏, 王新征, 付东辽
计算机科学. 2022, 49 (11A): 211000182-6.  doi:10.11896/jsjkx.211000182
摘要 ( 267 )   PDF(3134KB) ( 520 )   
参考文献 | 相关文章 | 多维度评价
基于视频的非接触式面部心率检测易受到环境光和运动伪迹的干扰,检测心率结果的准确度低。针对上述问题,提出了一种集合经典模态分解(Ensemble Empirical Mode Decomposition,EEMD)和标准欧几里得距离相结合的自适应阈值化去噪方法,降低了外界干扰,提高了准确度。首先从视频录制的RGB图像模型中选取绿色(G)通道像素均值作为PPG(Photo Plethysmo Graphy)信号,然后用滤波器对信号进行预处理,消除心率范围外的信号;然后将EEMD与标准欧几里得距离相结合,对固有模态函数进行阈值化处理并重构;最后用傅里叶变换进行功率谱分析来计算心率值。实验结果表明,与基于小波变换和基于自适应集合经典模态分解的方法相比,所提方法在非接触式面部心率检测去噪中有更好的稳定性和准确性,提高了心率检测的鲁棒性,适用于日常非接触式实时心率监测。
基于改进GMS特征匹配算法的浮选泡沫移动速度特征提取
刘惠中, 余华富, 彭志龙
计算机科学. 2022, 49 (11A): 211000064-6.  doi:10.11896/jsjkx.211000064
摘要 ( 145 )   PDF(5852KB) ( 390 )   
参考文献 | 相关文章 | 多维度评价
矿物浮选过程中,浮选泡沫移动速度与浮选过程的控制之间存在着较大的关联性,如能实时准确地获取泡沫移动速度等动态特征可以为浮选过程的液位、加药量、充气量等控制参数的优化调整提供依据。为了有效地获取浮选泡沫的移动速度,文中提出了一种基于改进GMS特征匹配算法的浮选泡沫移动速度特征提取方法。首先采用ORB算法提取并描述泡沫的特征点,再利用GMS特征匹配算法完成特征点对的快速匹配,在以上基础上再利用RANSAC算法对特征匹配结果中存在的误匹配点进行剔除,最后通过计算泡沫特征点的位移进而得到泡沫移动速度。经过对采集到的工业图像数据进行应用测试表明,所提算法不但解决了传统算法在浮选泡沫图像特征提取中存在误匹配点多的问题,还有效提升了浮选泡沫特征提取的效率和稳定性。
基于改进的SLIC和聚类算法结合的高分辨率遥感海冰图像分割
祁颖, 柴艳妹
计算机科学. 2022, 49 (11A): 211200100-6.  doi:10.11896/jsjkx.211200100
摘要 ( 496 )   PDF(3763KB) ( 379 )   
参考文献 | 相关文章 | 多维度评价
海冰分割是遥感图像处理领域的重要研究方向之一。由于高分辨率遥感海冰图像较大,采用SLIC构建超像素块,可为后续的再分割节省时间。SLIC虽能产生形状规则均匀的超像素块,但该算法的初始种子点对噪声敏感、分割精度与运行速度欠佳。因此,提出了一种基于改进的SLIC与聚类算法相结合的高分辨率遥感海冰图像分割算法。针对噪声敏感问题,首先采用各向异性扩散滤波进行图像的预处理,在保证图像完整性的同时有效降噪;其次,用L-p范数对传统SLIC算法中的欧氏距离度量进行扩展,以获取更优分割效果;最后,在SLIC超像素块的基础上分别采用DBSCAN和K-Means聚类算法进行精确分割,通过性能对比得到最优结果。实验结果表明,改进后的SLIC结合K-Means的分割方法的性能优于MRF算法及SLIC与DBSCAN相结合的算法,取得了较为理想的分割结果。
基于少样本的太阳射电爆发事件检测研究
郭军成, 万刚, 胡欣杰, 王帅, 严发宝
计算机科学. 2022, 49 (11A): 210900198-7.  doi:10.11896/jsjkx.210900198
摘要 ( 336 )   PDF(4433KB) ( 386 )   
参考文献 | 相关文章 | 多维度评价
太阳射电爆发事件与多种太阳活动紧密相关,对不同类型的射电爆发事件进行研究有助于提高对太阳活动物理机制的理解,加强对空间天气的判读能力。为解决以往传统射电爆发事件检测方法存在的样本数据量小、检测速度慢、定位准确度低、人为因素干扰大等问题,文中提出采用基于深度学习的少样本目标检测方法对太阳射电频谱图中的不同射电爆发事件进行自动识别和定位。首先,由于目前缺乏公开的射电爆发事件检测数据集,基于美国绿岸太阳射电爆发频谱仪所观测到的射电频谱数据,构建了具有3种爆发类型、共745张图像的少样本目标检测数据集;然后,利用基于迁移学习的少样本学习方法解决了射电爆发事件检测数据集样本量少的问题。实验结果表明,所提方法具有可行性和有效性。
基于时空图卷积网络的语音驱动个人风格手势生成方法
张斌, 刘长红, 曾胜, 揭安全
计算机科学. 2022, 49 (11A): 210900094-5.  doi:10.11896/jsjkx.210900094
摘要 ( 264 )   PDF(2611KB) ( 369 )   
参考文献 | 相关文章 | 多维度评价
人们在发言时的手势动作往往具有自己独特的个人风格,研究者们提出了基于生成式对抗网络的语音驱动个人风格手势生成的方法,然而所生成的动作不自然,存在时序上动作不连贯的问题。针对该问题,文中提出了一种基于时空图卷积网络的语音驱动个人风格手势生成的方法,引入以时空图卷积网络为基础的时序动态性判别器,构建手势动作关节点之间空间和时间上的结构关系,并通过时空图卷积网络捕获手势动作关节点在空间上的相关性和提取时序上的动态性特征,使所生成的手势动作保持时序上的连贯性,以更符合真实手势的行为和结构。在Ginosar等构建的语音手势数据集上进行实验验证,与相关方法相比,正确关键点百分比指标提高了2%~5%,所生成的手势动作更自然。
融合ViT卷积神经网络的木板表面缺陷识别
郭文龙, 刘芳华, 吴万毅, 李冲, 肖鹏, 刘朝
计算机科学. 2022, 49 (11A): 211100090-6.  doi:10.11896/jsjkx.211100090
摘要 ( 305 )   PDF(3382KB) ( 375 )   
参考文献 | 相关文章 | 多维度评价
由于需要通过木板表面缺陷对木板分级,而人工检测存在一定问题。为解决木板表面缺陷识别问题,提出一种融合ViT的卷积神经网络模型,用于提高缺陷识别的准确率。为此,收集裂缝、虫眼、节子和纹理4种木板表面缺陷图片,其中裂缝和虫眼图片数量远少于节子和纹理。为解决模型训练时样本不均衡问题,利用ProGAN对裂缝和虫眼图片进行训练并生成同类型缺陷图片,以增加其数量,使4种图片数量保持平衡,并在实验前对缺陷图片进行数据增强并添加椒盐噪声,整理得到所需图片数据集。基于融合ViT的卷积神经网络模型,利用数据集验证两种不同激活函数的模型,结果表明使用GELU作为激活函数的模型性能更高。并测试不同的transformer深度时模型的性能,得到的模型缺陷识别的最高准确率可达到98.54%。实验结果表明,融合ViT的卷积神经网络模型是可行的,为木板表面缺陷自动检测提供了新思路。
多字体印刷体维-哈-柯文关键词图像识别
沙尔旦尔·帕尔哈提, 阿布都热合曼·卡的尔, 阿力木江·亚森
计算机科学. 2022, 49 (11A): 211100038-6.  doi:10.11896/jsjkx.211100038
摘要 ( 343 )   PDF(3348KB) ( 313 )   
参考文献 | 相关文章 | 多维度评价
针对印刷体维吾尔文字识别中字体单一、识别数据规模小、识别领域不区分以及哈萨克和柯尔克孜文字识别研究缺乏等问题,提出了基于卷积神经网络(CNN)的多字体印刷体维吾尔、哈萨克和柯尔克孜(以下简称维-哈-柯)文关键词识别方法。首先,针对维-哈-柯文关键词图像语料库缺乏的问题,基于图像合成技术构建包括32种字体的维-哈-柯文关键词图像数据集。然后,使用数据扩充技术对数据集的图像进行不同程度的加噪、旋转和失真操作,来进一步体现数据集的自然场景特征。最后,使用多层CNN网络在该数据集上训练图像识别模型,均得到了96.5%以上的识别准确率,并在包括3种常用字体的实际印刷体图像识别任务中得到了96%左右的准确率,该方法减少了预处理过程,并胜过了以往机器学习框架下的其他识别方法。实验结果表明,在CNN网络框架下基于合成图像和数据扩充技术的识别方法能够较好地实现多字体印刷体维-哈-柯文图像识别任务。
基于LFBank与FBank混合特征的声纹识别研究
崔琳, 王芷悦
计算机科学. 2022, 49 (11A): 211000194-5.  doi:10.11896/jsjkx.211000194
摘要 ( 414 )   PDF(2144KB) ( 368 )   
参考文献 | 相关文章 | 多维度评价
语音特征提取是声纹识别过程中的重要步骤,对于声音频率的分布男性与女性差距较大,但现有的特征提取算法并没有针对不同性别声音频率特性做出相应改进。针对上述问题,提出了为女性声纹识别所设计的语音特征提取算法LFBank,将线性滤波器组用于特征提取过程,利用其线性分布的特点弥补传统梅尔滤波器组提取高频区域信息时的不足。另一方面,为了突破单一性别局限,拓宽应用场景,综合线性滤波器组与梅尔滤波器组的优势,将LFBank与FBank特征结合得到混合特征向量进行声纹识别。将LFBank和常用特征FBank与MFCC进行实验对比,实验结果表明,基于线性滤波器组的特征向量在识别女性声音时更有优势。对于混合特征而言,在与单一特征的对比实验中,混合特征能够达到比单一特征更好的识别效果,具有更广泛的应用场景。
基于注意力机制的手写体数字识别
李波燕, 张勇, 袁德荣, 熊堂堂, 何浪
计算机科学. 2022, 49 (11A): 211100009-5.  doi:10.11896/jsjkx.211100009
摘要 ( 427 )   PDF(2900KB) ( 433 )   
参考文献 | 相关文章 | 多维度评价
作为模式识别的重要分支,手写体数字识别正置于前所未有的热潮之下,卷积神经网络也被广泛应用于相关研究。针对手写体数字识别在训练过程中容易出现梯度爆炸和梯度弥散等现象导致图像识别准确率低的问题,提出了一种嵌入CBAM(Convolutional Block Attention Module)注意力模块的模型,用于手写体数字识别。在卷积神经网络中嵌入CBAM注意力模块,分别从通道和空间维度上筛选出有效特征,抑制无关特征,增强特征的表达能力,提高模型的识别准确率。为进一步提高网络识别准确率,在整个网络架构中充分应用BN(Batch Normalization)算法,加快模型收敛,从而加强模型的抗过拟合能力。在MNIST数据集上进行实验,结果表明,嵌入CBAM注意力模块网络的总体识别准确率达到了99.87%,与一些传统的卷积神经网络模型相比,识别准确率有显著提升。
基于多模态表示学习的情感分析框架
胡新荣, 陈志恒, 刘军平, 彭涛, 叶鹏, 朱强
计算机科学. 2022, 49 (11A): 210900107-6.  doi:10.11896/jsjkx.210900107
摘要 ( 416 )   PDF(2371KB) ( 452 )   
参考文献 | 相关文章 | 多维度评价
在多模态表示对整体损失的学习过程中,重构损失对模型的依赖性相对较小,导致隐含表示无法有效捕捉它们各自模态的细节。文中提出了一个基于多模态表示学习的多子空间情感分析框架。首先将每个模态投射到模态不变和模态特定两种不同的话语表示中,在模态不变表示中构建主共享子空间以及帮助该子空间减少模态差距的辅助共享子空间,在模态特定表示中构建私有子空间以捕获每个模态独有的特征,将所有子空间中的隐藏向量作为解码函数的输入并重构模态向量,以实现对重构损失的优化。然后,在融合阶段对每个模态表示执行基于Transformer的自注意力,使每个表示能从对整体情感取向具有协同作用的其他跨模态表示中获取潜在信息。最后,通过串联生成联合向量并利用全连接层生成任务预测。在两个公开数据集MOSI和MOSEI上的实验结果表明,该框架在大多数评价指标上都优于基线模型。
R-YOLOv5:自动切割的旋转的文本检测模型
冉煜, 张莉
计算机科学. 2022, 49 (11A): 210900185-6.  doi:10.11896/jsjkx.210900185
摘要 ( 256 )   PDF(3223KB) ( 373 )   
参考文献 | 相关文章 | 多维度评价
YOLOv5模型是目前文本检测较好的模型之一,针对文本目标长度不一,文本轮廓难以精准检测以及受自然场景中文字倾斜、光影的影响文本较难检测的问题,提出了R-YOLOv5(Rotated-YOLOv5)文本检测模型。首先融入基于仿射算法的文本分割模型,将图片的文本区域等比例切割为多个单字符块,解决文本没有闭合轮廓导致的YOLOv5模型锚定框拟合效果不佳的问题;然后使用旋转卷积层、旋转池化层、改进锚定框,提出了加强角度学习的RIoU(Rotated Intersection over Union)损失函数,实现了文本旋转倾斜特征的提取。在ICDAR2019-LSVT上对原模型与改进后的模型进行实验,实验结果显示,R-YOLOv5检测效果有较明显的提升,但由于模型层数加深,训练速率与检测速率相比原模型有小幅降低。相比其他模型,由于YOLOv5自身的优点,R-YOLOv5的检测效果与检测速度均远好于其他模型。
融合多层次视觉信息的人物交互动作识别
李宝珍, 张晋, 王宝录, 余平
计算机科学. 2022, 49 (11A): 220700012-8.  doi:10.11896/jsjkx.220700012
摘要 ( 466 )   PDF(3879KB) ( 413 )   
参考文献 | 相关文章 | 多维度评价
基于计算机视觉的人体动作识别技术在视频监控、智能驾驶、人机交互、多媒体内容审核等领域均有着广阔的应用前景,其中人体动作中的人物交互是动作识别的核心内容之一。现有的人物交互动作识别模型对人物关系的提取仅仅停留在表层视觉特征之上,并未充分挖掘人体关键区域以及人物之间的深层语义关系。针对此问题,文中提出了层次化的图神经网络模型(HGNN)对人物交互动作建模。HGNN模型从局部到整体显式地对人体关键区域以及人和物构成的场景图进行建模,并利用注意力图池化机制(AttPool)剔除层次图中冗余的信息和噪声,再通过图卷积网络提取图结点之间的深层语义关系,对卷积网络提取的特征进行聚合与优化,从而得到反映人物交互动作本质的特征表示。另外,HGNN模型在中层图进行的临时监督分类也能够约束网络更好地学习到交互动作的人体模式,避免网络对交互对象产生“偏见”。最后,针对HGNN模型,设计了多任务损失函数,用于有效进行模型训练。为了验证HGNN模型的有效性,在公开的大型数据集V-COCO上进行了广泛的实验,结果均显示所提出的HGNN模型对常见的人物交互动作具有广泛的适应性和鲁棒性,精度(mAP)超过了现有的基于图神经网络的模型,同时领先于大部分最新的多流卷积模型。
信息安全
对抗性网络流量的生成与应用综述
王珏, 芦斌, 祝跃飞
计算机科学. 2022, 49 (11A): 211000039-11.  doi:10.11896/jsjkx.211000039
摘要 ( 321 )   PDF(2327KB) ( 625 )   
参考文献 | 相关文章 | 多维度评价
人工智能技术的井喷式发展正在深刻影响着网络空间安全的战略格局,在入侵检测领域显示出了巨大潜力。最近的研究发现,机器学习模型有着严重的脆弱性,针对该脆弱性衍生的对抗样本通过在原始样本上添加一些轻微扰动就可以大幅度降低模型检测的正确率。学术界已经在图像分类领域对对抗性图片的生成与应用进行了广泛而深入的研究。但是,在入侵检测领域,对于对抗性网络流量的探索仍在不断发展。在介绍对抗性网络流量的基本概念、威胁模型与评价指标的基础上,对近年来有关对抗性网络流量的研究工作进行了总结,按照其生成方式与原理的不同将生成方法分为5类:基于梯度的生成方法、基于优化的生成方法、基于GAN的生成方法、基于决策的生成方法以及基于迁移的生成方法。通过对相关问题的讨论,就该技术的发展趋势进行了展望。
深度神经网络的对抗攻击及防御方法综述
赵宏, 常有康, 王伟杰
计算机科学. 2022, 49 (11A): 210900163-11.  doi:10.11896/jsjkx.210900163
摘要 ( 834 )   PDF(2758KB) ( 602 )   
参考文献 | 相关文章 | 多维度评价
深度神经网络正在引领人工智能新一轮的发展高潮,在多个领域取得了令人瞩目的成就。然而,有研究指出深度神经网络容易遭受对抗攻击的影响,导致深度神经网络输出错误的结果,其安全性引起了人们极大的关注。文中从深度神经网络安全性的角度综述了对抗攻击与防御方法的研究现状。首先,围绕深度神经网络的对抗攻击问题简述了相关概念及存在性解释;其次,从基于梯度的对抗攻击、基于优化的对抗攻击、基于迁移的对抗攻击、基于GAN的对抗攻击和基于决策边界的对抗攻击的角度介绍了对抗攻击方法,分析每种攻击方法的特点;再次,从基于数据预处理、增强深度神经网络模型的鲁棒性和检测对抗样本等3个方面阐述了对抗攻击的防御方法;然后,从语义分割、音频、文本识别、目标检测、人脸识别、强化学习等领域列举了对抗攻击与防御的实例;最后,通过对对抗攻击与防御方法的分析,展望了深度神经网络中对抗攻击和防御的发展趋势。
一种启发式的互联网多层网络模型构建方法
程秋云, 刘京菊, 杨国正, 罗智昊
计算机科学. 2022, 49 (11A): 210800249-6.  doi:10.11896/jsjkx.210800249
摘要 ( 369 )   PDF(2285KB) ( 331 )   
参考文献 | 相关文章 | 多维度评价
随着网络规模不断扩大,网络结构层次化、模块化的特征日益凸显,传统单层网络研究范式在表征各类网络系统之间的复杂关系时存在一定的局限性,针对多层网络的特性分析和模型构建逐渐成为了复杂网络研究的重要方向。文中针对互联网在应用过程中呈现出的多层网络结构特点,提出了面向互联网的多层网络模型以及在互联网领域构建多层网络模型的意义。通过分析互联网数据特点,设计了涵盖互联网基础设备层、业务应用层和用户账号层的3种类型网络的多层网络模型。文中从单层网络入手,针对当前基于节点度数的网络生成模型无法刻画网络核数分布情况的不足,提出了一种启发式的单层网络生成模型;在单层网络生成模型的基础上,设计了多层网络的层间关联方法,实现了多层网络的模型构建。
基于区块链的分布式加密投票系统
张伯钧, 李洁, 胡凯, 曾俊豪
计算机科学. 2022, 49 (11A): 211000212-6.  doi:10.11896/jsjkx.211000212
摘要 ( 540 )   PDF(2322KB) ( 387 )   
参考文献 | 相关文章 | 多维度评价
随着社会的发展进步,许多应用场景都需要进行投票表决。当前电子投票系统具有中心化的特点,投票过程难以公开透明,选民无法验证选票结果,需可信第三方计票机构参与唱票。针对以上问题,为了更好地适应愈加丰富的应用场景,文中研究并提出了一种基于区块链的分布式加密投票系统。使用分布式环境下的ElGamal加密算法保证了整个投票过程的安全保密性,任何人或机构无法破解获得选票的中间结果。使用区块链智能合约自动执行的机制取代了传统的第三方可信计票机构,实现了自动唱票。由于所有选票信息均存储在区块链上,进一步保证了投票过程透明公开且结果可验证、可追溯。实验结果表明,投票系统的瓶颈为了唱票环节中的累乘算法。为了提高计算效率,进一步采用链上链下协同计算的方式,在保证票据安全性的前提下,链下通过并行计算加快计算速度。最后,通过安全性和性能分析表明,该机制具有良好的可扩展性,是一种实用和安全的电子投票系统设计方案。
EAP-TLS协议的形式化验证研究
陈丽萍, 徐鹏, 王丹琛, 徐扬
计算机科学. 2022, 49 (11A): 211100111-5.  doi:10.11896/jsjkx.211100111
摘要 ( 277 )   PDF(2863KB) ( 351 )   
参考文献 | 相关文章 | 多维度评价
EAP-TLS是5G标准定义的在特定物联网环境中提供密钥服务的安全协议,然而EAP-TLS协议无法提供用户设备与网络之间的双向认证,存在设计缺陷的协议在运行时将危害系统安全,因此在协议实施之前分析其安全性,尽可能找到潜在缺陷并将其改进是所有协议必不可少的过程。文中研究了基于Proverif的EAP-TLS协议与安全属性的形式化模型,并验证了用户设备与网络之间的相互认证性、协议中安全锚点密钥KSEAF与用户身份标识SUPI的保密性等安全属性。实验结果表明,在非安全信道下EAP-TLS协议在认证性方面存在安全缺陷,用户设备对网络的认证失败。分析验证结果进一步确定了导致安全缺陷的原因,并给出了相应的攻击路径。最后,基于密码学中的非对称密钥加密与随机数,讨论了安全缺陷改进的可能性。
基于执行体防御能力的拟态防火墙执行体调度算法
刘文贺, 贾洪勇, 潘云飞
计算机科学. 2022, 49 (11A): 211200296-6.  doi:10.11896/jsjkx.211200296
摘要 ( 343 )   PDF(2888KB) ( 449 )   
参考文献 | 相关文章 | 多维度评价
拟态防御技术是解决现有网络环境“易攻难守”局面的有效手段,拟态防御技术通过提升系统的动态性、异构性和随机性来构建安全可靠的系统。异构执行体的调度是拟态防御的关键环节。已有的调度算法缺乏态势感知能力,只能按照已有策略对执行体进行调度,存在适用性差的问题。为此,提出了一种基于执行体防御能力的调度算法DCOE。DCOE基于经典的流量监测算法,识别出当前流量的威胁类型和威胁程度,并根据各执行体针对当前流量的防御能力动态地调整异构执行体的种类和数量。仿真实验表明,DCOE算法可以在减少对异构执行体调度次数的基础上降低系统的失效率和逃逸率,即在降低系统开销的前提下提升系统的防御水平,增加敌手的攻击难度。
一种面向物联网数据交易的高效PCN路由策略
李敦锋, 肖瑶, 冯勇
计算机科学. 2022, 49 (11A): 211100010-5.  doi:10.11896/jsjkx.211100010
摘要 ( 487 )   PDF(2743KB) ( 350 )   
参考文献 | 相关文章 | 多维度评价
为了提高物联网数据交易的效率,提出了一种基于付费信道网络(Ppayment Channel Network,PCN)的高效路由策略。该策略从网关选择和大额交易拆分两个方面入手来完善PCN网络的缺陷。通过计算不同网关的支付和接收资金流量比率来选择合适的网关进行交易,以保证网络的平衡,增加了网络的稳定性。为了解决大额交易时信道容量不足的问题,将单笔交易拆分成多个交易单元,并通过多信道均衡算法来进行路径选择,减少了链上交易次数,提高了网络的交易效率。仿真结果表明,该方案拥有较高的交易成功率和更低的交易时延。
基于流量分析发现未知UDP反射放大协议
陆炫廷, 蔡瑞杰, 刘胜利
计算机科学. 2022, 49 (11A): 211000089-5.  doi:10.11896/jsjkx.211000089
摘要 ( 403 )   PDF(2225KB) ( 456 )   
参考文献 | 相关文章 | 多维度评价
近年来,DDOS攻击的频率和规模日益扩大,对网络安全造成了极大挑战。其中,UDP反射放大攻击因其攻击成本低、攻击流量巨大、难以追踪溯源等特征成为了黑客青睐的攻击手段。当前的过滤和防御策略大多来源于受攻击后的分析与复盘,面对层出不穷的新型UDP反射攻击存在一定的被动性和滞后性。文中提出了一种基于流量分析来发现存在UDP反射放大潜力的未公开协议的方法。该方法立足放大性和反射性这两个根本特征,从日常网络流量中筛选出符合反射放大特性的流量样本,然后通过重放攻击验证样本是否具备可重复性,记录符合条件的样本,用于对相关服务协议进行研究,最终成功发现新型未公开反射放大协议。用所提方法构建的检测程序,在实验环境和互联网中分别进行了准确率及处理速率测试,成功发现了多种反射放大协议,以积极主动的方式来防御可能出现的反射放大攻击。
支持分片内多轮PBFT验证算法的状态同步方案
高冬雪, 李志淮, 段培培, 陈玉华
计算机科学. 2022, 49 (11A): 211000125-7.  doi:10.11896/jsjkx.211000125
摘要 ( 350 )   PDF(3472KB) ( 295 )   
参考文献 | 相关文章 | 多维度评价
分片是区块链扩容的链上解决方案之一,其中的状态分片可以在不降低安全性的前提下解决公链可扩展性问题。在状态分片中,每个分片只存储部分状态,若采用实用拜占庭容错(Practical Byzantine Fault Tolerance protocol,PBFT)共识算法,即使总体拜占庭节点比例不超过1/3,随机分配到单个分片内的拜占庭节点的比例也存在一定概率超过1/3,导致分片共识失效。因此分片内节点需要定期在不同分片间重新分配,并采用时隙较小的多轮PBFT验证算法可以有效解决这个问题。但是无状态节点难以有效工作,新加入的节点需要同步分片的状态。为此,提出了适应于多轮PBFT验证共识算法的基于候补节点序列的状态同步方案,完成状态同步的节点先进入候补节点序列,为每一轮PBFT共识验证提供不同的共识验证节点。同时,在状态同步过程中,节点根据其历史行为记录获得相应的积分,后续可根据节点积分对算法进行优化。实验结果表明,所提方案在解决状态同步问题的同时,提高了节点共识验证效率,提升了系统的吞吐量。
基于预训练技术和专家知识的重入漏洞检测
陈乔松, 何小阳, 许文杰, 邓欣, 王进, 朴昌浩
计算机科学. 2022, 49 (11A): 211200182-8.  doi:10.11896/jsjkx.211200182
摘要 ( 479 )   PDF(3917KB) ( 468 )   
参考文献 | 相关文章 | 多维度评价
随着区块链中智能合约的安全问题日益突出,智能合约的漏洞检测任务逐渐成为研究的热点。然而,目前的智能合约重入漏洞检测技术主要是符号执行、静态分析、形式化验证和模糊测试等传统的检测方法,这些检测方法不仅存在较高的误报率和漏报率,而且检测精度较低。同时,基于深度学习的方法也有其独特的局限性。针对这些问题,文中提出了一种将预训练技术与传统的专家知识相融合的检测方法,同时将智能合约进行切片处理,以此减小无关数据对模型的影响。文中聚焦于重入漏洞的检测,在203716份合约数据集上进行实验。实验结果表明,基于预训练技术和专家知识的智能合约重入漏洞检测方法具有96.2%的精确率、97.7%的召回率以及96.9%的F1分数,检测效果均优于现有的检测方法。
基于差分进化算法的字符对抗验证码生成方法
杨浩, 闫巧
计算机科学. 2022, 49 (11A): 211100074-5.  doi:10.11896/jsjkx.211100074
摘要 ( 366 )   PDF(2127KB) ( 350 )   
参考文献 | 相关文章 | 多维度评价
验证码被广泛应用于网站、应用程序的注册登录环节以区分人类用户与计算机程序。然而随着深度学习的发展,许多针对验证码的深度学习识别方法不断被提出,验证码不再能较好地区分人类用户与计算机程序,验证码的安全性面临着极大挑战。对抗样本可以使神经网络的输出结果产生大幅误差,将对抗样本与验证码结合以抵御深度学习识别系统对验证码的攻击是一种行之有效的方法。将图像领域的对抗样本生成方法用于生成对抗验证码来防御深度学习方法是当前的研究热点之一。现有的字符对抗验证码生成方法都是需要知道攻击网络的结构参数信息的白盒方法,然而在实际的验证码应用场景中通常无法知道攻击网络的信息,健壮性的验证码应该在不知道攻击者信息的情况下依然有良好的防御能力。因此提出了一种基于差分进化算法的黑盒字符型对抗验证码生成方法(Adversarial Character CAPTCHA Generation Method Based on Differential Evolution Algorithm,ACoDE),在无需了解攻击网络信息的情况下通过优化经典差分进化算法变异过程中的缩放因子以及种群进化策略来提高算法的求解能力,使对抗样本误导神经网络的能力更强。将该对抗样本生成方法用于字符验证码数据集后目前最先进的基于卷积神经网络的字符型验证码识别系统的识别准确率降低到了30%以下,且对抗验证码的视觉效果比其他白盒方法生成的对抗验证码更好。
开放式环境下基于向量表征与计算的动态访问控制
王清旭, 董理君, 贾伟, 刘超, 杨光, 吴铁军
计算机科学. 2022, 49 (11A): 210900217-7.  doi:10.11896/jsjkx.210900217
摘要 ( 335 )   PDF(3171KB) ( 402 )   
参考文献 | 相关文章 | 多维度评价
访问控制是网络安全的基础技术。随着大数据技术与开放式网络的发展,互联网用户的访问行为变得越来越灵活。传统的访问控制机制主要从规则自动生成和规则匹配优化两方面来提升访问控制的工作效率,大多采用遍历匹配机制,存在计算量大、效率低等问题,难以满足开放式环境下访问控制动态、高效的需求。受人工智能领域中的分布式嵌入技术的启发,提出一种基于向量表征与计算的访问控制的VRCAC(Vector Representation and Computation based Access Control)模型。首先将访问控制规则转化为数值型向量,使得计算机能够以数值计算的方式实现快速的访问判定,用户向量与权限向量的位置关系可用两者的内积值表示,通过比较内积值与关系阈值,可以快速判断用户与权限的关系。此方法降低了访问控制执行的时间复杂度,从而提高了开放式大数据环境下的访问控制的执行效率。最后在两个真实数据集上,采用准确率、误报率等多种评价指标进行了比较实验,验证了所提方法的有效性。
基于启发式搜索特征选择的加密流量恶意行为检测技术
俞赛赛, 王小娟, 章倩倩
计算机科学. 2022, 49 (11A): 210800237-6.  doi:10.11896/jsjkx.210800237
摘要 ( 518 )   PDF(2230KB) ( 371 )   
参考文献 | 相关文章 | 多维度评价
随着加密流量在网络中的占比越来越大,隐藏在加密流量中的恶意行为也越来越多,网络安全威胁形势越来越严峻。具有某些恶意行为的加密流量包含有多种流量特征,其特征之间本身也存在一定的冗余性。冗余的特征会增加检测时间,降低模型检测的效率。文中依据启发式搜索策略原理对加密流量包含的多种不同的特征进行筛选,找出具有代表性的特征组合。首先根据随机森林算法对特征重要度进行排序,筛选出对分类结果影响较大的特征,然后利用Pearson相关系数计算所有特征之间的相似度,筛选出彼此之间较为独立的特征组合。在数据集CTU-13上的实验结果表明,通过筛选出具有代表性的特征组合,在不降低检测准确率的情况下,减少了检测时间,提高了对加密流量恶意行为的检测效率。
一种改进的特征选择算法在邮件过滤中的应用
李永红, 汪盈, 李腊全, 赵志强
计算机科学. 2022, 49 (11A): 211000028-5.  doi:10.11896/jsjkx.211000028
摘要 ( 301 )   PDF(1869KB) ( 375 )   
参考文献 | 相关文章 | 多维度评价
垃圾邮件一般是指未经用户请求强行发到用户电子信箱中的包含宣传资料、病毒等内容的电子邮件,它具有批量发送的特征,且会在互联网上造成巨大危害。因此,为用户过滤掉这些垃圾邮件非常重要。垃圾邮件过滤问题的实质是一个文本分类问题,具有很高的特征维度。但并不是所有特征都对分类有贡献,因此选择一个合适的能够反映整个数据集的特征子集是构造一个好的邮件分类器的基础。现有的特征选择方法存在一定的局限性,比如特征之间仍存在冗余、约简特征结果不稳定,以及计算成本高等。研究和分析现有垃圾邮件处理方法的一些优缺点,结合现有方法,提出一个新的基于信息增益方法和粒度球邻域粗糙集方法的集成特征选择方法,即IGGBNRS算法。通过在不同分类模型上的对比实验表明,该算法简化了模型,性能较好。
基于申威众核处理器的Office口令恢复向量化研究
李辉, 韩林, 陶红伟, 董本松
计算机科学. 2022, 49 (11A): 210900176-5.  doi:10.11896/jsjkx.210900176
摘要 ( 346 )   PDF(2302KB) ( 376 )   
参考文献 | 相关文章 | 多维度评价
为了满足农业农村大数据应用中数据安全的需求,文章结合Office口令恢复中的计算热点问题,以申威众核处理器为硬件平台,提供了一种向量化密码解算方法。SHA-1和AES函数的解析是方法的核心部分。首先,利用申威众核处理器的特点,对其进行自动向量化研究;其次,通过依赖性分析描述了明文块之间手动向量化过程,给出方法理论层面的可行性结论;最后,为验证方法的正确性和有效性,将Office各个版本的加密文档作为用例,开展多重数据测试,测试结果与传统的口令恢复工具和开源的Hashcat口令恢复工具进行对比。实验结果表明,方法能够有效地提高口令恢复的性能。
基于密码学累加器的电力物联网设备接入管理
陈彬, 徐欢, 奚建飞, 雷美炼, 张锐, 秦诗涵
计算机科学. 2022, 49 (11A): 210900218-6.  doi:10.11896/jsjkx.210900218
摘要 ( 319 )   PDF(2492KB) ( 437 )   
参考文献 | 相关文章 | 多维度评价
设备安全接入是电力物联网安全防护的第一道防线,是实现访问控制、入侵检测等安全机制的前提。完备的设备接入管理涵盖设备的可信认证和安全撤销两个关键环节,现行系统大多依赖PKI来建立可信基础设施,通过公钥证书的颁发、验证及撤销实现接入管理。然而,在电力物联网场景下,该方案为数量众多、资源受限的设备带来了额外的开销负担和效率问题,随之提出的轻量级认证方案实现了开销及效率的优化,但在功能上存在不足,无法实现安全撤销这一关键环节。针对以上不足,基于密码学累加器及布隆过滤器提出了一种电力物联网设备接入管理方案,同时实现了设备的可信认证及安全撤销,并有效地兼顾功能和效率。通过安全性分析,本方案实现了设备对网关的匿名认证、身份凭证的不可伪造性以及强制撤销安全性。实验结果表明,与主流的基于PKI的设备接入管理方案相比,本方案在设备身份验证及凭证撤销环节大大降低了通信开销和存储开销,在电力物联网场景下具备更高的实用性。
软件工程
Android GUI自动化测试综述
杨艺, 王嬉, 赵春蕾, 步志亮
计算机科学. 2022, 49 (11A): 210900231-10.  doi:10.11896/jsjkx.210900231
摘要 ( 564 )   PDF(2078KB) ( 679 )   
参考文献 | 相关文章 | 多维度评价
新类型新版本的手机应用数量与日俱增,使得传统的人工测试方法已经无法负荷,因此需要研究人员提出更加有效的自动化测试方法。在自动化测试的过程中,Android应用程序的GUI(Graphical User Interface),即图形用户界面,发挥着极其重要的作用,GUI自动化测试凭借其出色的测试覆盖率和故障检测性能,成为研究人员的重点研究对象。文中对当前GUI自动化测试的相关研究进行梳理和总结,选取其中有代表性、普遍性的自动化测试框架进行详细剖析,从测试策略、探索策略、错误报告、是否支持重放、测试环境、支持的事件类型、是否使用APP源码、是否开源、系统事件识别方法几个方面来对挑选出的自动化测试工具进行相应的分类、分析与对比。同时选取部分有代表性的自动化测试框架进行对比实验,以探究测试效率以及各自的优缺点。最后提出当前研究所面临的挑战以及未来的发展前景。
软件需求工程技术综述
王浩宇
计算机科学. 2022, 49 (11A): 210900132-14.  doi:10.11896/jsjkx.210900132
摘要 ( 269 )   PDF(2197KB) ( 713 )   
参考文献 | 相关文章 | 多维度评价
需求工程作为软件项目的首个过程,它的实施质量很大程度上能决定软件项目的成败。80年代中期敏捷软件开发的出现使得需求工程从由计划驱动过渡到现在的由价值取动。此外,硬件性能的大幅提升与人工智能的再度兴起使自然语言处理的效率和规模与日俱增,需求工程更能本地易地利用自然语言处理来分析大量文本数据。物联网、边缘计算和大数据的出现使投资者和开发人员更容易获取到大量用户数据和商业信息,数据驱动的需求工程作为一种新概念也逐渐被业界所知。文中首先综述了需求工程的发展历程,包括从需求工程方法学开始,到面向对象建模,再到基于本体和面相特征的需求工程,以及与机器学习相关的自动化需求提取技术。随后重点介绍了3种需求工程相关的研究方向,包括需求工程中采用的自然语言处理方式和支持的部分语言类型,敏捷需求工程的发展历程以及近年提出的工具和方法,数据驱动的需求工程的概念、必要性、过程和近年主要采取的方法和实践。最后基于一些各国关于需求工程开展情况的报告,分析了需求工程近年遇到的困难和挑战,并对需求工程未来的发展进行展望。
结合数据选择的多源跨项目缺陷预测
邓建华, 王炜
计算机科学. 2022, 49 (11A): 210800160-7.  doi:10.11896/jsjkx.210800160
摘要 ( 371 )   PDF(2632KB) ( 337 )   
参考文献 | 相关文章 | 多维度评价
多源跨项目缺陷预测(Multi-sources Cross Project Defect Prediction,MCPDP)旨在使用多个来自其他项目(源项目)的历史数据来预测目标项目中软件模块出现缺陷的可能性。该研究解决了缺陷预测建模的冷启动问题,为新建软件或缺乏历史数据的软件系统建立缺陷预测模型提供了解决方案。对于进一步提高跨项目缺陷预测的准确性,源数据选择被认为是一条有效途径。因此,文中对数据选择的多源跨项目缺陷预测方法进行了研究,该方法包括两个步骤:1)源数据特征对齐;2)改进最大均值测度,实现源数据筛选。为了验证提出的方法的有效性,在AEEEM,Relink,NASA,SOFTLAB这4个公开数据集进行实验,结果表明所提方法在F-measure指标上比基线方法分别提高了4%和5%,证明该方法具有较好的性能。
基于模型驱动的Web服务建模与三阶段模型转换方法
王昌晶, 丁希龙, 陈茜, 罗海梅, 左正康
计算机科学. 2022, 49 (11A): 211100055-14.  doi:10.11896/jsjkx.211100055
摘要 ( 263 )   PDF(2072KB) ( 455 )   
参考文献 | 相关文章 | 多维度评价
精确的描述Web服务的语义对Web服务的发现、执行、动态组合和交互至关重要。为支持Web服务建模,提出从抽象到具体4个模型:Radl-WS服务需求模型、Apla服务设计模型、Java可执行代码、WSDL/RESTful API。为支持模型转换,进一步提出一种三阶段转换生成Web服务可执行代码的方法:第一阶段将Radl-WS服务需求建模语言转换为Apla服务设计语言;第二阶段将Apla服务设计语言通过相关转换工具生成可执行代码;第三阶段将可执行代码封装成服务。进而研究了三阶段模型转换的语义正确性,最后通过实例,展示了所提方法的实际效果。
基于图嵌入的代码相似性度量
梁瑶, 谢春丽, 王文捷
计算机科学. 2022, 49 (11A): 211000186-6.  doi:10.11896/jsjkx.211000186
摘要 ( 294 )   PDF(2503KB) ( 389 )   
参考文献 | 相关文章 | 多维度评价
近年来,代码相似性检测一直是软件工程领域的热点问题,它可以帮助代码克隆检测、代码缺陷预测等,降低软件维护成本。目前流行的代码相似性检测方法大多是借用自然语言处理方法从符号(Token)、抽象语法树(Abstract Syntax Tree,AST)等代码表征中提取源代码的文本、语法、结构等特征信息,将其映射为连续空间的实值向量,然后通过直接计算提取特征的欧氏距离、余弦值,或通过浅层神经网络模型获得代码的相似值,这些方法取得了优于传统程序静态分析的效果。但这些方法大多数是基于源代码语法层面的检测技术,未充分利用源代码的语义信息。Doc2Vec和Word2Vec虽然能够挖掘代码的词汇语义信息,但对代码的执行语义信息无能为力,针对这一问题,提出了使用控制流程图(Control Flow Graph,CFG)来表示代码的执行语义,并使用基于随机游走(Random Walk)的图嵌入方法来学习和推理代码的语义信息,进而判断源代码的功能相似性。实验结果表明,和Doc2Vec以及Word2Vec方法相比,该模型能够较精确地检测出源代码的功能相似性,其F1值相较于Doc2Vec和Word2Vec方法分别提高了16.01%和18.72%。
计算机网络
移动边缘计算中任务卸载研究综述
高月红, 陈露
计算机科学. 2022, 49 (11A): 220400161-7.  doi:10.11896/jsjkx.220400161
摘要 ( 369 )   PDF(1964KB) ( 617 )   
参考文献 | 相关文章 | 多维度评价
随着物联网的普及以及5G等无线通信技术的发展,各类新型业务层出不穷,移动数据流量也呈指数级的增长趋势。为了保证服务质量,移动计算模式从传统的云计算转变为了移动边缘计算(MEC),移动边缘计算的主要特点是将网络资源“下沉”到网络边缘,以满足时延敏感型和计算密集型业务的需求,从而给用户提供更好的服务。而任务卸载是移动边缘计算的主要研究问题之一,文中对近几年移动边缘计算中的任务卸载研究现状进行了归纳和总结,首先,对MEC的基本概念、架构以及典型应用场景进行了介绍,然后阐述了任务卸载问题,分别从最小化时延、最小化能耗以及最小化时延和能耗的加权和3个方面分析和总结了业内的研究现状,最后从数据依赖性、用户移动性、资源公平性和信息安全性4个方面对未来的研究方向进行了展望。
云中满足截止时间约束且优化成本的工作流调度策略
王子健, 卢政昊, 潘纪奎, 孙福权
计算机科学. 2022, 49 (11A): 210800154-6.  doi:10.11896/jsjkx.210800154
摘要 ( 397 )   PDF(2700KB) ( 343 )   
参考文献 | 相关文章 | 多维度评价
云环境中的工作流调度是如今最具挑战性的问题之一。它关注于在指定的服务质量需求下,以将相互依赖的任务映射到虚拟机的方式来执行工作流应用程序。云服务提供商以不同的价格提供不同性能的虚拟机。同样的工作流,配置不同的虚拟机,会产生不同的完工时间以及货币成本。云中工作流调度的主要问题之一是在满足用户给定的截止时间约束的前提下,找到一种更廉价的调度方法。为解决上述问题提出了一种云环境中满足截止时间约束且优化成本的工作流调度策略DCCO。它基于δ-alap对截止时间进行分配,并考虑了两个任务可能被分配到同一虚拟机的情况。实验结果表明,相比于其他经典调度算法,在不同类型工作流测试下,DCCO具有最高的成功率,且满足截止时间约束,同时可以优化执行成本。
边云协同计算中成本感知的物联网数据处理方法
王晨华, 侯守璐, 刘秀磊
计算机科学. 2022, 49 (11A): 211000101-7.  doi:10.11896/jsjkx.211000101
摘要 ( 255 )   PDF(2295KB) ( 294 )   
参考文献 | 相关文章 | 多维度评价
随着物联网终端设备联网产生大量计算密集型的任务,文中提出了一种针对边云协同计算中成本优化的大数据处理方法。首先,所提算法考虑网络传输带宽约束及计算资源约束,联合优化带宽资源、计算资源分配以及动态卸载策略。其次,应用MapReduce框架,建立边云协同计算模型,通过Lyapunov优化理论将目标公式拆分成4个子问题,分别进行优化求解。大量对比实验结果表明,通过合理利用边缘和云的力量,在保证系统稳定性的前提下,所提算法可以有效地提高云计算的数据处理效率,降低服务供应商的数据处理开销,同时,该算法可降低任务成本总开销及提高性价比(队列长度与运营成本的比值),在物联网数据处理过程中,应用边云协同计算方法对降低成本开销并提高性价比具有重要意义。
一种面向SDN的移动网络可靠性评估算法
包春晖, 庄毅, 郭黎烨
计算机科学. 2022, 49 (11A): 211000080-8.  doi:10.11896/jsjkx.211000080
摘要 ( 385 )   PDF(2794KB) ( 335 )   
参考文献 | 相关文章 | 多维度评价
针对现有的可靠性评估算法无法直接应用于软件定义网络(SDN),以及传统网络可靠性评估过程中专家权重难以合理设置等问题,提出了一种面向SDN的移动网络可靠性评估算法,设计了细粒度的专家权重自适应调整方法,并详细地给出了网络可靠性评估的流程。首先,对SDN中的移动网络节点设备进行可靠性评估,在评估过程中引入专家评估模糊数,以更细粒度地对专家权重进行应调整;其次,根据基于SDN的移动网络拓扑结构对移动网络节点进行关键重要程度分析,来衡量不同类型节点设备在网络功能服务中的关键程度,以此计算出节点对网络整体可靠性的影响;最后,综合以上两个结果对整体网络进行可靠性分析与评估。通过实例和仿真实验验证了所提算法的有效性,相比同类算法可达到更高的评估准确性。
基于SPA和QoX的不一致性消除算法
邢庆华, 许宏吉, 刘强, 樊士迪, 李恬阔, 陈敏
计算机科学. 2022, 49 (11A): 210700122-7.  doi:10.11896/jsjkx.210700122
摘要 ( 209 )   PDF(3060KB) ( 389 )   
参考文献 | 相关文章 | 多维度评价
在情景感知计算(Context Aware Computing,CAC)的研究与应用过程中,不可避免地会遇到情景信息的不确定性问题。而情景信息不一致性是不确定性问题中最难解决的突出问题,因此如何合理、有效地处理情景信息的不一致性尤为重要。针对情景信息不一致性问题,提出了一种基于集对分析(Set Pair Analysis,SPA)和情景信息综合质量指标(Quality of Comprehensive IndeXes,QoX)的不一致性消除算法,其使用QoX对情景信息综合质量进行度量和评估,提高了情景信息综合质量度量的完整性和精确性;同时,该算法使用SPA对所求质量指标从同一度、对立度、差异度3个方面进行定量分析,从而保证情景信息质量计算过程所考虑的因素更为全面。实验结果表明,相比传统的不一致性处理算法,所提算法的判决正确率有明显提升。
基于边缘计算的数据无损压缩方法
张小梅, 曹蓥, 娄平, 江雪梅, 严俊伟, 李达
计算机科学. 2022, 49 (11A): 210500195-6.  doi:10.11896/jsjkx.210500195
摘要 ( 205 )   PDF(2671KB) ( 424 )   
参考文献 | 相关文章 | 多维度评价
工业物联网(Industrial Internet of Things,IIoT)可以将各种工业设备、监测仪表以及传感器进行相互连接,设备的运行状态可通过监测仪表与传感器进行全面感知,并根据感知数据对设备状态进行分析与预测。然而要对海量的感知数据进行分析处理需要大量的存储空间与计算能力,将其传送到云平台势必将占用大量的带宽并产生较大的时延,很难满足对设备状态实时分析与诊断的需求。因此,针对工业设备状态感知的数据,提出了基于最优差分和线性拟合降熵变换的无损压缩方法,在数据采集的边缘侧对感知数据进行无损压缩,从而大大提高传输效率,使得感知数据能快速传送到云平台进行分析与处理。该方法根据数据差值序列方差大小和采集频率高低从最优差分和曲线拟合差值中选取有效的降熵变换进行压缩,并采用LZO(Lempel-Ziv-Oberhumer)压缩算法进行二次压缩。在两类不同的数据集上对所提方法进行了测试,实验结果表明,该方法的压缩率最低与最高分别可达77%和93%,同时验证了其无损重构的特性。
一种面向移动边缘计算的无人机基站部署方法
刘芳正, 马博闻, 吕博枫, 黄霁崴
计算机科学. 2022, 49 (11A): 220200089-7.  doi:10.11896/jsjkx.220200089
摘要 ( 708 )   PDF(2846KB) ( 405 )   
参考文献 | 相关文章 | 多维度评价
在移动边缘计算(Mobile Edge Computing,MEC)中,本地设备可以将任务卸载到边缘服务器执行,以此来提高服务质量(Quality of Service,QoS)。但在受灾地区或遇到紧急情况时,地面固定的基站可能会出现大面积瘫痪,为了应急通信,无人机(Unmanned Aerial Vehicle,UAV)支持的移动边缘计算系统应运而生。作为新兴的应急通信手段,无人机可以携带边缘服务器,地面用户设备可以将其计算任务卸载给无人机执行,但在多用户网络中部署多个无人机基站是具有挑战性的。为此,重点研究无人机基站的战略部署问题,将该问题建模为多目标优化问题,旨在平衡无人机基站之间的工作负载,最小化地面用户和无人机基站之间的访问延迟。与单目标优化问题相比,多目标之间相互作用并且解不唯一,给模型求解带来了一定困难。为此,提出基于K-中心点(K-medoids)的帕累托边界搜索算法求解该问题,之后进一步提出利用主成分分析算法(Principal Component Analysis,PCA)从帕累托边界中寻找最合适的解作为最终的无人机基站部署策略。实验使用真实的数据集,并与其他几种基线方法进行性能比较,验证了所提解决方案的有效性。
传感器唤醒机制下的智能干扰源定位方法
杨思星, 李宁, 郭艳, 杨延宇
计算机科学. 2022, 49 (11A): 211000165-6.  doi:10.11896/jsjkx.211000165
摘要 ( 277 )   PDF(2800KB) ( 310 )   
参考文献 | 相关文章 | 多维度评价
随着人工智能技术的发展,智能干扰源可通过改变自身发射功率来提高干扰效果,导致传统基于接收信号强度的定位技术失效。为此,引入传感器唤醒机制,研究基于块压缩感知的多干扰源定位方法。首先,周期性地唤醒传感器节点,同时提高传感器节点利用有效性和定位信息采集精确性;其次,考虑到在干扰源发射功率未知且变化的情况下无法确定距离与接收信号强度之间的关系,引入参考功率对智能变化的干扰源功率进行处理;然后,基于压缩感知理论,将定位问题建模为块稀疏向量重构问题;最后,通过探索功率变化规律设计出一种基于变分贝叶斯均值-期望的Wake-VBEM重构算法,精确重构目标位置向量。仿真证明,所提方法在干扰源功率未知且变化时,可同时实现多干扰源位置估计并有效提高网络使用寿命。
基于最小生成树的vSDN故障快速恢复算法
陈港, 孟相如, 康巧燕, 翟东
计算机科学. 2022, 49 (11A): 211200034-7.  doi:10.11896/jsjkx.211200034
摘要 ( 412 )   PDF(3533KB) ( 290 )   
参考文献 | 相关文章 | 多维度评价
针对虚拟软件定义网络的故障恢复问题,提出了基于最小生成树的虚拟软件定义网络故障恢复算法,以期解决虚拟软件定义网络故障恢复时间长这一难点。该算法一方面是根据节点与链路的资源和拓扑属性,设定节点与链路重要度,并据此对节点与链路进行等级划分;在此基础上,针对不同的物理网络,调整备份与迁移的比例,从而在提升请求接受率的同时减少故障后的完全恢复时间,达成对物理网络资源的充分利用;另一方面是对虚拟网络进行连通性分析,运用最小生成树算法优先恢复虚拟网络的连通性,然后完成剩余链路的故障恢复,在保障虚拟网络连通性的基础上进一步减少故障恢复时间。仿真实验表明,该算法能在保障较高虚拟网络请求接受率与故障恢复率的基础上,缩减故障恢复时间。
费用约束下的多状态网络可靠性评估方法
徐秀珍, 吴国林, 张媛媛, 牛义锋
计算机科学. 2022, 49 (11A): 211200259-7.  doi:10.11896/jsjkx.211200259
摘要 ( 549 )   PDF(1952KB) ( 336 )   
参考文献 | 相关文章 | 多维度评价
多状态网络是指网络及其组成单元具有多种不同的性能水平,该网络模型已被广泛应用于描述现实中众多技术网络的行为特征。费用约束下的多状态网络可靠性Rel(d,b)是指网络能够把d单位的需求流量从源点成功输送到汇点且总的流传输费用不超过给定预算b的概率,该可靠性指标可以通过费用约束下的极小容量向量(简称(d,b)-MCV)来计算。由于(d,b)-MCV问题是典型的 NP-hard 问题,求解时间会随着网络规模增加呈指数增长,为提高求解效率,利用边的容量下限建立了关于(d,b)-MCV的改进数学模型,并从求解复杂度方面证明了该模型的优势;并且,利用超越数的概念,建立了(d,b)-MCV与实数之间的一一映射关系;基于此关系,提出了一种新的(d,b)-MCV去重方法。复杂度分析表明,该去重方法比现有方法更实用、更高效。最后,利用数值实验对提出的(d,b)-MCV算法的性能进行了检验;结果表明,该算法在求解(d,b)-MCV方面具有明显的效率优势,从而为费用约束下的多状态网络可靠性评估提供了一种新方法。
基于三支聚类的云任务优化调度
马新宇, 姜春茂, 黄春梅
计算机科学. 2022, 49 (11A): 211100139-7.  doi:10.11896/jsjkx.211100139
摘要 ( 198 )   PDF(3216KB) ( 358 )   
参考文献 | 相关文章 | 多维度评价
云平台是支撑当今诸多高新技术发展的重要基础设施之一。作为云计算系统体系规划的一个重要组成部分,调度技术直接关系着云计算组成系统中的任务完成时间和能耗问题。为保证基础设施及服务模式下的云任务高效调度,提出了一种基于三支聚类的云任务优化调度算法(Three-Way Clustering Optimal scheduling Programming,TWOCP)。针对云任务属性的多样化特点,结合三支聚类算法对重叠任务和模糊任务进行粒化,并依次调度每个类簇的核心域任务和边界域任务;通过结合动态规划算法对粒化任务进行优化调度,以期实现最少任务完成时间。Cloudsimplus实验仿真结果表明,所提算法可以降低任务完成时间和能源消耗,有效保障云数据中心的可用性。
改进的粒子群蒙特卡洛WSN节点定位算法
王灵矫, 方凯鹏, 郭华
计算机科学. 2022, 49 (11A): 210900156-5.  doi:10.11896/jsjkx.210900156
摘要 ( 163 )   PDF(2653KB) ( 426 )   
参考文献 | 相关文章 | 多维度评价
无线传感器网络是由监测范围内的节点构成而且能够相互通信的自组织网络。针对传统粒子群蒙特卡洛算法存在定位时间长、定位精度低的问题,提出了一种改进的粒子群蒙特卡洛定位算法(IPSOMCL)。利用蒙特卡洛算法获取待定位节点的估计坐标,通过粒子群算法修正估计距离与测量距离的误差。在改进过滤阶段,提取锚节点信息的跳数得到一个精度更高的采样区域代替传统算法通过通信半径确定采样区域的方式进行过滤。引入交叉变异使算法能够跳出局部最优解并找到更加准确的位置坐标节点,提高定位的效率和定位精度。
基于改进超启发算法的通信卫星任务松弛调度方法
刘文文, 熊伟, 韩驰
计算机科学. 2022, 49 (11A): 210900125-6.  doi:10.11896/jsjkx.210900125
摘要 ( 191 )   PDF(2605KB) ( 311 )   
参考文献 | 相关文章 | 多维度评价
在卫星通信保障压力不断增加的背景下,需要不断提高通信卫星任务调度的效率。任务调度的矛盾主要集中在通信任务的申请时间和资源带宽的冲突上,文中通过松弛任务申请条件的方式,建立通信卫星任务调度的松弛模型,通过小幅度的时间和带宽调整来减少任务之间的冲突,增加任务获取卫星资源的可能性,提高任务的可执行率。在此基础上,提出一种基于人工蜂群的超启发算法对模型进行求解,该算法采用人工蜂群算法作为高层选择策略,并根据卫星资源调度问题的特点选择7种低层启发算子进行序列优化,同时采用模拟退火方式作为接受准则避免陷入局部最优。最后通过仿真实验及算法对比验证了提出的松弛模型和改进算法的有效性。
多源跨域数据融合的无线通信网络流量预测
马冀, 林尚静, 李月颖, 庄琲, 贾睿, 田锦
计算机科学. 2022, 49 (11A): 210800165-7.  doi:10.11896/jsjkx.210800165
摘要 ( 347 )   PDF(4545KB) ( 510 )   
参考文献 | 相关文章 | 多维度评价
精准地预测无线通信网络流量能够辅助运营商进行精细化运营,更高效地配备与部署基站资源,从而满足大量涌现的各种业务需求。然而,高度复杂的时空依赖性以及多源跨域因素的影响使得无线通信流量的精准预测面临着巨大的挑战。首先,对无线通信流量从时间属性、空间属性、社会属性、以及自然属性进行相关性分析,数据分析表明,无线通信流量具有多源跨域性;其次,基于对无线通信流量多重属性的全面分析,提出了一种改进的密集全连接网络模型MST-DenseNet。该模型利用单个DenseUnit结构的卷积操作捕获无线通信流量的空间相关性,利用多个并列的DenseUnit结构捕获无线通信流量在不同时间尺度上的相关性,同时考虑跨域数据对流量的影响,最终将通信流量自身的时空特征与跨域数据中的社会特征、自然特征高效融合,实现对无线通信流量的精准预测。在实际蜂窝数据集上与现有模型进行预测误差的对比,结果表明MST-DenseNet具有更高的预测精度。
交叉&应用
众核处理器研究技术综述和分析
宋立国, 胡承秀, 王亮
计算机科学. 2022, 49 (11A): 211000012-7.  doi:10.11896/jsjkx.211000012
摘要 ( 468 )   PDF(1774KB) ( 741 )   
参考文献 | 相关文章 | 多维度评价
处理器正在由单核处理器向众核处理器发展,文章首先介绍了目前众核处理器的发展状况;然后重点从能效、性能和可靠性3个方面,分体系结构、片上存储和软件等不同层次综合分析国外众核处理器最新研究成果;结合后摩尔时代集成电路发展趋势,指出自适应技术和三维集成技术将是众核处理器发展的重点。文章最后认为,众核处理器未来发展将是不同拓扑结构、软件编程与硬件定义、经典设计与新器件、新工艺的创新融合。
基于通道拆分CLAHE和自适应阈值残差网络的变工况故障诊断
黄晓玲, 张德平
计算机科学. 2022, 49 (11A): 211100122-7.  doi:10.11896/jsjkx.211100122
摘要 ( 328 )   PDF(2628KB) ( 319 )   
参考文献 | 相关文章 | 多维度评价
基于深度学习的故障诊断方法在大数据发展的推动下逐渐成为近年来故障诊断领域的研究热点。但是在真实的工业领域,深度学习故障诊断仍存在两点局限性:1)早期故障特征微弱,故障信息提取不足;2)变工况下收集的故障数据分布不一致。这两点导致深度学习故障诊断存在故障识别率低、域适应性差的问题。为解决上述问题,提出了一种基于通道拆分CLAHE和自适应阈值残差网络的变工况故障诊断方法(FEResNet)。该方法从增强重要特征、删除冗余特征两个角度出发,首先对故障信号做Morlet小波变换,挖掘变工况下振动信号隐含的判别性时频信息;然后设计通道拆分的CLAHE方法,提高时频图的对比度和清晰度,增强故障特征;最后将特征增强后的时频图输入到设计的自适应阈值残差网络中进行训练,删除冗余特征。在CWRU数据集上的实验结果表明,该方法在同工况下的预测精度高达100%,在变工况下的平均预测精度高达99.03%,域适应性强。
基于OpenMP并行模型下HHL算法的经典模拟实现
谢浩山, 刘晓楠, 赵晨言, 何明, 宋慧超
计算机科学. 2022, 49 (11A): 211200028-5.  doi:10.11896/jsjkx.211200028
摘要 ( 305 )   PDF(1946KB) ( 333 )   
参考文献 | 相关文章 | 多维度评价
量子计算天然的叠加性和纠缠性使其具有经典计算技术难以比拟的并行计算能力,基于量子计算强大的并行能力,某些已知的量子算法处理问题的速度要快于经典算法。然而现阶段由于量子计算机的研制还处于发展阶段,想要在量子计算机上进行算法实验的需求还不能被满足,因此可以在经典计算机上对量子算法进行经典模拟。HHL算法常用来解决线性系统的方程问题,其被广泛应用在数据处理、数值计算、最优化问题等领域。本文基于经典的计算机平台,通过高级编程语言C++对HHL算法进行模拟实现,并采用OpenMP并行编程模型对算法进行并行加速。实现了HHL算法模拟解决4×4,8×8,16×16矩阵的线性方程组,并且对算法进行了加速处理。
基于人工蜂群算法的多维函数优化加速方法
李辉, 韩林, 于哲, 王威
计算机科学. 2022, 49 (11A): 211200075-6.  doi:10.11896/jsjkx.211200075
摘要 ( 373 )   PDF(3726KB) ( 303 )   
参考文献 | 相关文章 | 多维度评价
人工蜂群算法在农业农村大数据应用开发中被广泛采用,但是串行人工蜂群算法时间的复杂度较高,不适用于多维函数的快速求解问题。针对串行人工蜂群算法对多维函数求解执行效率较低的问题进行分析,通过解析多维函数及人工依赖关系判定,提出了一种基于人工蜂群算法的多维函数优化加速方法,该方法包括任务划分、数据分布、同步操作和任务并行。为了证明方法的有效性,以海光处理器为硬件测试平台,对4个多维函数进行对比测试。实验结果表明,与串行人工蜂群算法对多维函数的求解速度相比,该方法对于4个多维函数的求解速度能得到大幅提升。
一种基于GPU的核苷酸分子系统发育树条件似然概率可扩展并行计算方法
黄佳为, 李晓鹏, 凌诚
计算机科学. 2022, 49 (11A): 210800189-7.  doi:10.11896/jsjkx.210800189
摘要 ( 321 )   PDF(4095KB) ( 322 )   
参考文献 | 相关文章 | 多维度评价
贝叶斯与Metropolis-Hastings算法的高效实现让MrBayes成为使用广泛的分子序列系统发育分析工具。然而,分子序列与进化参数的增加导致候选分子树样本空间急剧扩大,使得系统发育树的重构工作面临巨大计算挑战。为降低MrBayes系统发育分析中分子树条件似然概率的计算时间,提高分析效率,近年来出现一批基于图形处理器(GPU)的并行加速方法。为提高并行方法的可扩展性,提出了一种优化的似然概率多线程并行计算方法。根据位点间可变进化速率模型中分子状态似然概率的计算需要对应不同转移概率矩阵,将前期使用多线程对不同位点似然概率的并行计算,进一步分解为多位点间不同转移概率矩阵下的条件似然概率的计算。该策略在不改变单个线程计算传输比的基础上,通过增加线程数量,优化了线程warp间的并行重叠度,提高了并行效率。此外,由于每个线程warp只计算同一种转移概率矩阵下的似然概率,避免了在使用共享内存时不同warp间的同步开销,进一步提升了内核计算效率。所提方法与前期方法在4组实际数据和30组模拟数据上的计算结果表明,在核心似然函数的计算加速上,本文取得的计算性能超过tgMC3(2.0版)和nMC3(2.1.1版)方法,最高达1.78和2.04倍。
基于深度神经网络与联邦学习的污染物浓度预测二次建模
钱栋炜, 崔阳光, 魏同权
计算机科学. 2022, 49 (11A): 211200084-5.  doi:10.11896/jsjkx.211200084
摘要 ( 340 )   PDF(2114KB) ( 367 )   
参考文献 | 相关文章 | 多维度评价
进入新世纪,伴随着我国经济的高速发展,我国很多地区空气污染情况相对严重,同时政府对于空气污染情况的关注度与治理力度也越来越高。当前对于我国空气质量影响最大的是O3,SO2,NO2,CO,PM10,PM2.5这6种污染物,因而对这6种污染物浓度进行预测预报,及时作出相应管控调整就成为了保障居民健康、建设美丽中国的迫切需求。目前污染物预测的主流方案是WRF-CMAQ预测系统,该系统基于污染物物化反应与气象模拟两部分构成。但因为当前对于如臭氧在内的污染物的生成机理等研究还有待深入,WRF-CMAQ模型的预测存在较大误差。因此采用了深度神经网络对污染物浓度进行二次建模的方式,来减少预测误差。同时,采用联邦学习方法,对于多个监测站使用联邦学习进行数据训练,提升模型泛化能力。实验结果表明,相比于一次WRF-CMAQ的一次预测结果,深度神经网络的方案在均方误差值上最多缩小到了3.93%。同时,采用联邦学习的方案相比于单个监测站点在广泛测试中最多提升了68.89%的性能。
基于机器学习的剩余使用寿命预测实证研究
王加昌, 郑代威, 唐雷, 郑丹晨, 刘梦娟
计算机科学. 2022, 49 (11A): 211100285-9.  doi:10.11896/jsjkx.211100285
摘要 ( 751 )   PDF(3894KB) ( 600 )   
参考文献 | 相关文章 | 多维度评价
剩余寿命预测是设备预测性维护的3个核心任务之一。目前最新的研究进展是利用机器学习来建立剩余使用寿命预测模型。论文首先梳理了设备剩余使用寿命预测主要采用的机器学习模型,包括支持向量回归模型、多层感知机模型、卷积神经网络和循环神经网络;然后介绍了3个在剩余使用寿命(Remaining Useful Life,RUL)预测中主要采用的公开数据集,以及两个广泛采用的预测性能评价指标。特色之处是基于NASA提供的涡扇发动机仿真数据集C-MAPSS展示了RUL预测建模的基本步骤和关键技术细节,详细比较了几种代表性预测模型的性能。实验结果显示浅层结构的支持向量回归模型的性能确实显著弱于包含深度神经网络的模型;而在深度神经网络中,卷积神经网络和循环神经网络又显示出了各自在挖掘复杂特征交互以及时序特征交互之间的强大能力。最后展望了剩余寿命预测技术的发展前景并讨论了面临的主要挑战。
阵列光幕测试系统目标识别方法
潘登, 蔡梦云, 王振宇, 吕家亮
计算机科学. 2022, 49 (11A): 211000109-4.  doi:10.11896/jsjkx.211000109
摘要 ( 525 )   PDF(2152KB) ( 370 )   
参考文献 | 相关文章 | 多维度评价
为了解决现有阵列光幕测试系统无法对多个连续目标信号进行判断和识别和单元探测光幕易受外界干扰的难题,提出了利用相似性系数法对单元探测光幕中光电探测器阵列输出的干扰信号进行剔除,再根据D-S证据理论对阵列光幕探测系统输出信号的目标类型进行判断和识别的方法。研究目标穿过阵列光幕测试系统输出信号的特点,给出了以阵列光幕测试系统4个单元探测光幕为证据体下的输出信号目标类型的信度函数分配,再经过融合处理得到目标识别的结果。
考虑风险规避和资金约束的低碳供应链决策研究
李莉英, 刘光安, 李小兵, 王博
计算机科学. 2022, 49 (11A): 210900104-6.  doi:10.11896/jsjkx.210900104
摘要 ( 254 )   PDF(1784KB) ( 336 )   
参考文献 | 相关文章 | 多维度评价
为了缓解低碳环境下资金约束制造商融资难的问题,在“碳限额与交易”制度下,建立了由风险中性供应商主导、损失规避制造商跟随的 Stackelberg 博弈模型。假设在制造商的融资同时用于订购和减排投资决策的情形下,分别得出了风险中性和损失规避制造商的最优订购和减排决策,以及供应商的最优批发定价决策。理论和算例分析表明,制造商的损失规避度越高,制造商将采取更加保守的订购策略,这会促使供应商提高批发价格,从而使得制造商降低减排水平。制造商的损失规避性对自身期望效用的影响与政府分配的碳排放上限有关。当碳排放上限较大时,具有较高损失规避度的制造商可以在排放权交易市场出售更多剩余的排放许可量来获得额外的收益。
基于FWA-PSO-MSVM的船舶区域配电电力系统故障诊断
高际航, 张艳
计算机科学. 2022, 49 (11A): 210800209-5.  doi:10.11896/jsjkx.210800209
摘要 ( 570 )   PDF(4369KB) ( 401 )   
参考文献 | 相关文章 | 多维度评价
故障发生会极大地影响船舶区域配电电力系统运行的安全性。为了保证船舶的安全运行,针对船舶区域配电电力系统中的10种短路故障,用MATLAB/Simulink建立船舶区域配电电力系统的电力系统仿真模型,利用SMOTE过采样对故障数据进行预处理。利用主成分分析(Principal Components Snalysis,PCA)提取出故障数据中的特征向量,并将其作为多分类支持向量机(Multiclass Support Vector Machine,MSVM)的输入进行故障诊断。为了优化诊断结果,提出烟花粒子群优化算法来优化MSVM的惩罚因子C和核函数参数γ,再与仅粒子群优化算法寻优后MSVM故障分类的结果进行对比。仿真验证结果表明,所提算法具有更高的故障分类准确率和精度。
旋转捷联惯导系统辅助的多线激光雷达新型SLAM方法
吕润, 李冠宇, 亓霈, 钱伟行, 汪澜泽, 冯太萍
计算机科学. 2022, 49 (11A): 211200088-5.  doi:10.11896/jsjkx.211200088
摘要 ( 681 )   PDF(2783KB) ( 392 )   
参考文献 | 相关文章 | 多维度评价
针对惯性传感器精度低下影响基于激光雷达/惯性信息融合的同时定位与建图(Simultaneous Localization and Mapping,SLAM)技术性能的问题,提出了一种旋转捷联惯导系统辅助下的多线激光雷达SLAM优化方案。该方案探讨了基于模糊自适应卡尔曼滤波的旋转捷联惯导对准方法,在载体运动过程中完成载体姿态与惯性传感器误差的实时修正;在此基础上,将修正后的惯性传感器数据与激光雷达点云数据进行紧耦合模式下的信息融合,以提高载体在复杂场景中运动时定位与建图的精度和实时性。实验结果表明,基于旋转惯导与多线激光雷达信息融合的SLAM方案,在保证运算实时性的同时,有效提高了激光雷达/惯性里程计的定位性能,以及点云地图的准确性。