计算机科学

第49卷第6A期目录

计算机科学. 2022, 49 (6A): 0-0.

摘要 ( 248 )

PDF(985KB) ( 718 )

相关文章 | 多维度评价

指静脉识别技术研究综述

刘伟业, 鲁慧民, 李玉鹏, 马宁

计算机科学. 2022, 49 (6A): 1-11. doi:10.11896/jsjkx.210400056

摘要 ( 1154 )

PDF(2606KB) ( 3018 )

参考文献 | 相关文章 | 多维度评价

指静脉识别因其具有活体识别、高安全性、内部特征等技术优势,已成为生物特征识别领域的研究热点之一。文中首先阐述了指静脉识别技术的基本原理及研究现状,然后针对指静脉识别过程中的主要技术,包括图像采集、传统识别方法中的图像预处理、特征提取、特征匹配,以及基于深度学习的指静脉识别,结合相关理论研究逐阶段展开论述,并对代表性的识别算法进行了概括、分析和评述。此外,全面梳理并详细介绍了指静脉识别领域常用的公开数据集,以及识别系统的相关技术评价指标,总结了指静脉识别研究尚存的主要问题,并提出了可行的解决方案,最后对指静脉识别未来的研究方向进行了展望,为后续指静脉识别的发展提供研究思路。

基于多尺度特征的脑肿瘤分割算法

孙福权, 崔志清, 邹彭, 张琨

计算机科学. 2022, 49 (6A): 12-16. doi:10.11896/jsjkx.210700217

摘要 ( 518 )

PDF(3873KB) ( 1048 )

参考文献 | 相关文章 | 多维度评价

脑肿瘤是除脑血管病外神经系统最常见的疾病,其分割也是医学图像处理领域的一个重要方向。准确地分割出肿瘤区域是治疗脑肿瘤的首要步骤。针对传统的全卷积神经网络多尺度处理能力弱而造成信息丢失的问题,提出了一种基于多尺度特征的全卷积神经网络用于脑肿瘤区域分割。利用空间金字塔池化可以获得多感受野的高级特征,从而捕获上下文多尺度信息,提高模型对不同尺度特征的适应能力;用残差紧密模块代替原有卷积层,可以缓解训练深度网络时的退化问题,提取更多的特征;结合数据增强技术,避免过拟合的同时最大程度地强化了模型的分割性能。在公开的低级神经胶质瘤核磁共振成像数据集上进行大量对比消融实验分析,以Dice系数、Jaccard指数和准确性作为分割性能的主要评价标准,获得了91.8％的Dice系数、85.0％的Jaccard指数和99.5％的准确性。实验结果表明,该方法能有效分割出脑肿瘤区域并具有一定的泛化性,且相比其他网络相比分割效果更好。

基于Transformer和LSTM的药物相互作用预测

康雁, 徐玉龙, 寇勇奇, 谢思宇, 杨学昆, 李浩

计算机科学. 2022, 49 (6A): 17-21. doi:10.11896/jsjkx.210400150

摘要 ( 1150 )

PDF(3998KB) ( 1394 )

参考文献 | 相关文章 | 多维度评价

药物相互作用的不良反应已经成为消化系统疾病、心血管疾病等发病率升高的重要原因之一,并且导致药物退出市场,因此准确预测药物相互作用受到了广泛关注。针对传统Encoder-Decoder模型无法捕捉药物子结构之间依赖的问题,提出了基于Transformer和LSTM的药物相互作用预测模型TransDDI(TransformerDDI)。TransDDI包括数据预处理模块、潜在特征抽取模块和映射模块3部分。数据预处理模块利用SPM算法从药物的SMILES格式输入中提取出表征药物的频繁子结构,形成药物特征向量,进而生成药物对的特征向量。潜在特征抽取模块利用Transformer充分挖掘特征向量中子结构之间蕴含的信息,突出不同子结构的不同重要作用,生成潜在特征向量。映射模块主要是将药物对的潜在特征向量和数据库中频繁子结构的向量形成字典表示,并且利用融合了LSTM的神经网络进行预测。在真实数据集BIOSNAP和DrugBank上,将所提模型与另外6种机器学习、深度学习方法进行实验比较。结果显示,TransDDI准确率更高,便于药物相互作用预测。

基于深度学习的黑色素瘤智能诊断多模型算法

常炳国, 石华龙, 常雨馨

计算机科学. 2022, 49 (6A): 22-26. doi:10.11896/jsjkx.210500197

摘要 ( 819 )

PDF(3517KB) ( 1300 )

参考文献 | 相关文章 | 多维度评价

皮肤黑色素瘤是一种早期发现可治愈的疾病。目前诊断黑色素瘤的主要方法是基于皮肤镜的人工目视观察,较易受医师医技水平和经验的影响,诊断准确率为75%~80%,且诊断效率低。对此,文中提出一种融合元数据和图像数据的多模态神经网络算法。元数据是通过感知机学习模型提取的患者基本信息、病灶采集部位、图像分辨率和数量的特征向量;图像数据是通过CNN模型提取的特征向量,把两个特征向量进行融合映射以获得疾病分类结果,用于黑色素肿瘤的早期辅助诊断应用。收集整理了ISIC 2019和ISIC 2020的混合数据集,共58 457条样本数据,训练样本和测试样本按照4∶1比例进行划分,分别采用所提多模态算法和卷积神经网络方法进行对比实验研究,结果表明,使用所提算法构造的黑色素肿瘤辅助诊断分类模型能够将AUC值提升1%左右,证明其具有一定的使用价值。

蓝舌病毒基因组序列多元概率特征可视化分析

陈慧嫔, 王琨, 杨恒, 郑智捷

计算机科学. 2022, 49 (6A): 27-31. doi:10.11896/jsjkx.210300129

摘要 ( 372 )

PDF(4283KB) ( 782 )

参考文献 | 相关文章 | 多维度评价

由于基因序列决定基因结构,基因结构反应生物功能性状,对病毒基因序列进行科学的数据可视化成为广泛应用的方法之一,对生物的基因序列进行可视化操作的需求日益增加。由此提出以最先进的生物信息分析学和分层结构化生物信息知识模型为基础,采用多元概率测度的方式对蓝舌病毒基因序列进行统计分析,结合计算机可视化的方法呈现蓝舌病毒在不同投影下的特征。与传统的病毒研究方法相比,此方法直观简洁,应用难度小。在不同的测量坐标下提供丰富的可视化呈现可反映蓝舌病毒的分类特征,将所提方法生成的结果与传统生物分析方法生成的系统发育树结果进行对照,可为同源性分析以及蓝舌病毒进化关系的研究提供参考,利于从多种角度深入研究蓝舌病毒。

一种新的中文电子病历文本检索模型

于家畦, 康晓东, 白程程, 刘汉卿

计算机科学. 2022, 49 (6A): 32-38. doi:10.11896/jsjkx.210400198

摘要 ( 612 )

PDF(2605KB) ( 1240 )

参考文献 | 相关文章 | 多维度评价

电子病历的增长构成用户健康大数据的基础,可提高医疗服务质量并降低医疗成本,因此迅速有效地检索病例在临床医学中具有实际意义。电子病历具有极强的专业性和独特的文本特点,然而传统的文本检索方法存在文本实体语义表达不准确、检索精度较低的不足。针对以上特点及问题,提出一种融合BERT-BiLSTM模型结构,以充分表达电子病历文本语义信息,提高检索的准确率。依据公开数据,首先,将公开的标准中文电子病历数据按临床诊断规则做关联扩展检索主题词预处理;其次,利用BERT模型,根据病历文本的上下文语境动态获取字粒度向量矩阵,再将生成的字向量作为双向长短时记忆网络模型(BiLSTM)的输入,以提取上下文信息的全局语义特征;最后,将检索文档的特征向量映射到欧氏空间中,找出与检索文档距离最近的病历文本,实现非结构化临床数据文本检索。仿真结果表明,该方法能够从病历文本中挖掘出多层次、多角度的文本语义特征,在电子病历数据集上取得的F1值为0.94,能显著提高文本语义检索准确率。

医疗CPS协作网络控制策略优化

刘丽, 李仁发

计算机科学. 2022, 49 (6A): 39-43. doi:10.11896/jsjkx.210300230

摘要 ( 699 )

PDF(2750KB) ( 816 )

参考文献 | 相关文章 | 多维度评价

医院的信息化建设已经进入了智能化时代,越来越多的医疗CPS(Cyber Physical Systems)在医院实践并应用。然而,医学学科的细化和医院知识库的缺乏,会导致医疗CPS在多并发症疾病治疗应用上的可靠性不足。文中提出了一种医疗CPS协作架构,以提高医疗CPS的决策可靠性。CPS通过协作平台向网络上的智能单元发送协作任务,响应的智能单元共同辅助CPS进行医疗决策。由于患者的生理数据是连续动态的,且医疗CPS对响应的及时性要求较高,文中进一步优化了协作网络的控制策略来提高网络通信效率,分别提出了CCD算法和HCD算法用于高级控制器和低级控制器的部署。最后,实验模拟两种算法并与K-means算法进行了指标对比,结果表明HCD算法在牺牲较少平均通信时延的情况下,大幅度提升了低级控制器的负载均衡。CCD算法更适合聚类节点少的高级控制器部署,对目标函数的优化效果明显优于HCD算法和K-means算法。

基于胸腔积液超声图像标准化方法的胸腔积液性质分析模型

冯亦凡, 徐琪, 曾卫明

计算机科学. 2022, 49 (6A): 44-53. doi:10.11896/jsjkx.210700196

摘要 ( 581 )

PDF(5466KB) ( 971 )

参考文献 | 相关文章 | 多维度评价

胸腔积液是许多重大疾病的并发症,有创的穿刺并生化检验是确定积液性质的金标准,因此一种无创的胸腔积液性质分析模型具有重大意义。提出了基于胸腔积液超声图像标准化方法的胸腔积液性质分析模型(Property Analysis Model of Pleural Effusion,PAMPE),它能无创、快速地对积液颜色、浑浊程度和李凡特试验3种实验室指标进行分类。构造PAMPE主要分为图像标准化、构建特征工程和特征筛选并使用v-SVM构建PAMPE三大步骤。提出了胸腔积液超声图像标准化方法(Standardization Of Pleural Effusion Ultrasonic Image,SOPEU)作为模型构建过程中的图像标准化方法,它削弱了超声设备参数不同、患者肥胖程度不同和胸腔积液被骨骼与膈肌遮蔽程度不同造成的图像集中图像的灰度和尺度差异。PAMPE在多种评价指标——准确率、查准率、查全率、F1-score、混淆矩阵、接收者操作特性(Receiver Operating Characteristic,ROC)曲线和ROC曲线下的面积(Area Under ROC Curve,AUC)中均表现良好,具体来说,模型在3个分类问题上的准确率分别达到0.800,0.743和0.719,查准率分别达到0.806,0.779和0.741,查全率分别达到0.921,0.815和0.893,F1-score分别达到0.860,0.796和0.809,AUC分别达到0.820,0.700和0.709,这些指标从多个角度体现出PAMPE的有效性。对比实验表明,对于这3个分类问题,PAMPE相比不使用SOPEU构造的模型分别增加了0.090,0.048和0.086的准确率。实验结果表明标准化后的图像有效地减小了数据来源不同所导致的分类误差。

基于改进CNN的低剂量CT图像肺结节自动检测

岳晴, 尹健宇, 王生生

计算机科学. 2022, 49 (6A): 54-59. doi:10.11896/jsjkx.210400211

摘要 ( 609 )

PDF(2471KB) ( 994 )

参考文献 | 相关文章 | 多维度评价

随着空气污染日益严重,肺癌已成为发病率和死亡率增长速度最快的恶性肿瘤之一,严重危害人们的生命和健康。肺癌早期主要表现为肺结节的形式,如果在肺癌早期能够及时发现并治疗,将能够提高肺癌的治疗效果。低剂量螺旋CT具有采集速度快、成本低、辐射低的特点,因此被大量应用于对肺结节的诊断。目前,CT图像的诊断多采用传统的人工诊断方式与CAD系统诊断的方式,但这两种方式存在精确性低、泛化性差的缺点。针对上述问题,文中以医学辅助诊断领域中的肺结节检测问题为研究对象,提出了一种基于改进CNN的低剂量CT图像的肺结节自动检测算法。首先,对CT图像进行预处理,提取肺实质;其次,对cascade-rcnn候选结节筛选网络进行改进,以提取更高质量的目标;然后,提出了改进3D CNN的假阳性减少网络,提高了结节分类的准确性;最后,在LUNA16数据集上进行了实验,结果表明,与现有算法相比,所提算法在检测准确率上有所提升。

基于注意力机制和多任务学习的阿尔茨海默症分类

杜丽君, 唐玺璐, 周娇, 陈玉兰, 程建

计算机科学. 2022, 49 (6A): 60-65. doi:10.11896/jsjkx.201200072

摘要 ( 803 )

PDF(2784KB) ( 1120 )

参考文献 | 相关文章 | 多维度评价

利用深度学习实现阿尔茨海默症分类已成为近年来医学图像研究热点之一。为了解决现有模型难以有效提取医学图像特征及疾病分类辅助信息资源浪费等问题,基于深度三维卷积神经网络提出一种引入注意力机制和多任务学习的阿尔茨海默症分类方法。首先,利用改进的基础C3D网络,生成较粗糙的低级特征图;然后,将其分别输入至引入注意力机制的卷积块与普通卷积块中,前者关注MRI图像的结构特性,能获取特征图中不同像素位置特有的注意力权重,与后者输出的特征图对应相乘;最后,利用不同的全连接层来实现多任务学习,获得包含主分类任务在内的3种输出,另2种输出在训练过程中通过反向传播优化主分类任务,得到优化后的阿尔茨海默症分类结果。实验结果表明,与目前已有阿尔茨海默症分类方法相比,所提方法在ADNI数据集上的分类准确率等指标均有所提升,有助于推进后续疾病分类研究。

自然语言处理在简历分析中的应用研究综述

李小伟, 舒辉, 光焱, 翟懿, 杨资集

计算机科学. 2022, 49 (6A): 66-73. doi:10.11896/jsjkx.210600134

摘要 ( 765 )

PDF(2488KB) ( 1883 )

参考文献 | 相关文章 | 多维度评价

随着信息技术的快速发展,数据产生了爆炸式的增长,互联网上每天都会新增大量的简历数据。对求职者的简历进行分析,从中获取候选人的各类人员信息、所属行业类别和进一步的工作职位推荐是学者们所关注的问题。人工分析简历效率低下的问题,推动了自然语言处理(Natural Language Processing,NLP)技术在简历分析中的广泛应用。NLP利用人工智能和计算机技术来分析、理解和处理自然语言,可实现简历的自动化分析。文中调研了近10年来的相关文献,对NLP在简历分析中的应用环节及常用方法进行了梳理。首先,对自然语言处理进行了介绍;接着,从简历信息抽取、简历分类和简历推荐3个方面分析和归纳了自然语言处理在简历分析技术中的研究进展;最后,对简历分析的研究趋势作了预测并总结了全文。

知识图谱推理研究综述

马瑞新, 李泽阳, 陈志奎, 赵亮

计算机科学. 2022, 49 (6A): 74-85. doi:10.11896/jsjkx.210100122

摘要 ( 1971 )

PDF(2519KB) ( 3539 )

参考文献 | 相关文章 | 多维度评价

近年来,随着互联网技术以及引用模式的快速发展,计算机世界的数据规模呈指数型增长,这些数据中蕴含着大量有价值的信息,如何从中筛选出知识并将这些知识进行有效组织和表达引起了广泛关注。知识图谱由此而生,面向知识图谱的知识推理就是知识图谱研究的热点之一,已经在语义搜索、智能问答等领域取得了重大成就。然而,由于样本数据存在各种缺陷,例如样本数据缺少头尾实体、查询路径过长、样本数据错误等,因此面对上述特点的零样本、单样本、少样本和多样本知识图谱推理更受瞩目。文中将从知识图谱的基本概念和基础知识出发,介绍近年来知识图谱推理方法的最新研究进展。具体而言,根据样本数据量大小的不同,将知识图谱推理方法分为多样本推理、少样本推理和零与单样本推理。模型使用超过5个实例数进行推理的为多样本推理,模型使用2～5实例数进行推理的为少样本推理,模型使用零个或者一个实例数进行推理的为零与单样本推理。根据方法的不同,将多样本知识图谱推理细分为基于规则的推理、基于分布式的推理、基于神经网络的推理以及基于其他的推理,将少样本知识图谱推理细分为基于元学习的推理与基于相邻实体信息的推理,具体分析总结这些方法。此外,进一步讲述了知识图谱推理的典型应用,并探讨了知识图谱推理现存的问题、未来的研究方向和前景。

面向超参数估计的贝叶斯优化方法综述

李亚茹, 张宇来, 王佳晨

计算机科学. 2022, 49 (6A): 86-92. doi:10.11896/jsjkx.210300208

摘要 ( 1087 )

PDF(1927KB) ( 2152 )

参考文献 | 相关文章 | 多维度评价

对绝大部分机器学习模型而言,超参数选择对模型的最终效果起到了至关重要的作用,所以超参数的选择与估计是机器学习理论与实践中的重要问题。从超参数空间中的点到模型泛化性能的映射可以看作一个具有高评估代价的复杂黑箱函数,一般的最优化方法难以适用。贝叶斯优化是一种非常有效的全局优化算法,适合求解具有解析式不明确、非凸、评估成本高等特点的优化问题,只需较少的目标函数评估就可以获得理想解。总结了贝叶斯优化在超参数估计问题上的基本理论和方法,综述了近年来该方向的研究热点和最新进展,包括代理模型、采集函数、算法实施等方面的研究,总结了现有的研究中尚待解决的问题,期望帮助初学者快速了解贝叶斯优化算法并理解典型的算法思想,为其之后的研究起到一定的指导作用。

多示例学习算法综述

赵璐, 袁立明, 郝琨

计算机科学. 2022, 49 (6A): 93-99. doi:10.11896/jsjkx.210500047

摘要 ( 1179 )

PDF(3279KB) ( 1073 )

参考文献 | 相关文章 | 多维度评价

多示例学习是一种典型的弱监督学习框架,其样本示例包是一种集合类型数据,学习过程只需要包的粗粒度类别标记,能较好适应较难获得细粒度标记的应用问题。随着近几年深度学习的快速发展,深度多示例学习逐渐引起了研究者的兴趣。对多示例学习算法的研究进展进行综述,首先依据算法的层次结构将其划分为浅层模型和深度模型;然后对两类模型的相关算法进行回顾和总结,重点分析深度多示例学习模型在池化方式上的差别,并阐述以集合型数据为训练样本的模型所需满足的对称函数基本定理及其在深度多示例学习中的应用;最后通过实验对比分析不同算法的性能,且着重剖析其可解释性,并指明未来有待深入研究的问题。

一种可快速迁移的领域知识图谱构建方法

邓凯, 杨频, 李益洲, 杨星, 曾凡瑞, 张振毓

计算机科学. 2022, 49 (6A): 100-108. doi:10.11896/jsjkx.210900018

摘要 ( 889 )

PDF(5171KB) ( 1338 )

参考文献 | 相关文章 | 多维度评价

领域知识图谱能清晰可视化地表示领域实体关系,高效准确地获取领域知识。构建领域知识图谱有助于推进相关领域的信息化发展,但构建领域知识图谱需要领域专家耗费大量的人力与时间成本,且很难迁移到其他领域中。为减少人工耗费,提升知识图谱构建方法的普适性,文中提出一种不依赖大量人工本体构建与数据标记的领域知识图谱通用构建方法;通过领域词典构建、数据获取与清洗、实体维护与链接、图谱更新与可视化4个步骤构建相关领域知识图谱。文中以网络安全领域为例构建知识图谱,详细介绍构建流程。同时,为确保图谱信息的领域相关性,文中提出一种基于BERT(Bidirectional Encoder Representations from Transformers)迁移模型与注意力机制的融合模型,该模型在文本分类中得到87.14%的F1值和93.51%的准确率。

命题逻辑中三元子句集的冗余文字

李洁, 钟小梅

计算机科学. 2022, 49 (6A): 109-112. doi:10.11896/jsjkx.210700036

摘要 ( 397 )

PDF(2901KB) ( 747 )

参考文献 | 相关文章 | 多维度评价

自动推理是人工智能领域研究的核心问题之一。由于在基于归结的自动推理过程中会产生大量的冗余文字和冗余子句,进而影响归结自动推理的效率,因此消除子句集中的冗余文字和冗余子句具有重要的意义。在命题逻辑中,依据必需文字、有用文字、无用文字的相关概念和性质,针对部分三元子句集,分类给出这些三元子句集中冗余文字的判别方法,并通过具体实例对这些判别方法进行说明。

一种基于支持向量机的主动度量学习算法

侯夏晔, 陈海燕, 张兵, 袁立罡, 贾亦真

计算机科学. 2022, 49 (6A): 113-118. doi:10.11896/jsjkx.210500034

摘要 ( 581 )

PDF(3241KB) ( 859 )

参考文献 | 相关文章 | 多维度评价

度量学习是机器学习领域的重要研究内容。度量结果的优劣会直接影响后续机器学习算法的性能。目前大多度量学习的研究工作都是在有监督环境下进行的。然而,实际应用中往往存在大量数据没有标记或需要付出昂贵代价才能获得标记的问题。针对这一问题,提出一种适用于半监督环境的基于支持向量机的主动度量学习算法(ASVM²L)。首先,从待学习无标记样本中随机选择少量样本交予专家标注,再利用这些样本训练支持向量机度量学习器;然后,根据度量学习结果,采用不同K近邻分类器对剩余未标记样本进行分类评估,选择表决差异最大的样本交予专家标注,再加入训练集重新进行度量学习;重复执行上述步骤至满足终止条件,以保证在有限的标记样本子集下能获得最佳的度量学习矩阵。在标准数据集上的对比实验验证了所提ASVM²L算法能在不影响分类精度的前提下,利用最少的标记样本获得更多的标记信息,因而具有更好的度量性能。

基于跨句上下文信息的神经网络关系分类方法

黄少滨, 孙雪薇, 李熔盛

计算机科学. 2022, 49 (6A): 119-124. doi:10.11896/jsjkx.210600150

摘要 ( 572 )

PDF(2150KB) ( 1015 )

参考文献 | 相关文章 | 多维度评价

关系分类作为信息抽取的核心任务和重要环节,能够实现实体对间语义关系的识别。近年来,深度学习在关系抽取任务中取得了显著的成果。到目前为止,研究者们的努力方向主要集中在对神经网络模型进行改进,但是对于不同句子之间语义关系密切的文本类型尚缺乏有效的方法来获取段落或篇章级别的跨句语义信息。针对此类段落或篇章级的关系抽取数据集,提出了一种将句子结合其跨句上下文信息共同作为神经网络模型输入的方法,使模型能够学习到更多段落或篇章级别的语义关联信息。在不同的神经网络模型上,分别引入了跨句上下文信息,并在不同领域的两个关系分类数据集上进行了实验,对比了引入跨句上下文信息与否对模型精度的影响,实验表明该方法能够有效提升神经网络模型的关系分类性能。此外,提出了一个基于四险一金领域政策法规文本的关系分类数据集Policy,用于验证在某些实际领域的关系分类任务中引入跨句上下文信息的必要性。

混合改进的花授粉算法与灰狼算法用于特征选择

康雁, 王海宁, 陶柳, 杨海潇, 杨学昆, 王飞, 李浩

计算机科学. 2022, 49 (6A): 125-132. doi:10.11896/jsjkx.210600135

摘要 ( 496 )

PDF(2655KB) ( 845 )

参考文献 | 相关文章 | 多维度评价

特征选择在数据预处理阶段中极为重要。特征选择的优劣不仅影响着神经网络训练的时间长短,更影响神经网络性能的好坏。灰狼改进花授粉算法(Grey Wolf Improved Flower Pollination Algorithm,GIFPA)是一种基于花授粉算法(Flower Pollination Algorithm,FPA)框架与灰狼优化算法融合的混合算法,将其应用于特征选择问题,既可以保留原始特征的内涵信息,又可以最大化分类特征的准确率。GIFPA算法在花授粉算法的异花授粉阶段中加入了最差个体信息,并用作全局搜索,将灰狼优化算法中的狩猎过程作为局部搜索,并且通过转换系数来调节二者的搜索过程。同时,为了克服群智能算法易陷入局部最优的问题,首次采用数据挖掘领域中的RelifF算法,通过RelifF算法过滤出高权重特征并用于改进最佳个体信息。为了验证算法的性能,实验选取UCI数据库中21个领域的经典数据集进行测试,利用K近邻(KNN)分类器进行分类测评,以适应度值和准确率作为评价标准,并通过K-折交叉验证来克服过拟合问题。实验选择了包括FPA算法在内的多种经典算法和先进算法进行比较,结果表明GIFPA算法在特征选择问题上有很强的竞争力。

军事指控保障领域命名实体识别语料库的构建

杜晓明, 袁清波, 杨帆, 姚奕, 蒋祥

计算机科学. 2022, 49 (6A): 133-139. doi:10.11896/jsjkx.210400132

摘要 ( 501 )

PDF(3935KB) ( 1158 )

参考文献 | 相关文章 | 多维度评价

军事指控保障领域知识图谱的构建是军队信息化装备保障过程中的一个重要研究方向。针对保障领域知识图谱构建中命名实体识别模型缺乏相应基础训练语料库的现状,在分析相关研究现状的基础上,设计并实现了一个基于PyQt5应用程序基本框架的GUI命名实体识别语料库构建系统。首先,简要说明了系统整体架构和语料处理技术流程;其次,详细介绍了系统的数据预处理、标注体系、自动标注、标注分析和编码转换五大功能模块的相关内容,其中自动标注功能模块中的自动标注和自动去重算法的实现是重难点,也是整个系统的核心;最后,通过PyQt5应用程序基本框架和各类功能组件对各功能模块进行了图形用户界面实现。本系统的设计与实现,可以在军队专用电脑上对各种原始装备手册进行自动化处理,快速生成命名实体识别模型训练所需语料库,从而为后续构建相应领域知识图谱提供有效技术支持。

基于剩余格的模糊粗糙集的拓扑性质

许思雨, 秦克云

计算机科学. 2022, 49 (6A): 140-143. doi:10.11896/jsjkx.210200123

摘要 ( 282 )

PDF(3009KB) ( 707 )

参考文献 | 相关文章 | 多维度评价

研究了基于剩余格的L-模糊粗糙集模型的拓扑结构,给出了由模糊蕴涵确定的下近似算子诱导的L-模糊拓扑并讨论了它的基本性质。其中的知识为一般L-模糊关系,无需假设其自反性及强串行性。借助L-模糊关系的传递闭包构造了相应的L-模糊拓扑的内部算子及闭包算子。研究了不同的L-模糊关系确定的下近似算子诱导的L-模糊拓扑空间之间的关系,并借助相应的拓扑提出了一种L-模糊关系分类方法。

基于不平衡数据与集成学习的属性级情感分类

林夕, 陈孜卓, 王中卿

计算机科学. 2022, 49 (6A): 144-149. doi:10.11896/jsjkx.210500205

摘要 ( 324 )

PDF(2680KB) ( 928 )

参考文献 | 相关文章 | 多维度评价

情感分类一直是自然语言处理领域的重要研究部分。该任务一般是将带有情感色彩的样本分类成正类和负类两种类别。在很多理论模型中,都假设正负类数据样本是平衡的,而在现实中正负类样本一般是不平衡的。提出一种基于属性级的LSTM集成学习的方法,针对不平衡样本数据进行属性级情感分类。首先,对数据集进行欠采样处理,将其分成多组;其次,为每组数据分配一种分类算法进行训练;最后,将多组模型融合,得到最终分类结果。一系列的实验结果显示,基于属性级的LSTM集成学习的方法明显提高了分类的准确性,其性能优于传统的LSTM模型分类方法。

融合Bert和图卷积的深度集成学习软件需求分类

康雁, 吴志伟, 寇勇奇, 张兰, 谢思宇, 李浩

计算机科学. 2022, 49 (6A): 150-158. doi:10.11896/jsjkx.210500065

摘要 ( 574 )

PDF(3362KB) ( 1014 )

参考文献 | 相关文章 | 多维度评价

随着软件数量和种类的快速增长,有效地挖掘软件需求的文本特征,并对软件功能性需求的文本特征进行分类,成为软件工程领域的一大挑战。软件功能性需求分类为整个软件开发过程提供了可靠的保障,并减小了需求分析阶段潜在的风险和负面影响。但是,软件需求文本的高分散性、高噪声、数据稀疏等特点限制了软件需求分析的有效性。提出双层词汇图卷积网络模型,创新性地对软件需求文本进行图建模,建立软件需求的图神经网络,有效捕获单词的知识边以及单词与文本之间的关系;并提出深度集成学习模型,集成多个深度学习分类模型,对软件需求文本进行分类。在数据集Windows_a和数据集Windows_b的实验中,融合Bert和图卷积的深度集成学习模型的准确率分别达到96.73%和95.60%,其明显优于其他文本分类模型,充分证明融合Bert和图卷积的深度集成学习模型能有效判别软件需求文本的功能特性,提高软件需求文本分类的准确性。

利用粒子滤波方法求解数据包络分析问题

黄国兴, 杨泽铭, 卢为党, 彭宏, 王静文

计算机科学. 2022, 49 (6A): 159-164. doi:10.11896/jsjkx.210600110

摘要 ( 445 )

PDF(2084KB) ( 688 )

参考文献 | 相关文章 | 多维度评价

数据包络分析法是一种对多投入/多产出的决策单元的生产效率进行评价的方法。数据包络分析方法被广泛应用于各个领域的效率分析问题,然而目前用于求解数据包络分析问题的方法主要是利用一些专业化的软件进行求解,整体过程专业化要求程度高。为了能够方便地求解数据包络分析问题,利用优化的思想求解数据包络分析问题。针对数据包络分析问题的优化求解,提出了一种基于粒子滤波的优化方法。系统地介绍了粒子滤波方法的基本原理,然后将优化问题转化粒子滤波的状态估计问题,从而利用粒子滤波的基本原理求解数据包络分析的优化问题,以得到一个全局最优解。最后,通过仿真实例验证了所提方法的有效性。实验结果表明,基于粒子滤波的优化方法能够准确、有效地解决数据包络分析的问题。

一种融合多层次情感和主题信息的TS-AC-EWM在线商品排序方法

余本功, 张子薇, 王惠灵

计算机科学. 2022, 49 (6A): 165-171. doi:10.11896/jsjkx.210400238

摘要 ( 545 )

PDF(2255KB) ( 701 )

参考文献 | 相关文章 | 多维度评价

电商平台信息对消费者的商品购买决策有显著影响。基于大体量的店铺与商品信息、在线评论文本进行信息融合并得出在线商品排序辅助消费者进行购买决策,具有重要的研究价值。针对上述问题,提出了一种融合多层次情感和主题信息的TS-AC-EWM在线商品排序方法,充分利用了评分信息与评论内容信息。首先,从计量与内容两个维度设计在线商品排序评价体系,体系包含4个计量指标与3个内容指标;其次,爬取各候选商品的计量指标与在线评论内容;然后,用融合主题与情感信息的TS方法以及基于追加评论的AC方法计算3个内容指标;最后,用熵权法确定指标权重,得出商品评分及排序。以京东微波炉数据集为例进行实验,证明了所提方法的可行性与有效性,因此该排序方法具有一定的现实意义。

基于图卷积网络的专利摘要自动生成研究

李健智, 王红玲, 王中卿

计算机科学. 2022, 49 (6A): 172-177. doi:10.11896/jsjkx.210400117

摘要 ( 553 )

PDF(2170KB) ( 875 )

参考文献 | 相关文章 | 多维度评价

专利说明书含有大量有用的信息,但由于篇幅很长,人们很难快速获取其中的有效信息。专利摘要是对一份完整专利说明书的总结与概述,权利要求书作为说明书的一部分,其记载的内容确定了专利申请文件的保护范围,含有专利文献的主要信息。同时经研究发现,专利的权利要求书具有特殊的结构。因此,提出了一种基于图卷积网络的专利摘要自动生成方法,旨在通过专利的权利要求书及其结构信息来生成专利摘要。该方法首先获取权利要求书中的结构信息,在编码阶段引入图卷积神经网络来融合语义信息和结构信息,从而生成高质量的专利摘要。实验结果表明,与目前主流的抽取式摘要方法和传统的编码器-解码器生成方法相比,该方法在ROUGE评价指标上有显著提高。

基于动量的映射式梯度下降算法

吴子斌, 闫巧

计算机科学. 2022, 49 (6A): 178-183. doi:10.11896/jsjkx.210500039

摘要 ( 674 )

PDF(2413KB) ( 836 )

参考文献 | 相关文章 | 多维度评价

近年来,深度学习已被广泛应用于计算机视觉问题中,并取得了卓越的成功。但研究人员发现神经网络容易受到添加微弱扰动的原始样本的干扰,导致模型给出一个错误的输出,这类输入样本称为“对抗样本”。目前已有一系列生成对抗样本的算法被提出。针对已有的对抗样本生成算法——映射式梯度下降算法(Projected Gradient Descent),提出了结合动量并采用新的损失函数的改进方法MPGD_CW算法,以确保更新方向的稳定且避免不良局部最大值的出现,同时避免交叉熵损失函数可能出现的梯度消失情况。通过与包含3种架构4个鲁棒模型的实验,证实了所提MPGD_CW算法具有更优的攻击效果和更强的攻击迁移性。

基于约束优化生成式对抗网络的数据去偏方法

徐国宁, 陈奕芃, 陈一鸣, 陈晋音, 温浩

计算机科学. 2022, 49 (6A): 184-190. doi:10.11896/jsjkx.210400234

摘要 ( 523 )

PDF(3438KB) ( 833 )

参考文献 | 相关文章 | 多维度评价

深度学习技术在图像识别、自然语言处理、金融预测等领域具有广泛应用,其分析结果一旦存在偏见将给个人和群体带来负面影响,因此在保障深度学习模型的性能不受影响的前提下提高模型的公平性至关重要。针对数据的偏见信息不只是敏感属性,属性之间的关联性使非敏感属性也会带有偏见信息,因此只考虑敏感属性的去偏算法依然存在偏见问题。为了消除数据中关联属性的敏感信息对深度学习的分类结果带来偏见,提出一种基于生成式对抗网络的数据去偏方法,模型的损失函数结合公平性约束及准确性损失两种约束优化,利用对抗式编码消除偏见信息,生成去偏数据集;并通过生成器与判别器的交替博弈训练,减少数据集无偏信息的损失,在保证主任务分类准确率的同时消除数据中的偏见,从而提高后续分类任务的公平性。最终,在多个真实数据集上展开数据去偏实验,验证了该去偏算法的有效性。

考虑一单多品的外卖订单配送时间的带时间窗的车辆路径问题

杨浩雄, 高晶, 邵恩露

计算机科学. 2022, 49 (6A): 191-198. doi:10.11896/jsjkx.210400005

摘要 ( 693 )

PDF(2375KB) ( 982 )

参考文献 | 相关文章 | 多维度评价

消费者对外卖食品需求的多样性使得外卖订单出现一单多品的结构特点,即一份订单中的外卖食品是由两个及以上商家所提供的。在一单多品的外卖配送背景下,针对带时间窗的外卖订单配送问题,研究订单配送的车辆路径规划。该研究能够提高商家的服务水平与配送车辆的效率。食品销售商家从线上平台接收到消费者的订单,此后商家根据订单打包食品,待车辆在要求的时间窗内到达并取走食品,再送往消费者手中。根据该过程,构建目标函数为配送成本最小化的数学模型,设置各个实体餐饮店和消费者的时间窗限制,利用遗传算法求解订单配送问题。最后,通过算例实验,验证了该数学模型的有效性和可行性,并从实践的角度出发,给出管理和路径规划方面的建议和启示。

基于四边形最优圈内最短路径的旅行商问题割边方法

王永, 崔源

计算机科学. 2022, 49 (6A): 199-205. doi:10.11896/jsjkx.210400065

摘要 ( 631 )

PDF(2048KB) ( 685 )

参考文献 | 相关文章 | 多维度评价

随着旅行商问题规模的增长,完全图上最优解的搜索空间呈指数增长。为了减小最优解的搜索空间,提出一种针对旅行商问题的割边算法。推导出四边形最优圈内的最短路径包含一般边与最优哈密顿圈边的不同概率,采用一定数量的四边形最优圈内的最短路径计算边频率,根据所有边的平均边频率割边,基于建立的二项分布模型推导出最优哈密顿圈内边的保留概率。任给一个完全图,割边算法有4个步骤:1)随机选取包含每条边的若干个四边形;2)采用所选四边形最优圈内的最短路径计算各边的边频率;3)步删除5/6条最小边频率的边;4)对度数小于2的节点进行添边操作。计算实验表明:保留边数为完全图上边数量的1/6左右,采用精确算法求解割边后旅行商问题的计算时间也有所减少。

TI-FastText自动商品分类算法

邵欣欣

计算机科学. 2022, 49 (6A): 206-210. doi:10.11896/jsjkx.210500089

摘要 ( 699 )

PDF(2547KB) ( 1066 )

参考文献 | 相关文章 | 多维度评价

为了实现根据商品标题信息进行商品自动分类的功能,提出了基于词频-逆文本频率(TF-IDF)的中文Fasttext商品分类方法。该方法首先利用FastText本身的特点,将词库表示成前缀树;然后对n元语法模型n-gram处理后的词典进行TF-IDF筛选,从而在计算输入词序列向量均值时,偏向高群分度的词条;最后将文本内容以字符顺序进行大小为N的窗口滑动操作,使其更适用于商品标题分类。基于Anaconda平台,对基于FastText 的商品分类算法进行实现和优化,经评估,最终的分类器准确率较高,能够满足电商平台对商品分类的需求。

基于改进麻雀搜索优化支持向量机的渔船捕捞方式识别

单晓英, 任迎春

计算机科学. 2022, 49 (6A): 211-216. doi:10.11896/jsjkx.220300216

摘要 ( 484 )

PDF(3833KB) ( 953 )

参考文献 | 相关文章 | 多维度评价

准确识别渔船的捕捞方式对监测近海渔船的捕捞行为和维护海洋生态平衡具有重要意义。为保护海洋环境,提高渔船的监管效率,提出了一种基于改进麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA)优化支持向量机(Support Vector Machine,SVM)的渔船捕捞方式识别模型。首先引入t分布变异算子对种群进行优化选择,提高了原麻雀搜索算法的全局搜索能力和局部开发能力;其次修订原麻雀算法中警戒者的位置更新公式,进一步提高了算法的收敛速度;最后用 ISSA 优化 SVM 的核函数参数和惩罚项系数,建立渔船捕捞方式识别模型。在3 546艘渔船上的实验结果表明,与原支持向量机、粒子群优化支持向量机、灰狼算法优化支持向量机和麻雀搜索算法优化支持向量机相比,文中提出的基于改进麻雀搜索优化支持向量机的渔船捕捞方式识别模型的准确率更高,而且具有更快的收敛速度。

基于多种改进策略的改进麻雀搜索算法

李丹丹, 吴宇翔, 朱聪聪, 李仲康

计算机科学. 2022, 49 (6A): 217-222. doi:10.11896/jsjkx.210700032

摘要 ( 1094 )

PDF(4076KB) ( 1185 )

参考文献 | 相关文章 | 多维度评价

针对麻雀搜索算法收敛速度慢、易陷入局部最优值、寻优精度低等缺陷进行研究,提出一种基于多种改进策略的改进麻雀搜索算法(IM-SSA)。首先,利用Tent混沌序列丰富麻雀搜索算法的初始种群,扩大搜索区域范围,并在发现者中引入自适应交叉变异算子,丰富发现者种群的多样性,平衡全局与局部的搜索能力;其次,按照每次迭代后种群个体的特点选用t-分布扰动或差分变异进行扰动,避免算法后期种群单一,提升算法跳出局部最优值的能力;最后,分别使用IM-SSA算法、灰狼算法、粒子群算法、鲸鱼算法和经典麻雀搜索算法对8个测试函数进行仿真。通过仿真结果对比分析可得,IM-SSA比其他4种算法收敛速度更快,跳出局部最优值能力更强,寻优精度更高。与当前现有改进麻雀搜索算法仿真结果的对比也表明,IM-SSA算法的改进策略更优。

具有多个突触通道的新型数值脉冲神经P系统的计算能力研究

殷秀, 刘希林, 刘希玉

计算机科学. 2022, 49 (6A): 223-231. doi:10.11896/jsjkx.210200171

摘要 ( 305 )

PDF(3646KB) ( 732 )

参考文献 | 相关文章 | 多维度评价

膜系统又称为P系统,是一种分布式并行计算模型。P系统大致可以分为细胞型、组织型和神经型三类。数值脉冲神经P系统(NSN P系统) 通过引入数值P系统(NP系统)中的数值变量和生产函数获得了处理数值信息的能力。文中在NSN P系统的基础上提出了一种具有多个突触通道的新型数值脉冲神经P系统(MNSN P系统)。在MNSN P系统中,每个生产函数都被分配了一个阈值用于控制触发,且每个神经元都有一个或多个突触通道用于传递产出值。文中主要研究了MNSN P系统的计算能力,即通过模拟注册机证明了MNSN P系统作为数字产生/接受设备是图灵通用的,并构建了一个包含70个神经元的通用MNSN P系统去计算函数。

基于DBSCAN聚类的集群联邦学习方法

鲁晨阳, 邓苏, 马武彬, 吴亚辉, 周浩浩

计算机科学. 2022, 49 (6A): 232-237. doi:10.11896/jsjkx.211100059

摘要 ( 1061 )

PDF(2918KB) ( 1449 )

参考文献 | 相关文章 | 多维度评价

联邦学习(Federated Learning)是为了解决机器学习中以隐私保护为前提的数据碎片化和隔离问题。各客户端节点在本地训练数据,将训练的模型参数信息上传到中央服务器,由参数服务器聚合参数信息以达到共同训练的目的。由于现实环境中,各节点数据之间的分布往往不一致,通过分析非独立同分布数据对联邦学习准确率的影响,来证明传统联邦学习方法得到的模型精度较低。因此,采用多样化抽样策略模拟数据倾斜度分布,提出了基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类的集群联邦学习算法(DBSCAN Based Cluster Federated Learning,DCFL),解决了联邦学习中不同节点的数据非独立同分布降低了学习准确率的问题。在Mnist和Cifar-10标准数据集上进行了实验,相比传统的联邦学习算法,基于DBSCAN聚类的集群联邦学习算法对模型的准确率有较大的提升。

一种改进的融合相似度和信任度的协同过滤算法

蔡晓娟, 谭文安

计算机科学. 2022, 49 (6A): 238-241. doi:10.11896/jsjkx.210400088

摘要 ( 595 )

PDF(1993KB) ( 816 )

参考文献 | 相关文章 | 多维度评价

电子商务的迅猛发展在给用户提供更多商务选择的同时也导致了信息的泛滥。推荐系统作为信息过滤技术中必不可少的一种方法获得了社会的普遍关注。协同过滤算法是推荐系统中应用最广泛的技术,但其面临数据稀疏性、冷启动、数据扩展性等问题。文中提出了一种改进的融合相似度和信任度的协同过滤算法,该算法包括3个步骤:首先,计算用户之间的信任度;其次,计算用户之间的相似度;最后,融合信任度和相似度以计算用户之间的信任值,从而得到最终的评分预测方程。实验结果表明,针对不同的邻域集,所提算法的性能均优于传统协同过滤算法。

自适应的集成定序算法

王文强, 贾星星, 李朋

计算机科学. 2022, 49 (6A): 242-246. doi:10.11896/jsjkx.210200108

摘要 ( 457 )

PDF(3354KB) ( 766 )

参考文献 | 相关文章 | 多维度评价

定序变量常常用来表达人们对事物的态度和偏好,例如在推荐系统中,消费者对商品的打分评价是定序变量,在自然语言处理中,情感分析的情感也是定序变量。目前学术界采用定序Logit模型来处理定序变量,但是定序Logit回归模型要求定序变量大体服从均匀分布,当自变量没能很好符合均匀分布时,定序Logit回归模型预测定序变量的结果并不理想。基于此,文中提出一种自适应的集成定序算法。首先,借助Boosting思想提出了类Boosting算法,根据定序Logit回归模型的思想构造了定序多层感知机模型和定序随机森林模型,这两个模型同Softmax多分类模型和定序Logit模型构成类Boosting算法。在处理数据中,当4个模型产生的预测值不完全相同时,该样本进入类Boosting模型继续进行训练,直到训练轮数超过某个阈值时,停止训练。然后,利用随机森林模型构建训练集的全部预测值到真实值的映射函数。所提算法在定序变量是任意分布时,仍然有较高的预测精度,极大地提升了定序Logit回归模型的适用范围。将所提算法用于白酒质量数据集、红酒质量数据集上对酒的质量进行预测时,其准确率优于定序Logit模型、多分类算法Softmax、多层感知机和KNN。

基于隐马尔可夫模型的铁路出行团体关系预测研究

王欣, 向明月, 李思颖, 赵若成

计算机科学. 2022, 49 (6A): 247-255. doi:10.11896/jsjkx.210500001

摘要 ( 377 )

PDF(2440KB) ( 702 )

参考文献 | 相关文章 | 多维度评价

近年来,随着铁路交通网络和高铁技术的不断发展,铁路出行的快捷性和舒适性得到了大幅度提高,铁路出行被更多人选择,团队出行也变得更加普遍。旅客的出行行为通常会受同行旅客的影响,不同的出行团体有不同的出行偏好,如家庭团体出行时会考虑团体中的老人和小孩,更在意舒适度;年轻人组成的团体出行时会着重考虑体验感和新鲜感。因此,出行团体类型是研究该团体出行偏好的基础。基于此,文中提出了一种利用客票数据对铁路出行团体同行关系进行预测的方法。首先,基于铁路客票数据特点,提出了铁路出行团体同行次数的量化方法;然后,对隐马尔可夫模型在客票数据分析中的适用性进行了剖析,对基于隐马尔可夫模型的铁路出行团体关系预测问题进行了形式化定义。基于真实铁路购票数据,对构建的出行团体关系模型的预测准确性以及预测结果的一致性进行了验证,实验结果显示构建的模型的预测准确率高达96.38%,对于同一出行团体在不同时刻的预测结果的一致性达95%,由此认为所提方法能够高效且准确地预测铁路出行团体中的同行关系。

SDFA:基于多特征融合的船舶轨迹聚类方法研究

郁舒昊, 周辉, 叶春杨, 王太正

计算机科学. 2022, 49 (6A): 256-260. doi:10.11896/jsjkx.211100253

摘要 ( 967 )

PDF(2569KB) ( 1186 )

参考文献 | 相关文章 | 多维度评价

随着航运业的快速发展,船舶轨迹挖掘与分析技术变得愈发重要,轨迹聚类在船舶领域有很多实际应用,如异常检测、位置预测、船舶避碰等。传统的轨迹相似度计算方法在精确度和效率上都较为低下,而现有的基于深度学习的方法大多数只提取静态特征,忽视了静态与动态的多特征的综合提取。为了解决这一问题,提出了一种基于卷积自编码器的静态-动态特征融合模型,用于提取更完善的船舶轨迹特征,弥补了多特征融合技术在船舶轨迹聚类应用方面的不足。在真实数据集上的实验结果表明,相比LCSS,DTW等传统方法以及基于深度学习的多特征提取模型,所提模型在精确率、准确率等指标上均至少有5％～10%的提升。

基于DE-LSTM模型的教育统计数据预测研究

刘宝宝, 杨菁菁, 陶露, 王贺应

计算机科学. 2022, 49 (6A): 261-266. doi:10.11896/jsjkx.220300120

摘要 ( 463 )

PDF(2735KB) ( 990 )

参考文献 | 相关文章 | 多维度评价

当前,教育大数据呈现数据量大和数据类型多样的特点,准确有效地对教育统计数据进行分析和预测,对教育部门相关政策的制定和社会的发展具有重要的参考价值。文中以某市每年的招生人数为数据基础,提出了DE-LSTM模型,该模型通过差分进化算法(DE)对长短期记忆神经网络(LSTM)中的隐含层节点和学习率进行优化,使所提模型具有较好的预测性能,并与现有的BP神经网络预测模型、LSTM神经网络预测模型进行了对比。实验结果表明,提出的DE-LSTM预测模型具有较高的预测精度。

基于用户场景的Android 应用服务推荐方法

王毅, 李政浩, 陈星

计算机科学. 2022, 49 (6A): 267-271. doi:10.11896/jsjkx.210700123

摘要 ( 438 )

PDF(3370KB) ( 678 )

参考文献 | 相关文章 | 多维度评价

随着移动设备硬件技术和5G等通信技术的发展,智能应用软件不断涌现,其提供的功能已涉及人们生活和工作的方方面面。大量的Android应用在满足人们日常生活需求的同时,也使得人们需要花更多的时间来找到他们想要启动的应用程序。为了让用户快速找到他们想要启动的应用程序并执行目标功能,文中提出了一种基于用户场景的Android应用服务推荐方法。具体来说,首先对用户场景进行分析,通过可访问性服务提取用户场景中的文本信息,然后采用基于知识库的方法,计算文本信息对应的标签,最后通过相似度计算,搜索服务库中与用户场景相关的服务,并将最相关的相似服务和互补服务推荐给用户。针对“豌豆荚”Android应用商店中的10个流行应用的300个Android应用服务进行方法评估,验证了所提方法的可行性和有效性。

基于点割集图分割的矩阵变换与分解的推荐算法

何亦琛, 毛宜军, 谢贤芬, 古万荣

计算机科学. 2022, 49 (6A): 272-279. doi:10.11896/jsjkx.210600159

摘要 ( 713 )

PDF(3239KB) ( 688 )

参考文献 | 相关文章 | 多维度评价

基于模型的协同过滤算法通过矩阵分解来将用户偏好以及物品属性用隐变量来表示,但现有的矩阵分解算法很难应对个性化推荐系统中严重的数据稀疏性以及数据变化性所带来的问题。针对上述问题,提出了基于双边块对角矩阵的矩阵分解算法。首先通过基于社区发现的点割集图分割算法将原始的稀疏矩阵转换成双边块对角矩阵,将具有相同偏好的用户以及相似特征的物品归并到同一个对角块中,然后将结构中的对角块和双边拼接成数个密度较高的子矩阵。实验结果表明,对这几个密度有提高的子矩阵进行并行分解,基于其分解结果进行原始矩阵的预测,能够有效缓解矩阵分解中数据稀疏性所带来的问题,既能提升预测的精度,又能提高推荐结果的可解释性。同时,每个子对角块都能并行独立分解,能达到提高算法效率的目的。

基于网络媒体的非线性动力学信息传播模型

杜鸿毅, 杨华, 刘艳红, 杨鸿鹏

计算机科学. 2022, 49 (6A): 280-284. doi:10.11896/jsjkx.210500043

摘要 ( 322 )

PDF(2359KB) ( 779 )

参考文献 | 相关文章 | 多维度评价

针对目前已有网络信息传播模型都假设信息网络中所有已感染节点都会感染易感染节点,不能客观地反映信息传播具有时效性的问题,文中基于平均场理论,从信息传播的宏观角度出发,提出了一个新的网络媒体信息传播动力学模型。根据网络信息传播的实际情况,所提模型假设只有新感染的节点才会感染信息网络中易感染节点,而且易感染节点有两种途径变为已感染节点,一种是社交网络中已感染节点的传播,另一种是用户随机浏览。进一步地,基于图论理论将模型中节点的状态及其转换关系抽象为加权有向图,并且基于贝叶斯定理,将节点间的状态转换表示为概率事件,给出了事件发生的概率表达式,进而确定了状态转化关系矩阵。最后,运用高斯-赛德尔迭代法对模型进行数值求解,数值仿真结果表明,在线媒体信息传播具有时效性,热点事件会在一天之内达到传播高峰,之后传播范围迅速下降。紧接着,运用百度指数热点事件的统计数据对模型进行有效性验证,结果表明,所提模型比传统模型能更准确地反映网络信息的扩散趋势。

基于密度敏感距离和模糊划分的改进FCM算法

毛森林, 夏镇, 耿新宇, 陈剑辉, 蒋宏霞

计算机科学. 2022, 49 (6A): 285-290. doi:10.11896/jsjkx.210700042

摘要 ( 371 )

PDF(3386KB) ( 767 )

参考文献 | 相关文章 | 多维度评价

传统的模糊C均值(Fuzzy C-means,FCM)算法对噪声数据敏感,并且在迭代过程中因仅考虑了距离因素,故使用欧氏距离进行距离度量,这会导致只考虑样本点之间的局部一致性特征,而忽略全局一致性特征的问题,为此,提出了一种基于密度敏感距离和模糊划分的改进FCM算法。首先在建立相似度矩阵时使用密度敏感距离替代欧氏距离来进行计算,然后在聚类过程中引入模糊熵作为约束条件,推导出新的聚类中心和具有高斯分布特性的隶属度计算公式。此外,针对传统FCM算法随机选取初始聚类中心可能导致聚类结果不稳定的问题,根据聚类中心点周围样本点比较密集以及聚类中心点之间距离较远两个原则,结合密度敏感距离来选取初始聚类中心点。最后通过实验对比表明,与传统FCM聚类算法及其派生算法相比,改进算法不仅具有更高的聚类性能和抗噪性,且收敛速度也显著提高。

基于隐半马尔可夫模型的微博流行信息检测方法

谢柏林, 黎琦, 邝建

计算机科学. 2022, 49 (6A): 291-296. doi:10.11896/jsjkx.210800011

摘要 ( 522 )

PDF(2256KB) ( 721 )

参考文献 | 相关文章 | 多维度评价

目前微博已成为人们发布信息和获取信息的一个重要平台。为了及早发现微博上的流行信息,以便及时发现微博上的热点事件,同时及时发现、抑制谣言信息的传播,使微博在网民的信息获取和信息发布中发挥更积极的作用,文中提出了一种基于隐半马尔可夫模型的微博流行信息检测方法。该方法以信息转发者的影响力等级和相邻两个转发者的时间间隔构建观测值,使用随机森林分类算法来自动得到转发者的影响力等级,利用隐半马尔可夫模型来刻画流行信息的传播过程,基于此来及早发现潜在的流行信息。该方法分为模型训练和流行信息检测两个阶段,在流行信息检测阶段,计算每条信息在传播过程中产生的观测序列相对于模型的平均对数似然概率,实时更新每条信息的流行度。使用采集的新浪微博数据集和Twitter数据集对所提方法进行了测试,实验结果表明了该方法的有效性。

一种适于多分类问题的支持向量机加速方法

陈景年

计算机科学. 2022, 49 (6A): 297-300. doi:10.11896/jsjkx.210400149

摘要 ( 367 )

PDF(1811KB) ( 740 )

参考文献 | 相关文章 | 多维度评价

支持向量机因具有卓越的分类效果和坚实的理论基础而成为了近年来模式识别、机器学习以及数据挖掘等领域中最重要的分类方法之一。然而,其训练时间会随样本增多而明显增长,并且在处理多分类问题时模型训练会更加复杂。为解决上述问题,给出了一种适于多分类问题的训练数据快速约简方法MOIS。该方法以聚类中心为参照点,在删除掉冗余训练样本的同时,选择起决定作用的边界样本来大幅度约简训练数据,并消减类别间的分布不均衡问题。实验结果表明,MOIS在保持甚至提高支持向量机分类效果的同时,能大幅提高训练效率。例如,在Optdigit数据集上,利用所提方法使分类准确率由98.94%提高到99.05%的同时,训练时间缩短到原来的15％;又如,在HCL2000前100类构成的数据集上,在准确率略有提高的情况下(由99.29%提高到99.30％),训练时间更是大幅缩短到不足原来的6%。另外,MOIS本身具有很高的运行效率。

语音风格迁移研究进展

刘畅, 魏为民, 孟繁星, 才智

计算机科学. 2022, 49 (6A): 301-308. doi:10.11896/jsjkx.210300134

摘要 ( 1004 )

PDF(3132KB) ( 1341 )

参考文献 | 相关文章 | 多维度评价

语音风格迁移技术指在不改变说话内容的前提下,将源说话人的音色或语音风格转换为目标说话人的音色或语音风格。随着人们对社交媒体隐私保护等方面的迫切需求和基于神经网络篡改技术的快速发展,语音风格迁移技术在领域内被深入研究。在语音风格迁移基本原理的基础上,从声码器、语料对齐以及迁移模型3个重要影响因素的角度对研究现状进行分析,主要包括传统声码器与WaveNet声码器、平行语料与非平行语料以及传统迁移模型与神经网络模型,归纳出目前语音风格迁移技术存在的问题与挑战,并对发展方向进行展望。

基于XGBoost算法的水稻基因组6mA位点识别研究

孙福权, 梁莹

计算机科学. 2022, 49 (6A): 309-313. doi:10.11896/jsjkx.210700262

摘要 ( 306 )

PDF(2288KB) ( 691 )

参考文献 | 相关文章 | 多维度评价

N6-甲基腺嘌呤(6mA)位点在调控真核生物的基因表达中起着至关重要的作用,准确识别6mA位点有助于理解基因组6mA位点的分布和生物功能。目前,各种实验测定方法应用于识别不同物种体内的6mA位点,但其太昂贵和耗时。基于此,文中提出了一种基于XGBoost的识别水稻基因组6mA位点模型P6mA-Rice。首先,通过引入序列核苷酸位置特异性及其他相关DNA性质,从7个方面提出了有效的特征提取准则,使其更全面地提取DNA信息;然后,基于XGBoost算法的特征重要性进行了进一步特征筛选,最终获得了特征集合P6mA;最后,在此基础之上,基于所选XGBoost分类算法,成功构建了P6mA-Rice甲基化位点识别模型。其相应的小刀实验结果表明,P6mA-Rice的敏感性为90.55%,特异性为88.48%,相关系数为79.00%,准确率为89.49%。大量实验验证了P6mA-Rice模型的有效性。

视频流的实时景深延拓算法

来腾飞, 周海洋, 余飞鸿

计算机科学. 2022, 49 (6A): 314-318. doi:10.11896/jsjkx.201100187

摘要 ( 832 )

PDF(3153KB) ( 853 )

参考文献 | 相关文章 | 多维度评价

基于图像处理的景深延拓算法(Extend Depth of Field,EDF)指提取聚焦于样本不同区域的图像中的清晰部分,将其融合到一张图像中,使融合图像中样本的各个区域都清晰。文中提出了一种针对视频流的景深延拓算法,首先通过差值图像筛选出被认为是焦面深度发生变化的图像;然后进行配准,减小融合误差;最后使用基于拉普拉斯金字塔的图像融合算法,与前一次的融合图像融合,通过重复这个过程来实现视频流的实时动态景深延拓。以基于空间域的图像融合算法和基于小波变换的图像融合算法为参照,从主观和客观角度比较了视频流场景下的运行效率和融合质量,实验结果表明基于拉普拉斯金字塔的图像融合算法具有较好的运算效率,而且对输入图像中存在离焦模糊的情况具有鲁棒性。

基于多源迁移学习的大坝裂缝检测

王君锋, 刘凡, 杨赛, 吕坦悦, 陈峙宇, 许峰

计算机科学. 2022, 49 (6A): 319-324. doi:10.11896/jsjkx.210500124

摘要 ( 358 )

PDF(3667KB) ( 961 )

参考文献 | 相关文章 | 多维度评价

针对现有深度学习方法在进行大坝裂缝检测时出现模型过拟合、计算效率低下等问题,文中提出了一种基于多源迁移学习的大坝裂缝检测方法,旨在提高算法准确率的同时,减少模型计算量,加快检测速度。所提方法首先将MobileNet网络和SSD目标检测算法相结合,形成MobileNet-SSD网络,有效减少了模型参数量并减少了计算复杂度;然后利用道路裂缝、墙壁裂缝和桥梁裂缝等多源数据进行训练,并应用迁移学习的思想,将学习到的知识分别迁移到大坝裂缝的检测模型中,以提升模型检测的精确度;最后提出了一种多模型融合方法,将通过迁移学习得到的多个检测结果进行融合,进一步提升了检测结果的重合度。

基于极大极稳定区域及SVM的交通标志检测

胡聪, 何晓晖, 邵发明, 张艳武, 卢冠林, 王金康

计算机科学. 2022, 49 (6A): 325-330. doi:10.11896/jsjkx.210300117

摘要 ( 488 )

PDF(3427KB) ( 749 )

参考文献 | 相关文章 | 多维度评价

交通标志检测在车辆辅助驾驶系统、自动驾驶等领域是一个重要研究内容,它能即时协助驾驶员或自动驾驶系统有效地检测和识别交通标志。基于该需求,提出了一种基于真实交通场景的交通标志检测方法。首先,选择合适的数据库,将数据库中的道路场景图像转换为灰度图像,并对灰度图像进行简化Gabor滤波处理,强化交通标志的边缘信息。其次,利用区域推荐算法MSERs对Gabor滤波后的特征图进行处理,形成交通标志的推荐区域。最后,通过提取HOG特征,使用SVM进行分类。通过实验,分析了简化Gabor滤波器的特征提取性能、SG-MSERs区域推荐及筛选的性能,并且得到了算法的大类分类准确率以及所需要的处理时间。实验结果表明,所提算法在GTSDB和CSTD数据集上都获得了较好的检测性能,基本满足实时处理的需求。

智能语音技术端到端框架模型分析和趋势研究

李荪, 曹峰

计算机科学. 2022, 49 (6A): 331-336. doi:10.11896/jsjkx.210500180

摘要 ( 691 )

PDF(2473KB) ( 1440 )

参考文献 | 相关文章 | 多维度评价

端到端(End-to-End)框架是一种基于深度神经网络可直接预测语音信号和目标语言字符的概率模型,从原始的数据输入到结果输出,中间的处理过程和神经网络成一体化,可脱离人类主观偏见,直接提取特征,从而充分挖掘数据信息,简化任务处理步骤。近几年,注意力机制的引入,辅助端到端架构实现了多模态间的相互映射,进一步提高了技术的整体性能。通过对近几年端到端技术在智能语音领域技术和应用的调研,端到端架构为语音模型算法提供了新的思想和方法,但也存在混合框架无法有效地平衡和兼顾单一技术特点,模型内部逻辑复杂使得人工介入调试困难、定制可扩展性减弱等问题。未来端到端一体化模型在语音领域应用方面还将有进一步的发展,一方面是前端到后端的模块端到端,忽略前端语音增强和后端语音识别中涉及多项输入的假设,将语音增强和声学建模一体化,另一方面是交互信息载体的端到端,聚焦于语音信号数据本身的信息提取和处理,使得人机交互更贴近真实人类语言的沟通方式。

基于YOLOv4的目标检测知识蒸馏算法研究

楚玉春, 龚航, 王学芳, 刘培顺

计算机科学. 2022, 49 (6A): 337-344. doi:10.11896/jsjkx.210600204

摘要 ( 802 )

PDF(4670KB) ( 1658 )

参考文献 | 相关文章 | 多维度评价

知识蒸馏作为一种基于教师-学生网络思想的训练方法,它通过复杂的教师网络来引导网络结构相对简单的学生网络进行训练,使得学生网络获得与教师网络相媲美的精度。知识蒸馏在自然语言处理和图像分类领域均有广泛的研究,而在目标检测领域的研究则相对较少且实验效果有待提升。目标检测的蒸馏算法主要是在特征提取层进行,而单一的特征提取层的蒸馏方式易导致学生不能充分学习教师网络知识,使得模型的精度较差。针对上述问题,通过在特征提取和目标分类与边框预测上都利用了教师网络的“知识”来指导学生网络进行训练,并提出了一种基于多尺度注意力机制的蒸馏算法,使得教师网络的知识更好地流向学生网络。实验分析表明,在YOLOv4基础上提出的蒸馏算法可有效地提高学生网络的检测精度。

融合交叉注意力机制的图像任意风格迁移

杨玥, 冯涛, 梁虹, 杨扬

计算机科学. 2022, 49 (6A): 345-352. doi:10.11896/jsjkx.210700236

摘要 ( 576 )

PDF(8424KB) ( 1015 )

参考文献 | 相关文章 | 多维度评价

图像风格迁移指将一张普通照片转化为一张具有其他艺术风格效果的图像,随着深度学习的发展,出现了一些图像任意风格迁移算法,给定任意风格便能生成具有该风格的风格化图像。针对任意风格迁移算法中存在如何同时适应全局和局部风格,保持空间一致性问题,提出了一个融合交叉注意力的任意风格迁移算法网络,通过捕捉长程依赖,高效生成全局与局部风格协调的风格化图像;针对风格化图像的内容结构扭曲问题,在进行风格迁移之前,加入一组并行的通道空间注意力网络,该注意力网络能进一步细化关键特征,保留关键信息;除此之外,提出了一个新的损失函数,在消除伪影的同时能更好地保留内容结构信息。该算法能根据内容图像的语义空间分布,匹配语义上最接近的风格特征,高效灵活地调整局部风格,且能保留更多内容结构的原始信息。实验结果表明,所提算法能够生成任意风格且视觉效果更佳的高质量风格化图像。

一种结合双注意力机制和层次网络结构的细碎农作物分类方法

杨健楠, 张帆

计算机科学. 2022, 49 (6A): 353-357. doi:10.11896/jsjkx.210200169

摘要 ( 364 )

PDF(5392KB) ( 717 )

参考文献 | 相关文章 | 多维度评价

细碎农作物由于单一样本的尺寸较小,单一样本之间具有一定的差异性,不能代表整个样本的特征,并且同种样本的不同等级在形状和颜色上非常相似,使得细碎农作物图像识别具有非常大的挑战性。目前,对干茶叶、大米、大豆等细碎农作物的图像分类方法的研究较为匮乏,并且研究数据集大多是在实验室环境下使用专业的设备进行拍摄的,这给实际应用带来了困难。为此,提出了一种使用手机对细碎农作物样本进行图像采集和处理的方案,并以茶叶和大米样本为例,设计了一种结合双注意力机制的层次网络结构,通过粗粒度-细粒度的分类过程,先进行粗粒度分类,即样本的不同类别,然后结合注意力机制,使网络更加关注同种类别下不同等级的样本之间的差异,从而更精确地对样本进行等级分类。最后,所提方法在采集的数据集上达到了93.9%的识别精度。

基于改进YOLOv3的空间非合作目标部件识别算法

郝强, 李杰, 张曼, 王路

计算机科学. 2022, 49 (6A): 358-362. doi:10.11896/jsjkx.210700048

摘要 ( 669 )

PDF(2705KB) ( 877 )

参考文献 | 相关文章 | 多维度评价

在使用深度学习方法进行空间非合作目标部件识别时,由于神经网络参数量大且嵌入式设备计算能力不足,难以将神经网络有效地部署在嵌入式平台上。针对该问题,文中提出了一种改进的轻量化目标检测网络,在保证检测精度的同时,有效降低网络参数量,提升了网络检测速度。所提网络模型在YOLOv3的基础上借鉴深度可分离卷积的思想,引入Bottleneck模块降低了模型参数量,提升了检测速度,同时引入Res2Net残差模块来增加模型的感受野尺度丰富性和结构深度,提高了网络对于小目标的检测能力。设计了一个新的轻量化特征提取主干网络Res2-MobileNet,并结合多尺度检测方法进行空间非合作目标部件识别。实验结果表明,相比YOLOv3,所提模型在参数量上降低了55.5%,检测速度由34fps提高到65 fps,同时对于小目标的检测效果也有显著提升。

改进注意力机制的多叉树网络多作物早期病害识别方法

高荣华, 白强, 王荣, 吴华瑞, 孙想

计算机科学. 2022, 49 (6A): 363-369. doi:10.11896/jsjkx.210500044

摘要 ( 488 )

PDF(3241KB) ( 811 )

参考文献 | 相关文章 | 多维度评价

在作物染病早期,及时获取作物病害信息,判别染病原因和严重程度,从而对症下药,能够及时防治病害扩散造成的作物产量下降。针对传统深度学习网络对作物早期病害识别方法准确率低的问题,基于病害特征图像各通道包含的信息量不同,及多层感知机(Multilayer Perceptron,MLP)能逼近任意函数的特点,提出了一种改进注意力机制的多叉树网络作物早期病害识别方法,将注意力机制融合残差网络对病害特征重校准(SMLP_Res);同时结合多叉树结构对具有较高特征提取能力的SMLP_ResNet(Squeeze-Multi-Layer Perceptron ResNet)网络进行扩展,构建的多叉树SMLP_ResNet网络模型可以简化多作物早期病害识别任务,有效提取早期病害特征。实验中使用Plant Village和AI Challenger 2018两种数据集对18层的ResNet,SE_ResNet,SMLP_ResNet这3种网络模型,以及同等结构的多叉树结构模型进行训练,验证了SMLP_Res和多叉树结构对作物病害识别模型的影响。通过实验分析得到18层的ResNet,SE_ResNet,SMLP_ResNet这3种网络模型在病害特征较明显的Plant Village数据集上病害识别的准确率均达到99%以上,但在早期病害数据集AI Challenger 2018上的准确率均不超过87%,SMLP_ResNet因加入了SMLP_Res模块,故对作物病害数据特征提取较为充分,检测结果较好。多叉树结构的3种早期病害识别模型,在AI Challenger 2018数据集上识别准确率均有明显提升,多叉树SMLP_ResNe较其余两种模型具有较好的性能,其中樱桃早期病害识别准确率为99.13%,检测结果最佳。文中提出的多叉树SMLP_ResNet作物早期病害识别模型,能够简化识别任务,抑制噪声传输,达到了较高的准确率。

一种基于Bottleneck Transformer的轻量级微表情识别架构

张嘉淏, 刘峰, 齐佳音

计算机科学. 2022, 49 (6A): 370-377. doi:10.11896/jsjkx.210500023

摘要 ( 866 )

PDF(3567KB) ( 1155 )

参考文献 | 相关文章 | 多维度评价

微表情是一种能够体现人真实情感的自发面部动作,其持续时间较短,动作幅度轻微,识别难度较大,但是有重要的研究价值。为解决微表情情感识别问题,提出了一种新型的轻量级微表情识别网络mini-AORCNN。该神经网络以顶点-起始点光流特征为输入,结合残差卷积神经网络与视觉Transformer的相关架构,可以有效完成微表情识别任务。这一网络包含一种参数量更小的新型残差模块,并用自注意力算子替换了最后一个残差块中的卷积算子,从而实现了Bottleneck Transformer架构。这一新型微表情识别网络在中科院CASME系列数据集上经过“留一被试交叉验证”(LOSO)的检验,确定其在情感分类任务上取得了73.09%的平均召回率(UAR)以及72.25%的平均F1-Score(UF1),上述准确率评价指标与极低的参数量(39 185)在与微表情领域的多种主流模型的比较中体现出了明显的优势。文中还包含了一组消融实验,确保了光学应变强度、自注意力机制和相对位置编码等设计的优越性。

改进Faster R-CNN的光学遥感飞机目标检测

祝文韬, 兰先超, 罗唤霖, 岳彬, 汪洋

计算机科学. 2022, 49 (6A): 378-383. doi:10.11896/jsjkx.210300121

摘要 ( 647 )

PDF(4953KB) ( 941 )

参考文献 | 相关文章 | 多维度评价

光学遥感图像飞机目标检测技术已广泛应用于航空交通和军事侦察等领域。针对检测多种不同尺寸飞机时小目标漏检率和虚警率高以及目标定位精度低导致的检测准确率不高的问题,文中在Faster R-CNN算法的基础上提出了一种基于双线性插值的改进ROI pooling方案,用于飞机目标检测,解决了两次量化导致的区域失配问题。实验结果表明,改进方法取得了AP(IOU≤0.5)为95.35%的检测性能,在针对多尺寸飞机检测的任务中,提高了目标定位精度和平均准确率。

基于虚拟曝光方法的单幅逆光图像增强

赵明华, 周童童, 都双丽, 石争浩

计算机科学. 2022, 49 (6A): 384-389. doi:10.11896/jsjkx.210400243

摘要 ( 541 )

PDF(5989KB) ( 846 )

参考文献 | 相关文章 | 多维度评价

逆光图像目标区域可视质量低、背景区域过度曝光,是影响图像质量的重要因素之一。针对现有的逆光图像增强方法在增强暗区细节信息时不能很好地抑制明亮区域过度增强的问题,提出了一种基于虚拟曝光的单幅逆光图像增强方法。首先,引入虚拟曝光图像,并根据参数确定最佳低曝光图像和高曝光图像;然后,使用非线性亮度增强方法和基于邻域相关对比度增强方法分别处理暗区和亮区;最后,采用拉普拉斯金字塔融合方法将暗区、亮区的细节和特征融合。使用自然图像和合成图像对所提方法进行实验,结果表明所提方法具有更少的颜色和亮度失真,视觉效果更加自然。

基于纹理特征增强和轻量级网络的人脸防伪算法

沈超, 何希平

计算机科学. 2022, 49 (6A): 390-396. doi:10.11896/jsjkx.210600217

摘要 ( 540 )

PDF(4081KB) ( 923 )

参考文献 | 相关文章 | 多维度评价

人脸防伪检测是人脸识别中较为重要的一环,对现实中的相关行业,如身份验证、安全密钥、金融支付等有着重大的意义。目前主流的基于深度学习的人脸防伪算法已经取得较为先进的效果,但仍存在部分问题,如模型参数过多,增加了实际部署的难度,而轻量级的网络结构的泛化性能并不好等。针对相关人脸防伪算法泛化能力差、参数量过大等问题,提出了一种人脸纹理信息增强方法和基于改进FeatherNet网络的人脸防伪检测算法,通过对真伪人脸信息纹理差异特征的筛选并增强作为骨干网络的输入,在骨干网络的设计上引入了DropBlock模块以及加入了多通道注意力特征图分支,在保持速度的前提下实现了泛化性能的增强。所提算法在库内测试和跨库测试上均显示出了良好的性能提升。

基于多源数据和逻辑推理的行为识别技术研究

肖治鸿, 韩晔彤, 邹永攀

计算机科学. 2022, 49 (6A): 397-406. doi:10.11896/jsjkx.210300270

摘要 ( 464 )

PDF(4476KB) ( 809 )

参考文献 | 相关文章 | 多维度评价

利用智能终端设备识别和记录人们日常行为活动对健康监测、残障人士辅助和老年人看护等具有重要意义。已有相关研究大都采用基于机器学习的思路,但都存在着诸如运算资源消耗大、训练数据采集负担重以及不同场景下扩展性低等不足,鉴于此,文中提出了一种基于多源感知和逻辑推理的行为识别技术,通过确定不同肢体之间动作的逻辑关联性,来实现对用户日常生活基础行为的准确刻画,相比已有工作,该技术方案具有运算轻量化、训练成本低及对用户和场景的多样性的扩展能力强等优势,实现了基于上述技术的行为识别系统,并开展了大量实验对系统性能进行评估。结果显示,所提方法对于走、跑、上下楼梯等11种日常行为活动的识别准确率高达90%以上。同时,对比基于机器学习的行为识别方法,所提技术大大减少了用户采集训练数据的量。

基于局部正则二次线性重构表示的人脸识别

黄璞, 杜旭然, 沈阳阳, 杨章静

计算机科学. 2022, 49 (6A): 407-411. doi:10.11896/jsjkx.210700018

摘要 ( 769 )

PDF(2767KB) ( 678 )

参考文献 | 相关文章 | 多维度评价

稀疏表示分类器(Sparse Representation based Classification, SRC)求解过程较为复杂,所耗时间较长,协同表示分类器(Collaborative Representation based Classification, CRC)将全体训练样本作为字典来表示待识别样本,字典较大且未考虑样本的类别信息,线性回归分类器(Linear Regression based Classification,LRC)并未考虑不同类样本间的差异,且忽视了样本间的距离关系和潜在的邻域关系。针对以上基于表示学习的图像分类算法的问题和不足,提出了一种基于局部正则二次线性重构表示的人脸识别方法。该方法首先计算待识别样本的类内近邻样本;其次利用类内近邻样本线性重构待识别样本;然后将待识别样本表示成所有类内重构样本的线性组合,同时根据待识别样本与类内重构样本的误差对表示系数施加约束;最后,利用拉格朗日乘子法求解表示系数并根据待识别样本重构误差与表示系数的比值判断待识别样本的类别。在AR,FRGC和FERET数据集上的实验表明,该算法具有优越的识别准确率、时间复杂度和鲁棒性。

基于GDIoU损失函数的YOLOv4绝缘子高效定位算法

马宾, 付永康, 王春鹏, 李健, 王玉立

计算机科学. 2022, 49 (6A): 412-417. doi:10.11896/jsjkx.210600089

摘要 ( 516 )

PDF(2968KB) ( 731 )

参考文献 | 相关文章 | 多维度评价

绝缘子检测是保障输电系统安全稳定的重要措施,绝缘子定位是进行检测的前提。针对目前电力巡检中绝缘子定位速度慢、精度低的问题,提出了一种基于GDIoU(Gaussian Distance Intersection over Union)损失函数的YOLOv4深度学习框架。该方案通过设计GDIoU损失函数来提高YOLOv4的定位精度和收敛速度,利用二维高斯模型提高了网络的收敛能力,增强了YOLOv4的性能,进而提高了绝缘子的定位精度与速度。同时提出绝缘子自适应旋转矫正算法,通过对单个绝缘子图像进行旋转矫正,提升了在不同空间状态下的绝缘子识别精度。实验结果表明,与朴素YOLOv4相比,所提算法的定位精度提高了7.37%。在同水平的精度下,基于GDIoU的YOLOv4绝缘子定位方法比其他绝缘子定位算法速度快了3倍以上。所提方法在精度与速度上做了较好的平衡,其性能完全满足电力巡检中绝缘子的在线定位要求。

不同数据增强方法对模型识别精度的影响

王建明, 陈响育, 杨自忠, 史晨阳, 张宇航, 钱正坤

计算机科学. 2022, 49 (6A): 418-423. doi:10.11896/jsjkx.210700210

摘要 ( 1092 )

PDF(3278KB) ( 1070 )

参考文献 | 相关文章 | 多维度评价

深度学习的效果严重依赖于数据的数量与质量,数据量不足将导致模型过拟合。而在实际应用研究中,大量的高质量样本数据往往较难获取,图像数据尤甚。针对上述问题,以ANIMAL-10数据集为基础,设计了一种基于前景目标提取,使用纯色替换原始背景以实现数据增强的方法,并结合传统数据增强方法构造了新数据集,使用AlexNet,Inception-v3,ResNet-50和VGG-16 4个神经网络模型分析不同颜色背景及不同数据增强方法对模型识别精度的影响。实验结果表明:不同颜色背景对模型识别精度无显著影响。以此为基础,采用绿色背景进行后续的数据增强操作,设计了A,B,C,D 4个数据集并对上述4个模型进行了对比实验,实验结果表明模型对识别精度有显著影响而对数据集无显著影响,但对于AlexNet和Inception-v3模型,包含突出前景数据增强数据集的识别精度较原始图像及传统数据增强方式分别提高了3.78%和4.55%,这说明在小数据集下,突出前景的数据增强方法能使模型更容易注意到并学习到图像的关键特征,从而使模型的表现更好,提高模型的识别精度,在实际的工程应用中具有一定的实践价值。

基于外接圆半径差损失的实时安全帽检测算法

陈永平, 朱建清, 谢懿, 吴含笑, 曾焕强

计算机科学. 2022, 49 (6A): 424-428. doi:10.11896/jsjkx.220100252

摘要 ( 383 )

PDF(2985KB) ( 896 )

参考文献 | 相关文章 | 多维度评价

针对安全帽检测算法的快速且精准需求,提出了一种实时安全帽检测算法。首先,针对基于边界框回归损失函数容易出现梯度消失(Gradient Vanish)的问题,本文提出外接圆半径差(Circumcircle Radius Difference,CRD)损失函数;然后,针对复杂多尺度特征融合层制约检测速度的问题,提出了一种轻量化的小目标聚焦型(Focus on Small Object,FSO)特征融合层;最后本文结合YOLO网络、CRD和FSO形成YOLO-CRD-FSO(YCF)检测模型,实现实时安全帽检测。实验结果表明,在Jetson Xavier NX设备上检测分辨率为640×640的视频,YCF的检测速度达到43.4帧/秒,比当前最新锐的YOLO-V5模型的速度快了近2帧/秒,且均值平均精度提升了近1%。说明YCF检测模型综合优化了边界框回归损失函数和特征融合层,获得了良好的安全帽检测效果。

基于局部约束特征线表示的人脸识别

黄璞, 沈阳阳, 杜旭然, 杨章静

计算机科学. 2022, 49 (6A): 429-433. doi:10.11896/jsjkx.210300169

摘要 ( 298 )

PDF(4265KB) ( 716 )

参考文献 | 相关文章 | 多维度评价

针对协同表示分类器(CRC)及其相关算法在处理人脸识别问题时面临的特征表达能力不强、鉴别能力弱等问题,提出了局部约束特征线表示分类器(LCFLRC)用于人脸识别。LCFLRC首先将待识别图像表示成其在所有特征线上的投影的线性组合,并根据待识别图像与特征线的距离对其施加约束,然后采用拉格朗日乘子法求解基于L₂范数的最优化问题,最后,根据待识别图像与其在每类特征线上的投影的重构残差大小判断待识别图像的类别。LCFLRC采用待识别图像在特征线上的投影来表示待识别图像,能够获取有限人脸图像样本中的更多变化,同时利用了待识别图像与特征线的距离信息,使得离待识别图像较近的特征线上的投影在表示待识别图像时重构系数较大,因此包含更多的判别信息。在CMU PIE,Extended Yale-B以及AR人脸库上的实验结果表明,相比其他分类算法,所提算法在图像光照、人脸表情、姿态等变化方面的识别率有显著提升。

基于离散小波变换的双域特征融合深度卷积神经网络

孙洁琪, 李亚峰, 张文博, 刘鹏辉

计算机科学. 2022, 49 (6A): 434-440. doi:10.11896/jsjkx.210900199

摘要 ( 490 )

PDF(2941KB) ( 890 )

参考文献 | 相关文章 | 多维度评价

池化操作是深度卷积神经网络的重要组成部分,也是深度卷积神经网络成功的关键因素之一。然而,在图像识别过程中,传统直接的池化操作会损失特征信息,影响识别的准确率。针对池化操作的特征信息损失问题,提出了基于离散小波变换的双域特征融合模块,以克服直接使用池化操作的缺点。该模块同时考虑了空域和通道域的双域特征融合,将池化操作嵌入在空域特征融合模块与通道域融合模块之间,有效地抑制了直接使用池化操作带来的特征信息损失。通过替换已有的池化操作,新的双域特征融合模块可以非常容易地嵌入到目前流行的深度神经网络架构中。针对图像分类问题,采用VGG,ResNet以及DenseNet等主流网络架构,在CIFAR-10,CIFAR-100,Mini-Imagenet等数据集上进行了一系列实验。实验结果表明,相比经典网络、流行的基于嵌入注意力机制网络和最新基于小波的深度卷积神经网络,所提方法可以获得更高的分类准确率。

基于CUDA核函数的多路视频图像拼接加速算法

刘云, 董守杰

计算机科学. 2022, 49 (6A): 441-446. doi:10.11896/jsjkx.210600043

摘要 ( 527 )

PDF(2214KB) ( 1340 )

参考文献 | 相关文章 | 多维度评价

目前,通用机场数量飞速增长,远程塔台发展迅猛,多路视频实时拼接技术不断改进。视频拼接算法大部分是改进特征点提取算法、特征点匹配算法和图像融合算法,改进特征点提取算法使得提取特征点更准确,改进图像融合算法使得全景图上各路图像色彩一致并且消除拼接缝,最后使用图形处理器实现加速。基于图像拼接整体计算流程,从数学角度计算原始图像到全景图像像素坐标变换矩阵和像素值变换矩阵。视频拼接时,基于像素坐标变换矩阵和像素值变换矩阵,使用核函数计算原始图像的像素点经过矩阵变换后的坐标和像素值,设置核函数被调用时的线程配置,充分利用图形处理器的并行计算能力,实现图像拼接加速。实验结果表明,拼接8张1080*1920的图像耗时约22 ms。视频拼接的核心技术包括拉流、解码、拼接、编码传输,文章结尾对其中的拉流和解码技术给出了建议。

区块链技术的研究及其发展综述

傅丽玉, 陆歌皓, 吴义明, 罗娅玲

计算机科学. 2022, 49 (6A): 447-461. doi:10.11896/jsjkx.210600214

摘要 ( 748 )

PDF(4331KB) ( 1493 )

参考文献 | 相关文章 | 多维度评价

区块链被称为下一代的价值互联网,是一种去中心化新兴加密货币的基础系统架构。自2008年中本聪提出区块链一词以来,区块链因其本身的不可篡改、可溯源、去中心化等特性而逐渐受到人们的广泛关注,其中的两个典型代表为比特币区块链系统和以太坊区块链系统。但是在目前已有的文献资料中,大多是将已有的区块链技术应用到实际生活中,而对区块链的底层的实现介绍较为模糊,应将区块链从实际的应用中抽离出来,并通过比特币区块链系统和以太坊区块链系统的设计思想及其关键技术来了解区块链的工作原理。文中主要从区块链设计的密码学原理、共识算法、数据存储结构等方面来详细介绍区块链技术的基础架构,并针对比特币白皮书和以太坊黄皮书中较模糊的概念进行了补充,从而为后面的读者提供更加深入的研究参考。最后,介绍了区块链目前的应用现状和展望。

RegLang:一种面向监管的智能合约编程语言

高健博, 张家硕, 李青山, 陈钟

计算机科学. 2022, 49 (6A): 462-468. doi:10.11896/jsjkx.210700016

摘要 ( 825 )

PDF(4023KB) ( 1141 )

参考文献 | 相关文章 | 多维度评价

为了防范金融科技创新带来的系统性风险,监管机构提出了越来越多的监管要求,增加了金融从业机构合规成本,也使监管机构与从业机构的监管摩擦日益加剧。区块链技术有助于推动监管科技创新,构建新型监管模式,但是如何在区块链上实现监管规则的数字化仍是亟待解决的问题。针对监管科技的核心需求,提出了一种面向监管的智能合约编程语言RegLang,该语言具备可交互性、可演算性和可并发性,便于监管专家将监管政策编写为数字化的监管规则,并在区块链上以智能合约的形式运行。实验表明,相比现有的编程语言,RegLang易于编写、表达力强、可读性高,支持并发运行,更加适合在区块链上表达监管规则,实现基于区块链的数字化监管。

基于智能合约的秘密重建协议

卫宏儒, 李思月, 郭涌浩

计算机科学. 2022, 49 (6A): 469-473. doi:10.11896/jsjkx.210700033

摘要 ( 343 )

PDF(2106KB) ( 815 )

参考文献 | 相关文章 | 多维度评价

针对可验证秘密共享方案设计秘密重建协议,在现实生活中参与者都是理性的条件下,利用惩罚机制并采用扣除押金的方式,对可验证性秘密共享方案验证出的恶意参与方的行为进行约束,并利用区块链的智能合约工具,根据智能合约的独立性、不可篡改性,解决了以有研究中很难解决的可信第三方问题,此协议分为本地协议和智能合约两部分,在保证安全性、秘密性的同时也能够通过对智能合约的设计实现公平性。

Python虚拟机本地代码的安全性实证研究

蒋成满, 华保健, 樊淇梁, 朱洪军, 徐波, 潘志中

计算机科学. 2022, 49 (6A): 474-479. doi:10.11896/jsjkx.210600200

摘要 ( 385 )

PDF(2006KB) ( 858 )

参考文献 | 相关文章 | 多维度评价

Python语言及生态是机器学习等人工智能系统的重要基础,已成为目前主流机器学习框架如TensorFlow,PyTorch,Caffe,CNTK等的首选实现语言。Python虚拟机本身的安全性和可靠性对这些机器学习框架的安全性提供了基础保障,但Python虚拟机CPython 内部包含大量由C/C++构建的本地代码,其安全漏洞模式尚未被充分研究和理解,系统的漏洞分析和修复技术也亟待研究。为此,提出了一个对Python 虚拟机本地代码的分析研究框架PyGuard,该框架使用静态程序分析技术对虚拟机中的本地代码进行安全性扫描和分析;利用该框架对Python语言的官方虚拟机CPython 进行了安全性实证研究,实验结果发现了最新版本的虚拟机(Cpython 3.9)中45个安全漏洞,表明了该框架对实际Python虚拟机本地代码安全性分析的有效性;基于该框架和安全性进行了实证分析,分析了虚拟机本地代码中的安全漏洞模式,给出了对安全漏洞的修复建议。

面向网络安全训练评估的受训者行为描述模型

陶礼靖, 邱菡, 朱俊虎, 李航天

计算机科学. 2022, 49 (6A): 480-484. doi:10.11896/jsjkx.210800048

摘要 ( 861 )

PDF(3874KB) ( 783 )

参考文献 | 相关文章 | 多维度评价

对受训者训练表现的评估是提升网络安全训练成效的关键环节之一,对评估方法的研究包含了基于训练结果和基于训练行为建模的评估两个阶段,前者存在无法评价训练细节的问题,后者存在仅能对部分训练路径预建模,无法判定非预设训练路径下训练行为正确性的问题。为解决上述问题,提出了一种基于有向图和有限状态自动机的双层网络安全训练评估受训者行为描述模型,结合训练行为和训练结果各自的特点,实现对非预设训练行为的正确性判定和细节评价。针对典型网络安全训练场景的实验结果表明,相比仅关注训练行为的描述模型,该模型在提高训练行为判定准确性的同时,实现了对非预设路径训练行为正确性的判定和训练细节的刻画。

抵御计时攻击的基于Knuth-Yao的二元离散高斯采样算法

梁懿雯, 杜育松

计算机科学. 2022, 49 (6A): 485-489. doi:10.11896/jsjkx.210600017

摘要 ( 564 )

PDF(2071KB) ( 1279 )

参考文献 | 相关文章 | 多维度评价

格密码被认为是能够抵抗量子计算机攻击的新型密码。整数上的离散高斯采样算法在格密码中有着重要作用,但是容易遭受计时攻击。Knuth-Yao方法是一种基于二元概率矩阵的采样方法,对其进行简单改进可以实现常数运行时间,以抵御计时攻击,但极大地牺牲了采样速度。利用二元离散高斯分布的概率矩阵的移位性质,简化了Knuth-Yao方法的实现过程,减少了概率矩阵的存储空间。基于对Knuth-Yao方法中的概率矩阵的划分思想,有效地实现了抵御计时攻击的基于Knuth-Yao的二元离散高斯采样算法,并在较大程度上保证了采样速度。实验结果表明,与常规的基于Knuth-Yao的采样算法相比,改进的抵御计时攻击的采样算法采样速度仅降低了27.6%,较好地实现了采样速度与安全性的平衡。

基于Fabric的电子病历跨链可信共享系统设计与实现

袁昊男, 王瑞锦, 郑博文, 吴邦彦

计算机科学. 2022, 49 (6A): 490-495. doi:10.11896/jsjkx.210500063

摘要 ( 940 )

PDF(4681KB) ( 1377 )

参考文献 | 相关文章 | 多维度评价

电子病历是患者敏感且重要的隐私数据资产,它的可信共享对医疗信息化发展具有重大意义。针对患者病历数据存储不安全、跨域可信共享难、访问周期长等问题,文中整合区块链与边缘计算,设计并实现了基于Fabric联盟链的电子病历跨链可信共享系统。系统主要分为患者移动应用、医院Web应用及RFID电子标签手环,主要包括病历加密与认证、跨链可信共享、远程授权等功能。此外,文中设计了基于生物特征密钥与国密算法的加密与认证机制,以患者为主体控制隐私数据流向,实现个性化隐私保护;在Hyperledger Fabric联盟链框架上应用一种主链基于改进的PBFT共识算法、从链基于PoVT共识算法的主从多链分层跨链模型,实现可靠访问与控制。通过实验与对比分析,证明了本系统在数据安全性与性能上有较大优势。

一种提高联邦学习模型鲁棒性的训练方法

闫萌, 林英, 聂志深, 曹一凡, 皮欢, 张兰

计算机科学. 2022, 49 (6A): 496-501. doi:10.11896/jsjkx.210400298

摘要 ( 834 )

PDF(3291KB) ( 1754 )

参考文献 | 相关文章 | 多维度评价

联邦学习方法打破了数据壁垒的瓶颈,已被应用到金融、医疗辅助诊断等领域。但基于对抗样本发起的对抗攻击,给联邦学习模型的安全带来了极大的威胁。基于对抗训练提高模型鲁棒性是保证模型安全性的一个较好解决办法,但目前对抗训练方法主要针对集中式机器学习,并通常只能防御特定的对抗攻击。为此,提出了一种联邦学习场景下,增强模型鲁棒性的对抗训练方法。该方法通过分别加入单强度对抗样本、迭代对抗样本以及正常样本进行训练,并通过调整各训练样本下损失函数的权重,完成了本地训练以及全局模型的更新。在Mnist以及Fashion_Mnist数据集上开展实验,实验结果表明该对抗训练方式极大地增强了联邦模型在不同攻击场景下的鲁棒性,该对抗训练基于FGSM以及PGD展开,且对FFGSM,PGDDLR和BIM等其他攻击方法同样有效。

比特币实体交易模式分析

何茜, 贺可太, 王金山, 林绅文, 杨菁林, 冯玉超

计算机科学. 2022, 49 (6A): 502-507. doi:10.11896/jsjkx.210600178

摘要 ( 363 )

PDF(4055KB) ( 885 )

参考文献 | 相关文章 | 多维度评价

比特币系统上线运行以来,人们通过比特币地址进行去中心化的转账交易,极大地增加了交易的便利性,同时点对点所产生的交易记录也成为了研究的重点。因比特币交易网络的规模巨大,直接研究整个网络需要耗费较多的时间和大量算力,也不利于观察实体内部的交易模式,因此可以按实体服务社区为对象构建和分析交易网络,并进一步探索实体行为和比特币实体服务社区内部的交易模式。通过改进传统的标签传播算法,提出了一种基于中心节点的标签传播算法,对比特币实体交易网络进行社群划分,并分析交易所、矿池等核心社群的交易模式,得到了易于理解和符合现实的交易模式。改进后的标签传播算法能够更快地收敛,且降低了社区划分结果的随机性,实验结果证明了不同服务内部交易模式的差异性,图形化的展示提升了人们对比特币交易网络的可读性。

一种基于异质模型融合的 Android 终端恶意软件检测方法

姚烨, 朱怡安, 钱亮, 贾耀, 张黎翔, 刘瑞亮

计算机科学. 2022, 49 (6A): 508-515. doi:10.11896/jsjkx.210700103

摘要 ( 579 )

PDF(2977KB) ( 1074 )

参考文献 | 相关文章 | 多维度评价

针对单一分类模型检测精度有限的问题,提出了一种基于异质模型融合的Android恶意软件检测方法。首先识别和采集恶意软件混合特征信息,采用基于CART决策树的随机森林算法和基于MLP的Adaboost算法分别构造集成学习模型,然后通过Blending算法对这两个分类器进行模型融合,最后得到一种异质模型融合分类器,在此基础上实施移动终端恶意软件检测。实验结果表明所提方法能够有效克服单一分类模型检测精度不足的问题。

基于双向蚁群算法的网络攻击路径发现方法

高文龙, 周天阳, 朱俊虎, 赵子恒

计算机科学. 2022, 49 (6A): 516-522. doi:10.11896/jsjkx.210500072

摘要 ( 713 )

PDF(3858KB) ( 1103 )

参考文献 | 相关文章 | 多维度评价

在渗透测试领域,进行攻击路径发现对实现攻击自动化具有重要意义。现有的攻击路径发现算法大多适用于静态全局环境,且存在因状态空间爆炸导致求解失败的问题。为解决动态网络环境下的攻击路径发现问题,提高路径发现效率,提出了基于双向蚁群算法的网络攻击路径发现方法(Attack Path Discovery-Bidirectional Ant Colony Algorithm,APD-BACO)。首先,对网络信息进行建模表示,定义攻击代价;然后,提出一种新的双向蚁群算法进行攻击路径发现,主要的改进包括不同的搜索策略、交叉优化操作和新的信息素更新方式等,仿真实验验证了改进的质量和效率,同时与其他路径发现方法进行对比,结果表明所提方法在较大网络规模下具有一定的时间或空间优势。在攻击路径主机发生故障时,采用重规划机制实现局部区域的攻击路径发现,更适合实际自动化渗透测试下的攻击路径发现。

符合监管合规性的自动合成新闻检测方法研究

毛典辉, 黄晖煜, 赵爽

计算机科学. 2022, 49 (6A): 523-530. doi:10.11896/jsjkx.210300083

摘要 ( 318 )

PDF(3446KB) ( 704 )

参考文献 | 相关文章 | 多维度评价

自动合成新闻已经被广泛应用于金融市场分析、事件报道等格式化新闻信息中,具有重大的社会影响。然而,采用集中式的存储方式进行监管,容易导致信息被监管者或第三方窃取和篡改。因此,在保证检测效率以及准确率的前提下保护信息不被窃取和篡改显得尤为重要。本课题提出一种符合监管合规性的自动合成新闻检测方法,目的是通过发放数据访问令牌,在确保只有监管机构能处理信息的同时将数据活动记录在分布式账本中。该方法设计了两类分布式账本,并通过智能合约调用,以实现认证授权机制和日志记录,只有诚实地参与才能获得区块链的认可并证明符合监管的合规性。此外,该方法采用轻量级的检测算法IDF-FastText赋予边缘节点计算能力,从源头上遏止各种自动合成新闻的肆意传播,实现监管的及时性。将基于GAN的GPT-2检测模型部署在服务器上以供监管机构进行检测结果的验证。最终,通过实验证明了所提设计理念的可行性。

具有仿冒攻击检测的鲁棒性说话人识别

郭星辰, 俞一彪

计算机科学. 2022, 49 (6A): 531-536. doi:10.11896/jsjkx.210500147

摘要 ( 579 )

PDF(3295KB) ( 821 )

参考文献 | 相关文章 | 多维度评价

仿冒攻击严重影响说话人识别系统的安全应用。文中提出了一种具有录音回放仿冒攻击检测能力的说话人识别系统,该系统采用前端攻击检测与后端说话人确认的串联结构,并通过信道频响分析和说话人个性特征分析提出了一种信道频响差强化倒谱系数(Channel frequency response Difference Enhancement Cepstral Coefficient,CDECC),该特征参数通过三阶多项式非线性频率尺度变换同时强化语音信号低频段和高频段的频谱分量,能够有效反映不同输入信道频率响应和不同说话人语音频谱的差异。基于ASVspoof 2017 2.0 数据库的非特定说话人文本无关录音回放攻击检测的实验表明,采用CDECC的录音回放攻击检测等错率(EER)为25.03%,相比基线系统下降了10％。通过在说话人确认的前端嵌入录音回放攻击检测模块,说话人识别系统的错误接受率(FAR)明显下降,系统EER从3.32%下降为1.01%,鲁棒性得到有效提升。

基于医疗联盟链的跨域认证方案设计

陈彦冰, 钟超然, 周超然, 薛凌妍, 黄海平

计算机科学. 2022, 49 (6A): 537-543. doi:10.11896/jsjkx.220200139

摘要 ( 827 )

PDF(3090KB) ( 1125 )

参考文献 | 相关文章 | 多维度评价

安全的跨域身份验证是保证医疗数据互联互通的关键,而现有的跨域认证模型大多依赖可信第三方,存在繁重的密钥管理开销和私钥托管问题,通过引入区块链和无证书认证技术,提出一种基于医疗联盟链的安全高效的跨域认证方案。采用哈希函数、数字签名等密码学技术实现对异域用户安全可靠的身份验证,并使用改进的实用拜占庭机制,保证在没有中心节点的情况下联盟中的医疗机构可以快速对验证结果达成一致。分析表明,在安全方面,该方案具有抵抗分布式攻击等安全属性;在效率方面,与已有跨域认证方案相比,该方案在计算开销上、通信开销上都有优势。

基于半监督学习的网络流量分析研究

庞兴龙, 朱国胜

计算机科学. 2022, 49 (6A): 544-554. doi:10.11896/jsjkx.210600131

摘要 ( 633 )

PDF(3586KB) ( 1002 )

参考文献 | 相关文章 | 多维度评价

半监督学习是一种新的机器学习方法,它将监督学习与无监督学习相结合,用少量的标签来分析大量的未标记数据集。近年来,半监督学习已成为国内外学者的研究热点之一,并被广泛应用于各个领域。随着5G等技术的兴起,网络流量数据流的复杂化、多样化给网络安全领域带来了新的挑战,因此,将半监督技术运用于网络流量数据的分析成为主要方法之一。现对当前网络流量数据特征以及处理方式进行介绍,阐述半监督学习在处理网络流量上的优势,总结了半监督学习在处理流量分析问题上的研究进展,并从半监督分类、半监督聚类和半监督降维等方面阐述了半监督学习在网络流量分析中的实际应用,最后指出了当前半监督网络流量分析方法在未来研究中面临的挑战和新的研究方向。

基于Renyi熵和BiGRU算法实现SDN环境下的DDoS攻击检测方法

杨亚红, 王海瑞

计算机科学. 2022, 49 (6A): 555-561. doi:10.11896/jsjkx.210800095

摘要 ( 569 )

PDF(3211KB) ( 1006 )

参考文献 | 相关文章 | 多维度评价

基于双向的门控循环单元(Bidirectional Gated Recurrent Unit,BiGRU)网络能够解决传统RNN模型存在的梯度消失或梯度爆炸问题,文中提出了一种基于Renyi熵和BiGRU算法实现SDN(Software Defined Network)环境下的DDoS攻击检测方法,首先应用Renyi熵进行异常流量检测,检测划分为正常、异常两种结果,检测为异常的流量将应用BiGRU(bi-gatedrecurrentunit,BiGRU)算法进行攻击检测;然后利用交换机收集流表信息,提取了6个特征向量作为攻击检测的特征向量,最后通过Mininet 模拟SDN的网络拓扑结构,基于控制器OpenDaylight完成检测。实验结果表明:相比SVM和BPNN神经网络检测算法,所提检测方案的检测准确率和识别率更高,有较好的综合检测能力。

基于SMOTE-SDSAE-SVM的车载CAN总线入侵检测算法

周志豪, 陈磊, 伍翔, 丘东亮, 梁广升, 曾凡巧

计算机科学. 2022, 49 (6A): 562-570. doi:10.11896/jsjkx.210700106

摘要 ( 642 )

PDF(6362KB) ( 941 )

参考文献 | 相关文章 | 多维度评价

随着车联网中车载装备智能化程度的飞速发展,其与互联网对接的程度日益加深,而车载CAN总线受到的网络攻击数量更多、攻击方式更复杂、攻击特征更隐蔽。目前车联网入侵检测才刚起步,基于防火墙或规则库等传统检测模型无法获取隐藏的深层攻击特征,基于深度学习的智能检测模型又因训练参数多、攻击数据不均衡等呈现过/欠拟合以及训练复杂等问题。针对以上问题,文中以车载CAN总线为对象,提出了一种基于SMOTE-SDSAE-SVM的CAN总线入侵检测方法(简称3S),尝试结合深度学习和机器学习理论,从而同时提取网络攻击的深度特征和保证模型训练的高效性,并解决网络攻击类别不平衡、CAN报文含噪声等问题。首先,为了解决网络攻击类别不平衡问题,利用SMOTE技术对不平衡类别的攻击数据进行近邻采样,从而生成更多同类别近似样本;其次,结合稀疏自编码和去噪自编码,以消除噪声数据的影响同时增加特征提取的时效性,并通过堆叠多层稀疏去噪自编码最终实现CAN报文的深度特征提取;最后,利用SVM对提取的深度特征进行精确分类,实现对CAN报文的异常检测,从而发现网络攻击。通过在沃尔沃CAN数据集和CAR-HACKING数据集上的大量实验,有效证明了本文3S算法较其他算法而言拥有更好的入侵检测准确率和更低的漏报率/误报率。

一种基于热带半环的密钥建立协议的安全性分析

黄华伟, 李春华

计算机科学. 2022, 49 (6A): 571-574. doi:10.11896/jsjkx.210700046

摘要 ( 390 )

PDF(1846KB) ( 658 )

参考文献 | 相关文章 | 多维度评价

分析了Grigoriev等提出的基于热带半环的密钥建立协议的安全性,提出了一种代数密码分析方法。从协议的公开信息构造热带矩阵方程,通过解热带半环上的线性方程组试图获得双方的共享密钥。为防止这种代数密码分析,应适当增大协议的参数。

基于隐私保护的反向传播神经网络学习算法

王健

计算机科学. 2022, 49 (6A): 575-580. doi:10.11896/jsjkx.211100155

摘要 ( 434 )

PDF(1942KB) ( 929 )

参考文献 | 相关文章 | 多维度评价

反向传播神经网络学习算法已经被广泛地应用在医疗诊断、生物信息学、入侵检测、国土安全等领域。这些应用领域的共同点是,都需要从大量的复杂的数据中抽取模式和预测趋势。在以上这些应用领域中,如何保护敏感数据和个人隐私信息是一个重要的问题。目前已有的反向传播神经网络学习算法,绝大多数都没有考虑在学习过程中如何保护数据的隐私信息。文中为反向传播神经网络提出基于隐私保护的算法,适用于数据被水平分割的情况。在建造神经网络的过程中,需要为训练样本集计算网络权向量。为了保证神经网络学习模型的隐私信息不被泄露,本文提出将权向量分配给所有参与方,使得每个参与方都具有权向量的一部分私有值。在对各层的神经元进行计算时,使用安全多方计算协议,从而保证神经网络权向量的中间值和最终值都是安全的。最后,被建造好的学习模型被所有参与方安全地共享,并且每个参与方可以使用该模型为各自的目标数据预测出相应的输出结果。实验结果表明,所提算法在执行时间和准确度误差上比传统非隐私保护算法更具优越性。

未知网络攻击识别关键技术研究

曹扬晨, 朱国胜, 孙文和, 吴善超

计算机科学. 2022, 49 (6A): 581-587. doi:10.11896/jsjkx.210400044

摘要 ( 901 )

PDF(3465KB) ( 1133 )

参考文献 | 相关文章 | 多维度评价

入侵检测是一种主动防御网络中攻击行为的技术,在网络管理方面起着至关重要的作用,而传统的入侵检测技术无法识别未知攻击,也是长期困扰本领域的难题。针对未知类型的入侵攻击,提出了K-Means与FP-Growth算法相结合的未知攻击识别模型,以实现对未知攻击的规则进行提取。首先,对于多种未知攻击混合的数据,根据样本间的相似性用K-Means进行聚类分析,引入轮廓系数评估聚类的效果,聚类完成之后,同种未知攻击被分到相同的簇中,人工提取未知攻击的特征,对特征数据进行预处理,将连续型特征离散化,然后用FP-Growth算法挖掘未知攻击数据的频繁项集和关联规则,最后对其进行分析,得出该未知攻击的规则,用规则对该类型的未知攻击进行检测,结果表明,所提模型的准确率可达98.74%,优于其他相关模型。

基于进化神经网络的电力信息网安全态势量化方法

吕鹏鹏, 王少影, 周文芳, 连阳阳, 高丽芳

计算机科学. 2022, 49 (6A): 588-593. doi:10.11896/jsjkx.210200151

摘要 ( 389 )

PDF(3632KB) ( 748 )

参考文献 | 相关文章 | 多维度评价

电力信息网面临着日益严峻的网络攻击风险威胁,传统网络安全态势量化方法仅从网络性能角度进行分析,忽略了各种电力应用业务的重要性对安全态势的影响,导致量化结果难以全方位反映电力信息网络风险状态。文中提出一种基于进化神经网络的电力信息网安全态势量化方法,首先,通过分析电力通信网络应用业务特点,设计面向电力通信网的安全态势体系架构(PIN-NSSQ);其次,从网络可靠性、威胁性、脆弱性3个维度出发,结合电力业务重要性,建立耦合互联的空间要素指标体系,并实现关键要素指标的数学化表征;然后,将遗传进化算法优化的BP神经网络融入要素指标计算过程中,构建基于进化神经网络的电力信息网安全态势量化模型,有效实现对电力信息网络安全态势全面感知过程的高效计算及结果精确量化;最后,根据某电力部门网络拓扑搭建仿真实验环境,验证了所提方法的有效性和鲁棒性。

面向无尺度图的Δ-stepping算法改进策略

陈钧吾, 余华山

计算机科学. 2022, 49 (6A): 594-600. doi:10.11896/jsjkx.210400062

摘要 ( 571 )

PDF(2317KB) ( 807 )

参考文献 | 相关文章 | 多维度评价

单源最短路径问题是图算法理论中的经典问题,目的是在带权图上搜索一个源点到其他各个顶点的最短路径。Δ-stepping算法结合了经典Dijkstra算法和Bellman-Ford算法的优势,被广泛用于并行环境的单源最短路径计算。大规模网络的结构按照连接偏好机制演化,其顶点的度数分布呈显著的倾斜特征。基于大规模网络的倾斜性,提出了对Δ-stepping算法的两类改进策略。通过预处理计算任意两个顶点之间的距离上限,实现对边松弛操作的调度优化,提高单源最短路径计算的效率以及在并行环境中的伸缩性。首先,把权重超过所关联顶点之间距离上限值的边标记出来,在单源最短路径计算时,直接跳过这些边,从而减少计算过程中被松弛的边的数量。其次,利用顶点之间距离的上限值动态优化顶点的松弛顺序,只有一个顶点到源点的当前路径的长度不超过它们之间的距离上限值时,才松弛该顶点关联的边,从而减少这些边上的重复松弛操作。测试结果表明,与Graph500实现的Δ-stepping算法相比,改进后的算法在Graph500的基准测试图上有接近10倍的性能提升,在一些真实图上也有2.68～5.58倍的性能提升。

D2D辅助移动边缘计算下的卸载策略优化

方韬, 杨旸, 陈佳馨

计算机科学. 2022, 49 (6A): 601-605. doi:10.11896/jsjkx.210200114

摘要 ( 630 )

PDF(2567KB) ( 922 )

参考文献 | 相关文章 | 多维度评价

移动边缘计算(Mobile Edge Computing,MEC)因具备资源下沉等特性能够为用户提供便捷的计算服务。为了进一步降低海量用户以及智能应用带来的卸载压力,考虑利用终端直传(Device-to-Device,D2D)通信技术实现用户闲置计算资源的合理利用。即除本地计算外,计算密集型用户还可以启用D2D通信方式,将复杂计算任务卸载至已配对的帮助用户。首先,将优化问题建模为最小化全网用户的累积时延。然后,为了分析多用户间的资源竞争问题和降低复杂度,引入博弈论,将优化问题建模为多用户合作卸载博弈,并证明所提博弈为精确势能博弈且拥有至少一个纯策略纳什均衡解。同时,提出基于较优响应的分布式卸载算法来实现问题的求解。最后,仿真结果表明,所提博弈模型和算法能够有效降低全网用户的总时延和平均用户时延,验证了工作的可行性及有效性。

基于无迹粒子滤波的WiFi-PDR融合室内定位技术

周楚霖, 陈敬东, 黄凡

计算机科学. 2022, 49 (6A): 606-611. doi:10.11896/jsjkx.210700108

摘要 ( 440 )

PDF(2658KB) ( 849 )

参考文献 | 相关文章 | 多维度评价

为提高室内定位的精度和稳定度,文中提出了一种基于无迹粒子滤波的WiFi-PDR融合的室内定位方法。为降低室内复杂环境对WiFi定位的影响,采用加权路径损失算法改善WiFi定位;为降低行人航迹推算误差累积效应,通过设定参考值划分行走周期并对加速度数据进行平滑降噪处理,提高了步数计量的精度;在改进WiFi和PDR定位的基础上,提出使用无迹粒子滤波融合定位方法,并对粒子滤波进行抗差自适应优化,提高其鲁棒性。实验仿真结果表明该方法可以有效提高室内定位的精度和稳定性。

一种基于有向感知区域调整的强栅栏构建算法

王方红, 范兴刚, 杨静静, 周杰, 王德恩

计算机科学. 2022, 49 (6A): 612-618. doi:10.11896/jsjkx.210300291

摘要 ( 476 )

PDF(3287KB) ( 768 )

参考文献 | 相关文章 | 多维度评价

K-栅栏覆盖是有向传感器网络的研究热点之一。传统栅栏构建算法消需要耗大量节点能量,降低了网络寿命。文中创新性地利用有向节点感知区域的可调特性,不消耗节点能量,可高效构建栅栏。首先,创建有向可调感知模型,揭示感知区域的调整规律,使相距较远的两个节点不靠移动形成连续感知区域。接着,提出一种基于感知区域可调特性的有向强栅栏构建方法,优化调整感知区域,分布式选择最优节点,构建有向强栅栏。仿真结果证明,相比依赖于节点运动的传统栅栏构建算法,所提栅栏构建方法能够用更少的资源构建栅栏,有效延长网络寿命,具有重要的理论与实际意义。

多无人机使能移动边缘计算系统中的计算卸载与部署优化

刘漳辉, 郑鸿强, 张建山, 陈哲毅

计算机科学. 2022, 49 (6A): 619-627. doi:10.11896/jsjkx.210600165

摘要 ( 842 )

PDF(2868KB) ( 868 )

参考文献 | 相关文章 | 多维度评价

无人机与移动边缘计算技术的结合突破了传统地面通信的局限性。无人机所提供的有效视距信道可大大改善边缘服务器与移动设备之间的通信质量。为了进一步提升移动边缘计算系统的服务质量,设计了一种多无人机使能的移动边缘计算系统模型。在该系统中,无人机作为边缘服务器为移动设备提供计算服务,通过联合优化无人机部署与计算卸载策略实现平均任务响应时间的最小化。基于问题定义,提出了一种PSO-GA-G双层嵌套联合优化方法,该方法的外层采用了结合遗传算法算子的离散粒子群优化算法(Discrete Particle Swarm Optimization Algorithm Combined with Genetic Algorithm Operators,PSO-GA),实现了对无人机部署位置的优化;而该方法的内层则是采用了贪心算法(Greedy Algorithm),实现了对计算卸载策略的优化。大量仿真实验验证了所提方法的可行性和有效性。实验结果表明,相比其他基准方法,所提出方法可以实现更短的平均任务响应时间。

改进灰狼算法的无线传感器网络覆盖优化

范星泽, 禹梅

计算机科学. 2022, 49 (6A): 628-631. doi:10.11896/jsjkx.210500037

摘要 ( 511 )

PDF(2161KB) ( 811 )

参考文献 | 相关文章 | 多维度评价

如何利用移动节点实现覆盖的最大化并减少能量的使用是研究无线传感器网络的一个重要方向。基于Circle映射,改进了莱维飞行策略;结合能量位置融合机制,用优化后的灰狼算法对无线传感器网络覆盖问题进行求解。首先,引入的Circle映射大幅改善了狼群的多样性,从而能实现更加有力的搜索;其次,改进后的莱维飞行策略平衡了不同时期对全局搜索和局部寻优的需求,一定程度上加快了搜索进程,提高了收敛速度;最后考虑能量和位置的交融,每个个体不再单一考虑位置,而是结合一部分能量因素来进行移动。仿真结果表明,未考虑能量受限的改进后的灰狼算法较基本灰狼算法覆盖率有所提升,和其他文献中的算法相比,也具有更高的收敛速度和覆盖率。在考虑能量受限以后,不但保证了覆盖率,还延长了节点寿命。

存在CSI估计错误的增强型ELM叠加CSI反馈方法

卿朝进, 杜艳红, 叶青, 杨娜, 张岷涛

计算机科学. 2022, 49 (6A): 632-638. doi:10.11896/jsjkx.210800036

摘要 ( 299 )

PDF(3587KB) ( 658 )

参考文献 | 相关文章 | 多维度评价

在大规模多输入多输出(Massive-Multiple Input and Multiple-Output,mMIMO)系统中,叠加信道状态信息(Channel State Information,CSI)反馈可避免上行带宽资源占用,但叠加干扰会造成接收机计算复杂度高、反馈精度低等问题,且均未考虑存在CSI估计错误的实际应用场景。为此,针对存在CSI估计错误场景下的叠加CSI反馈,在改进极限学习机(Extreme Learning Machine,ELM)的基础上,提出基于增强型ELM的叠加CSI反馈方法。首先,基站对接收信号进行预均衡处理,初步消除上行信道干扰;然后对传统叠加CSI反馈进行迭代展开,构建增强型ELM网络,通过规范化各个ELM网络的隐藏层输出来增强网络学习数据分布的能力,从而改善恢复下行CSI和上行用户数据序列(Uplink User Data Sequence,UL-US)的精确性。仿真实验表明,与经典和时新的叠加CSI反馈方法相比,所提方法能够获得相似或更好的下行CSI和上行用户数据的恢复精确性;同时,针对不同的参数影响,性能改善具有鲁棒性。

基于服务器集群的负载均衡优化调度算法

田真真, 蒋维, 郑炳旭, 孟利民

计算机科学. 2022, 49 (6A): 639-644. doi:10.11896/jsjkx.210800071

摘要 ( 544 )

PDF(2363KB) ( 1002 )

参考文献 | 相关文章 | 多维度评价

为了解决服务器集群在处理并发任务请求时请求分配不均衡和任务完成时间较长等问题,提出了一种基于布谷鸟搜索的集群负载均衡多目标优化调度算法。首先,依据服务器集群的任务请求分配特点,通过监控、记录服务器实时负载信息,构建与服务器实时负载信息相关的、以最小化任务完成时间和增强负载均衡有效度为目标函数的优化模型,确定决策变量为任务请求与服务器的匹配集。然后通过引入带精英策略的非支配排序布谷鸟搜索算法对决策变量进行迭代寻优,在适应度函数的选择更新下,找到符合全局最优的Pareto解集,调度机制根据确定最优的匹配集进行任务的调整与转发。仿真结果表明,所提调度算法在保证负载均衡的条件下能够尽可能地缩短任务完成时间,相比其他算法模型,其可扩展性效果更好。

早期量子算法在量子通信、量子纠错等领域的应用

Renata WONG

计算机科学. 2022, 49 (6A): 645-648. doi:10.11896/jsjkx.210400214

摘要 ( 509 )

PDF(1811KB) ( 723 )

参考文献 | 相关文章 | 多维度评价

当今量子算法的一个发展方向是对早期量子算法的再思考。在量子计算领域,每一种早期量子算法都提出了突破性概念。一般认为它们在很大程度上仅属理论范畴,原因它们所求解的问题几乎都没有实用价值。但这些早期量子算法依然重要,因为它们在解决问题的速度上相比经典算法呈指数级别的增长。文中做了两件工作:一方面详细阐述对早期量子算法再思考的最新进展,另一方面则对早期量子算法进行所谓的重新目的化,即重新用于量子密钥分发、纠错等领域。Deutsch-Jozsa算法、Bernstein-Vazirani算法和Simon算法是关注的重点。Deutsch-Jozsa算法用于判定多引数函数(Multi-argument Function)是平衡的还是常数的。最近的研究表明,其应用可以扩展到量子通信和形式语言(Formal Languages)领域。Bernstein-Vazirani算法能够搜索出在函数中编码的字符串,其应用可以扩展至量子密钥分发领域和通信中对信息的纠错处理。Simon算法则用于求解具有特定属性字符串的识别问题,它的现代应用包括量子通信和纠错。

Shor整数分解算法的线路优化

刘建美, 王洪, 马智

计算机科学. 2022, 49 (6A): 649-653. doi:10.11896/jsjkx.210600149

摘要 ( 622 )

PDF(2652KB) ( 887 )

参考文献 | 相关文章 | 多维度评价

借助加窗技术和模整数的陪集表示技术,在加法的近似编码表示基础上给出Shor算法量子线路的整体优化和资源估计,并对设计的量子线路进行了仿真实验。借助加窗技术和模整数的陪集表示技术可以有效减少Toffoli门的数目以及降低整个量子线路的深度,其中Toffoli门数目为0.18n³+0.000 465n³log n,线路深度为0.3n³+0.000 465n³log n。由于采用加窗的半经典傅里叶变换,使得空间资源代价为3n+O(log n)个量子比特。在增加少量近似误差(误差可以随着填充数目的增加呈指数减小)的前提下,实现了时间空间资源代价的折衷。

面向供应链风险评估的改进BP小波神经网络研究

徐佳楠, 张天瑞, 赵伟博, 贾泽轩

计算机科学. 2022, 49 (6A): 654-660. doi:10.11896/jsjkx.210800049

摘要 ( 477 )

PDF(2507KB) ( 703 )

参考文献 | 相关文章 | 多维度评价

针对供应链风险在制造行业上下游企业之间产生的影响,首先以供应链运作参考(Supply Chain Operation Reference,SCOR)模型为基础,以汽车制造企业为研究背景,通过对汽车供应链风险进行分析并结合现场调研结果,研究了供应链风险指标识别过程,建立了涉及战略计划风险等五大风险类别的评价指标体系。其次,鉴于BP神经网络模型在优化评估过程中容易出现局部最优解等问题,通过增加动量对其改进优化,同时用Morlet小波函数替换基础评价模型中的S型函数,重构供应链风险评价模型。最后,通过汽车企业实际案例进行风险识别与评估研究,采用Matlab进行仿真,对比分析改进BP小波神经网络与模糊综合评价、BP神经网络、增加动量的BP神经网络,结果表明,改进的BP小波神经网络模型具有良好的实用性和可靠性。

机械零件加工工艺本体库构建

王钰珏, 梁宇豪, 王素琴, 朱登明, 石敏

计算机科学. 2022, 49 (6A): 661-666. doi:10.11896/jsjkx.210800013

摘要 ( 318 )

PDF(3458KB) ( 1123 )

参考文献 | 相关文章 | 多维度评价

针对企业普遍存在无法深度利用散布在各应用系统中的典型零件加工数据资源问题,提出通过建立典型零件加工工艺本体库,实现典型机械零件加工工艺数据全面融合。首先,将典型零件加工工艺知识归纳为理论知识和工艺知识两类,利用本体建模语言OWL建立完整的典型零件加工工艺本体库。希望这项研究成果能够为构建典型零件加工全要素的智能制造提供有力支持。

基于螺旋进化萤火虫算法和BP神经网络的模型及其在PPP融资风险预测中的应用

朱旭辉, 沈国娇, 夏平凡, 倪志伟

计算机科学. 2022, 49 (6A): 667-674. doi:10.11896/jsjkx.210800088

摘要 ( 616 )

PDF(3275KB) ( 757 )

参考文献 | 相关文章 | 多维度评价

政府和社会资本合作(PPP) 项目能够完善基础设施建设、保障民生与促进经济发展,但也存在资金退出困难、建设周期长、参与主体多等缺陷,项目运营失败将直接损害各方投资者的收益,造成社会资源的浪费,故亟需对PPP融资风险进行科学、准确地预测。文中提出一种基于螺旋进化萤火虫算法(SEGSO) 和BP神经网络(BPNN) 的预测模型,并将其应用于PPP融资模式风险预测。首先采用佳点集理论进行种群初始化,引入交互机制、精英种群策略以及螺旋进化方式,提出螺旋进化萤火虫算法。然后运用SEGSO算法进行参数寻优,搜索BPNN的最优参数组合,构建基于SEGSO和BPNN的预测模型SEGSO-BPNN。最后在5个测试函数上验证了SEGSO算法的性能优势,在7个UCI标准数据集上的实验结果表明了所提模型的显著性和有效性。将所提模型应用于中国PPP项目的风险预测,取得了较好的效果,为PPP融资风险预测提供了一种新方法。

基于CNN-LSTM的卫星云图云分类方法研究

王杉, 徐楚怡, 师春香, 张瑛

计算机科学. 2022, 49 (6A): 675-679. doi:10.11896/jsjkx.210300177

摘要 ( 520 )

PDF(3545KB) ( 1410 )

参考文献 | 相关文章 | 多维度评价

卫星云图分类一直都是气象领域的研究热点之一,但存在同一云型光谱特征不同、不同云型光谱特征相同以及主要利用点云光谱特征而忽视空间特征等问题。针对以上问题,提出一种基于CNN-LSTM网络的卫星云图云分类方法,充分利用光谱信息和空间信息来提升云分类准确率。首先,根据云的物理特性对光谱特征进行筛选,并结合点云的正方形邻域作为点云的空间信息;然后,通过卷积神经网络(Convolutional neural network,CNN)自动提取空间特征,解决了单用光谱特征分类难的问题;最后,在此基础上结合长短时记忆网络(Long short-term memory,LSTM)提取的空间局部差异特征,为卫星云图分类提供多角度特征,解决了云块空间结构相似导致误判的问题。实验结果表明,所提方法对卫星云图的整体分类准确率达到93.4%,相比单一CNN方法的整体云分类准确率提高了2.7%。

数据科学与大数据技术课程体系的复杂网络分析

杨波, 李远彪

计算机科学. 2022, 49 (6A): 680-685. doi:10.11896/jsjkx.210800123

摘要 ( 803 )

PDF(6398KB) ( 1087 )

参考文献 | 相关文章 | 多维度评价

近年来,越来越多的高校开始开设数据科学与大数据技术专业,作为一个多学科交叉的新兴热门宽口径专业,其课程体系仍在进一步完善中。文中运用复杂网络方法对从互联网上收集到的106所高校的课程数据进行了分析和可视化,分别构建了课程共现网络和开设院校关系网络。对于耦合度较高的课程共现网络,提出了一种基于边权的壳层分解算法,对课程重要性进行逐层分析,并将所得结果与词频统计和由Apriori算法获取的频繁项集结果进行了对比分析。考虑到该专业可授予理学或工学学位,又将数据集划分为理学和工学两部分进行了分析和可视化。本研究的开展能够给即将开设或者已经开设数据科学与大数据技术专业的院校提供一定的参考,同时也为高耦合网络的分析提供一种有效的算法。

基于改进人工势场的未知障碍物无人机编队避障

陈博琛, 唐文兵, 黄鸿云, 丁佐华

计算机科学. 2022, 49 (6A): 686-693. doi:10.11896/jsjkx.210500194

摘要 ( 523 )

PDF(3556KB) ( 823 )

参考文献 | 相关文章 | 多维度评价

随着无人机相关技术的成熟,无人机的发展前景和潜在的应用场景也被越来越多的人所认识,其中无人机编队能够打破单个无人机在载荷和任务种类等方面受到的限制,因此无人机编队飞行是未来重要的发展方向。在飞行的过程中,无人机编队可能会受到新建高楼、临时禁飞区等未知障碍物的限制。目前避障方法的主要关注点是在出发前且障碍物信息已知的条件下,为二维场景下的无人机生成不与障碍物相交的参考路径。但是这种方法不够灵活,无法满足在实际三维环境前进的过程中避开这些未知障碍物的要求。文中提出一种碰撞风险感知的编队防碰撞系统(Formation Collision Avoidance System,FCAS),通过对无人机的运动趋势进行分析,筛选出编队中最有可能发生碰撞的无人机;通过改进人工势场(Improved Artificial Potential Field,iAPF)对未知障碍物进行躲避,能够有效避免避障过程中编队中无人机间的碰撞,有效减少编队内部通信链路的数量,将障碍物对无人机编队的影响降到最低。在完成避障后,所有无人机将重新保持原来的队形并返回参考路径。模拟实验显示,该系统使无人机编队在参考路径飞行过程中能够处理静态未知障碍物,并最终无碰撞地抵达终点,验证了策略的可行性。

基于前景理论的微信健康信息质量三方博弈分析

王显芳, 张亮, 张宁

计算机科学. 2022, 49 (6A): 694-704. doi:10.11896/jsjkx.210900186

摘要 ( 494 )

PDF(4001KB) ( 774 )

参考文献 | 相关文章 | 多维度评价

微信中健康信息质量良莠不齐,分析平台、公众号和用户的行为决策演化过程,探究遏制公众号发布虚假信息的关键因素,可为优化健康生态环境提供有益参考。通过构建三方主体演化博弈模型,求解系统均衡点与约束条件,仿真分析主体策略演变的影响因素及系统最优稳定状态。引入前景理论,探究主体的风险态度和损失规避对最优结果的影响。仿真实验得出,平台和用户对风险的敏感性大于损失。相比监管所需的高额成本,平台更注重声誉的提升;相比虚假信息产生的误导,用户着重于满足主观需求。公众号对损失比较敏感,且对平台处罚的敏感性大于粉丝损失。当公众号发布真实信息的初始意愿较低时,平台处罚、媒体曝光等外界因素虽能遏制伪健康信息的传播,但系统最优难以尽快实现。

支持多租户模式的业务流程动态定制模型

张纪林, 邵玉曹, 任永坚, 袁俊峰, 万健, 周丽

计算机科学. 2022, 49 (6A): 705-713. doi:10.11896/jsjkx.210200104

摘要 ( 262 )

PDF(2815KB) ( 682 )

参考文献 | 相关文章 | 多维度评价

流程定制是实现业务流程个性化服务的一种重要手段,在使用单一软件系统的情况下,其通过调整业务流程模型的内部结构来提供差异性业务服务。然而,随着业务流程的规模和复杂程度日益增加,现有的流程定制技术在应对复杂多变的业务流程时,需要对流程模型进行重构,影响了流程定制的开发效率。因此,提供一种高效的流程定制方法一直是业务流程领域的研究热点。文中从多租户应用的角度出发,提出了一种支持多租户模式的业务流程动态定制模型。首先采用可变性任务节点组装的方式构建业务子流程,通过租户感知器实现租户身份判别和流程实例派生;其次针对租户的可变性业务需求,提供一种流程动态定制方法;最后结合实例分析,验证了该模型的有效性。

基于加速度模糊控制的六足机器人遥操作

尹宏俊, 邓楠, 程亚迪

计算机科学. 2022, 49 (6A): 714-722. doi:10.11896/jsjkx.210300076

摘要 ( 582 )

PDF(5078KB) ( 729 )

参考文献 | 相关文章 | 多维度评价

为解决常规速度级控制器难以在非理想接触条件下保证电驱动仿生六足机器人速度跟踪能力的问题,提出一种基于加速度模糊控制的六足机器人双边遥操作方法。首先建立主端位置与从端速度的半自主映射方案,在此基础上确定机体加速度与腿部关节驱动量之间的关系式;其次采用模糊控制算法对遥操作系统的控制律进行设计,再利用Llewellyn准则求解控制律参数的稳定范围,并将所跟踪的速度/力信息分别以触觉力的形式反馈给操作者;最后搭建半物理仿真实验平台,实验结果验证了所提方法具有可行性,且遥操作系统的速度跟踪以及力透明度得到了明显提升。

面向食品溯源场景的PBFT优化算法应用研究

李博, 向海昀, 张宇翔, 廖浩德

计算机科学. 2022, 49 (6A): 723-728. doi:10.11896/jsjkx.210800018

摘要 ( 427 )

PDF(2361KB) ( 829 )

参考文献 | 相关文章 | 多维度评价

区块链不可篡改、可追溯等特性能较好地支撑食品溯源系统,在食品溯源与区块链技术相结合的应用中存在着延时长、节点多、系统开销大等问题。针对上述问题,基于实用拜占庭容错算法(Practical Byzantine Fault Tolerance,PBFT),提出一种适用于食品溯源场景的优化PBFT算法trace-PBFT(t-PBFT)。首先,将供应链中节点划分为3个等级,根据节点在共识中的实际通信量动态更新节点状态,并以此来评价节点的可靠性,作为选举主节点的依据;其次,结合食品供应链的特点,优化原算法中的一致性协议,减少节点通信次数。实验结果表明,相比PBFT算法,t-PBFT算法在通信开销、请求延时、吞吐量等方面表现更优;最后,基于t-PBFT算法且结合联盟链提出一种满足食品溯源需求的架构模型,对食品供应链中各环节进行数据记录,保证数据可追溯,确保食品流通过程的安全性。

基于改进准深度算法的诊断策略优化方法

张志龙, 史贤俊, 秦玉峰

计算机科学. 2022, 49 (6A): 729-732. doi:10.11896/jsjkx.210700076

摘要 ( 464 )

PDF(2111KB) ( 625 )

参考文献 | 相关文章 | 多维度评价

针对现有诊断策略优化方法中对多值系统不可靠测试的研究较少,且难以充分考虑多值测试和不可靠测试对诊断策略优化的双重影响的问题,提出了一种基于禁忌搜索的准深度算法。首先对故障与多值测试不确定相关性矩阵和多值不可靠诊断策略问题进行了描述;然后针对该问题,阐述禁忌搜索改进的准深度算法步骤;最后通过案例对所提算法进行了仿真验证。实验结果表明,所提算法能在保证故障检测和隔离效果的基础上降低算法复杂度,使得诊断策略优化过程更加准确高效。

融合用户和区位资源特征的混合房源推荐方法

朴勇, 朱锶源, 李阳

计算机科学. 2022, 49 (6A): 733-737. doi:10.11896/jsjkx.210800062

摘要 ( 509 )

PDF(2339KB) ( 782 )

参考文献 | 相关文章 | 多维度评价

随着时代的发展,用户购买房屋的观念也在发生改变,在决策过程中更加注重房屋的区位资源。文中给出一种融合用户和区位资源特征的混合推荐方法,通过层叠式的方式将基于内容的推荐算法和基于用户的协同过滤算法相组合,通过用户兴趣偏好与区位资源的融合,提供更准确的房源推荐。通过整合17万余条房源交易数据和上千条区位资源数据,实验结果表明,该方法相比传统模型具有更好的推荐效果。

物联网僵尸网络病毒的传播动力学模型与分析

张翕然, 刘万平, 龙华

计算机科学. 2022, 49 (6A): 738-743. doi:10.11896/jsjkx.210300212

摘要 ( 799 )

PDF(2736KB) ( 1124 )

参考文献 | 相关文章 | 多维度评价

随着信息技术的革新与进步,物联网技术在各个领域的应用呈现爆发式增长,然而大部分物联网设备却面临着黑客攻击的威胁。基于物联网设备的僵尸网络节点迅猛增长,导致了大规模DDoS攻击等网络安全事件,给物联网用户造成了极大损失。因此,研究以Mirai病毒为代表的一系列僵尸网络恶意威胁在物联网设备节点间的传播规律至关重要。首先,为了细致刻画物联网僵尸网络的形成过程,将物联网中的设备节点分为传输性设备节点和功能性设备节点,并通过对Mirai病毒感染机制的分析,提出了一个新颖的物联网病毒传播动力学模型——SDIV-FB模型。其次,从理论上计算了模型的传播阈值和平衡点,并对平衡点的稳定性进行了证明和分析。通过数值仿真实验验证了理论结果,并分析了模型参数对物联网病毒传播过程的影响。最后,确定了影响物联网僵尸网络病毒传播的重要参数,提出降低感染率和提高清除率可作为抑制物联网僵尸网络的有效控制策略。

考虑信息泄露和信息投资成本因素下平台的信息共享及渠道策略研究

徐明月

计算机科学. 2022, 49 (6A): 744-752. doi:10.11896/jsjkx.211000055

摘要 ( 278 )

PDF(2364KB) ( 790 )

参考文献 | 相关文章 | 多维度评价

构建了由制造商、电商平台和传统线下零售商组成的供应链,其中电商平台选择线上销售模式并制定信息分享策略。针对线上转售模式和线上代理模式下电商平台信息分享和不分享的情形,基于贝叶斯博弈和信息泄露效应,探究了在需求预测需要投资和信息分享策略的共同作用下,双渠道供应链中电商平台的销售模式选择。研究发现:除非需求不确定性低且平台收入分享比例高,否则电商平台选择转售模式。电商平台信息分享策略与线上销售模式和需求不确定程度有关。转售电商平台总是没有动机的自愿地和制造商分享信息;当需求不确定性较高时,代理电商平台自愿和制造商分享信息。进一步的研究发现,在代理模式中,信息分享对所有供应链成员都有利;在转售模式中,信息分享可能会对供应链不利,只有在需求不确定性较高且渠道竞争程度较低时,信息分享才能提高供应链的整体绩效。

基于模糊双目标规划的充电站布局模型

阙华坤, 冯小峰, 郭文翀, 李健, 曾伟良, 范竞敏

计算机科学. 2022, 49 (6A): 753-758. doi:10.11896/jsjkx.210700225

摘要 ( 377 )

PDF(2389KB) ( 711 )

参考文献 | 相关文章 | 多维度评价

随着电动汽车的推广,公共充电站的数量难以满足日益增长的充电需求。充电站建设通常需要进行多周期、多等级的战略规划,同时受政策、经济环境等因素的影响。每个充电站各建设周期的充电需求量、各等级充电站的建设成本以及运营成本都存在很大的不确定性。在考虑充电站服务能力以及服务半径约束的情况下,构建了以全建设周期电动汽车用户充电满意度最大化、充电站总成本最小化为双目标的模糊规划模型,并设计基于自适应和反向搜索机制的多种群遗传算法求解该问题。案例分析对比了改进与标准遗传算法的结果,验证了改进算法及所提模型的有效性,并分析了不同置信水平和充电站服务半径对目标函数的影响。

基于步态分类辅助的虚拟IMU的行人导航方法

杨涵, 万游, 蔡洁萱, 方铭宇, 吴卓超, 金扬, 钱伟行

计算机科学. 2022, 49 (6A): 759-763. doi:10.11896/jsjkx.211200148

摘要 ( 629 )

PDF(3365KB) ( 1026 )

参考文献 | 相关文章 | 多维度评价

当人体剧烈运动或撞到障碍物使足部惯性测量单元(Inertial Measurement Unit,IMU)超程时,行人导航系统无法有效地实现定位导航。针对此问题,提出了一种行人导航方法,构建由步态分类辅助的虚拟惯性测量单元(Virtual Intertial Mea-surement Unit,VIMU)。此方法采用基于注意力的卷积神经网络(CNN)对常见的行人步态进行分类,以实际IMU实时采集的行人腿部和足部的惯性数据作为训练和测试样本。针对不同步态,分别建立了对应的ResNet-GRU混合神经网络模型,并根据这些模型构建足部VIMU,在足部实际IMU超程的情况下进行定位。实验表明,此方法能够有效提高基于零速度更新的行人导航系统在行人剧烈运动或与障碍物碰撞时的性能,从而增强系统在复杂和未知地形中的适应性。综合步态下的定位误差约为路径总长的1.43%,满足军用和民用的精度要求。

基于法线迭代的模型中轴生成方法

宗迪迪, 谢益武

计算机科学. 2022, 49 (6A): 764-770. doi:10.11896/jsjkx.210400050

摘要 ( 444 )

PDF(2564KB) ( 735 )

参考文献 | 相关文章 | 多维度评价

作为模型的降维表示,中轴因具有良好的性能,在许多工程领域得到了广泛应用。目前,模型中轴的生成方法主要基于近似中轴的思想,要么中轴的质量不高,要么计算的时间成本较高。由此,提出了一种基于法线迭代的模型中轴生成方法。法线迭代方法首先将模型离散化为三角网格模型,然后对样本点和三角面片进行基于中轴定义的GPU并行跟踪计算,经过多次法线迭代,得到所有样本点对应的中轴点,最后根据样本点的拓扑连接性连接对应中轴点来得到模型的中轴。实验结果表明,不同模型下该方法均可以相对快而精准地生成模型中轴,从而验证了所提方法能有效提升中轴生成的时间效率和精准性。

适用于各单元共识交易的电力区块链系统优化调度研究

周航, 姜河, 赵琰, 解相朋

计算机科学. 2022, 49 (6A): 771-776. doi:10.11896/jsjkx.210600241

摘要 ( 438 )

PDF(3687KB) ( 698 )

参考文献 | 相关文章 | 多维度评价

随着冷热电耦合程度不断加深,分布式电源、中小型发电用户及其伴随负荷的并入给电网运行带来了新挑战。为解决各中小型用户之间及其与大电网之间交易的互信问题,保证各类分布式能源的协调互补,促进可再生能源发电就地消纳,首先针对中小型用户与大电网交易存在不透明环节等问题,应用区块链的各方共识互信机制建立第三方运营商与分布式多能源单元间的共识交易架构。其次,以运营商的效益成本与分布式多能源单元不同阶段的运行成本为目标函数构建数学模型。然后,依据区块链技术的加密广播机制,提出适用于运营商与各分布式多能源单元运行目标的共识交易策略,保证各单元通过运营商的整合达到交易互信、多能源协调互补及新能源就地消纳的运行目标。最后,经算例仿真验证了所提模型与方法的有效性与可行性。

向量DSP的混合资源启发式循环展开因子选择方法研究

陆浩松, 胡勇华, 王书盈, 周新莲, 李慧祥

计算机科学. 2022, 49 (6A): 777-783. doi:10.11896/jsjkx.210400146

摘要 ( 354 )

PDF(2260KB) ( 701 )

参考文献 | 相关文章 | 多维度评价

在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重要优化的效果。该方法考虑了循环体代码的向量标量属性、基址寄存器和索引寄存器资源使用规则等因素,并且在展开因子选择算法中增加了执行单元使用占比和展开因子按幂次对齐这两种启发式因素。针对3种常用数字信息处理算法开展了实验研究,实验结果表明了该方法的有效性。对于这三种DSP算法,用所提方法获得的循环展开因子进行循环展开处理后,它们的平均性能相比已有方法提升了10%以上。

基于Stacking多模型融合的IGBT器件寿命的机器学习预测算法研究

王飞, 黄涛, 杨晔

计算机科学. 2022, 49 (6A): 784-789. doi:10.11896/jsjkx.210400030

摘要 ( 602 )

PDF(2609KB) ( 1552 )

参考文献 | 相关文章 | 多维度评价

绝缘栅双极型晶体管(IGBT)器件是一种被广泛应用于工业、通信、计算机、汽车电子等领域的核心技术部件,提高该器件的使用安全性至关重要。近年来,采用机器学习对IGBT器件的寿命进行预测已成为热点的研究问题。然而,普通的神经网络预测仍存在着训练时间长和准确率较低的问题。针对该问题,提出了一种基于Stacking多模型融合的机器学习模型来实现对IGBT的寿命预测,该模型有效地提高了预测的准确率和效率。该算法包含双层结构,融合了4种互补的机器学习算法模型。其中,第一层使用了轻度梯度提升树模型(LGBM)、极端梯度提升树模型(XGBoost)和岭回归模型(Ridge)进行预测,再将预测结果输入第二层进行训练;第二层使用了线性回归模型,经过双层模型训练预测出最终的IGBT寿命。通过实验数据的对比证实,相比常用的长短期记忆神经网络(LSTM)算法模型,基于Stacking多模型融合的机器学习模型对IGBT寿命预测的均方误差平均降低了93%,且模型训练的平均耗时仅为LSTM网络算法模型的13%。

Grassberger熵随机森林在窃电行为检测的应用

阙华坤, 冯小峰, 刘盼龙, 郭文翀, 李健, 曾伟良, 范竞敏

计算机科学. 2022, 49 (6A): 790-794. doi:10.11896/jsjkx.210800032

摘要 ( 382 )

PDF(2328KB) ( 651 )

参考文献 | 相关文章 | 多维度评价

窃电行为严重危害电网安全,为了提高对窃电行为的检测效率,提出一种新型的基于Grassberger熵随机森林的电网用户窃电检测方法。首先,采用核主成分分析方法(Kernel Principal Componemt Analysis,KPCA)对用户的原始用电量的时间序列向量进行降维,提取用户的用电特征;接着,考虑到窃电样本和正常样本数量相差较大时,窃电检测的分类器训练效果较差,因此,采用数据欠采样方法建立多个数量平衡的样本子集,并采用改进的Grassberger熵随机森林(Random Forest,RF)算法计算信息增益,对各样本子集进行训练再集成,从而提高模型对窃电检测的准确度。以中国南方电网的专变用户窃电检测为案例,将各用户的电表采集电量数据作为模型输入,验证所提模型的窃电检测效果。

海上风电场通用运维路径规划模型优化及仿真

谭任深, 徐龙博, 周冰, 荆朝霞, 黄向生

计算机科学. 2022, 49 (6A): 795-801. doi:10.11896/jsjkx.210400300

摘要 ( 586 )

PDF(2342KB) ( 928 )

参考文献 | 相关文章 | 多维度评价

海上风电场运维的路径规划是一项极具挑战性和复杂性的任务,需要确定运维所需要的资源、交通工具路径,使得总运维成本最小化。文中在海上风电场运维规划建模方面采用了抽象类的方式,建立了通用性运维路径规划模型框架,该模型有利于兼容不同的海上风电场运维的路径规划与调度决策任务,可提高模型的可扩展性和多场景适用的灵活性。采用改进的自适应大邻域搜索算法(ALNS),提出在含有多个destroy和repair算子的算法基础上,求解基于抽象类的通用运维路径规划模型。选定国内某风电场数据进行仿真实验,通过在ALNS内部对比6个算子求解的结果,以及将ALNS与精确算法结果进行比较,结果显示该算法具有较好的优化效果和可靠性。

基于CAN总线纯电动汽车的整车控制器

陈龙华, 李洪林, 杨汉立, 鲜光梅, 张艳琪

计算机科学. 2022, 49 (6A): 802-807. doi:10.11896/jsjkx.220300133

摘要 ( 472 )

PDF(5406KB) ( 965 )

参考文献 | 相关文章 | 多维度评价

随着人们保护环境、与自然和谐共生的意识的逐渐增强,越来越多的人开始注重环境污染问题,特别是柴油、汽油汽车的尾气排放问题,已经成为各个国家亟需解决的难题。文中从节能、零排放的电动汽车入手,提出基于CAN总线纯电动汽车的整车控制器,并对电动车的充电功能、换电功控制进行了研究。在确定充电、换电工作安全的前提下,整车控制器提前检测车辆是否已准备就绪,控制车辆进行充电、换电,同时整车控制器具有在线升级功能,可以实现车辆的远程升级,进一步为用户提供了方便。