计算机科学

47卷第2期目录

计算机科学. 2020, 47 (2): 0-0.

摘要 ( 141 )

PDF(272KB) ( 566 )

相关文章 | 多维度评价

复杂异构数据的表征学习综述

蹇松雷, 卢凯

计算机科学. 2020, 47 (2): 1-9. doi:10.11896/jsjkx.190600180

摘要 ( 1282 )

PDF(2234KB) ( 4290 )

参考文献 | 相关文章 | 多维度评价

随着智能时代和大数据时代的到来,各种复杂异构数据不断涌现,成为数据驱动的人工智能方法、机器学习模型的基础。复杂异构数据的表征直接关系着后续模型的学习性能,因此如何有效地表征复杂异构数据成为机器学习的一个重要研究领域。文中首先介绍了数据表征的多种类型,并提出了现有数据表征方法面临的挑战;其次,根据数据类型将数据划分成单一类型数据和复合类型数据,针对单一类型数据,分别介绍了4种典型数据的表征学习发展现状和代表算法,包含离散数据、网络数据、文本数据和图像数据;然后,详细介绍了4种由多个单一数据或数据源复合而成的复杂数据,包含了离散特征与连续特征混合的结构化数据、属性数据与复杂网络复合的属性网络数据、来自不同领域的跨领域数据和由多种数据类型复合的多模态数据,分别介绍了基于上述复杂数据的表征学习现状以及最新的表征学习模型;最后,对复杂异构数据表征学习的发展趋势进行了探讨。

复杂网络社区发现研究进展

赵卫绩,张凤斌,刘井莲

计算机科学. 2020, 47 (2): 10-20. doi:10.11896/jsjkx.190100214

摘要 ( 1025 )

PDF(2666KB) ( 3210 )

参考文献 | 相关文章 | 多维度评价

近年来,随着现代网络通信和社会媒体等技术的飞速发展,复杂网络成为多学科交叉研究的热点之一,社区发现是复杂网络中的一个重要问题,对其进行研究具有重要的理论意义和应用价值。该问题吸引了多个学科领域的众多学者的关注,并且已有许多社区发现算法被提出。已有的社区发现综述多是侧重某一方向或特定领域展开,基于此,文中在之前工作的基础上,对国内外社区发现工作进行了深入调研,较全面地阐述了复杂网络社区发现的研究现状。首先,针对不同网络结构,给出社区发现的问题定义和主要的评价指标。然后,介绍了不同网络结构中的经典社区发现算法,包括同质网络中的全局社区发现、局部社区发现算法,异质网络中的二分网络、三分网络和多分网络中的社区发现,结合节点内容和连接结构的社区发现算法,以及动态网络中的社区发现和社区演化工作。最后,简要介绍了社区发现的典型应用,包括影响最大化、链路预测和情感分析领域的应用。此外,探讨了当前社区发现研究面临的主要挑战,试图为社区发现研究领域勾画一个较为清晰和全面的轮廓,为初学者提供指引。

符号网络链接预测算法研究综述

刘苗苗,扈庆翠,郭景峰,陈晶

计算机科学. 2020, 47 (2): 21-30. doi:10.11896/jsjkx.190600104

摘要 ( 609 )

PDF(1546KB) ( 1379 )

参考文献 | 相关文章 | 多维度评价

符号网络链接预测包括网络结构上两个节点间未知链接的可能性预测与符号预测两方面,其相关研究对于分析和理解符号网络的拓扑结构、功能及演化行为具有十分重要的意义,在个性化推荐、态度预测、蛋白质交互作用研究等领域有着重大的应用价值。文中综述了符号网络链接预测问题的研究成果,介绍了相关概念、符号网络的理论基础、常用符号网络数据集以及预测精度评价标准;将目前主要的符号网络链接预测算法按照设计思路分为有监督学习与无监督学习两大类,详细阐述了每种算法的主要思想;归纳总结了符号网络链接预测问题的特点和规律,讨论了目前存在的问题并指出了面临的挑战和未来可能的发展方向。这能为信息学、生物学、社会学等领域的相关研究人员提供有益参考。

基于极端评分行为的相似度计算

冯晨娇,梁吉业,宋鹏,王智强

计算机科学. 2020, 47 (2): 31-36. doi:10.11896/jsjkx.190500130

摘要 ( 522 )

PDF(1844KB) ( 887 )

参考文献 | 相关文章 | 多维度评价

随着互联网技术的迅猛发展,互联网信息急剧增长,信息过载问题愈发凸显。面对海量的互联网信息,用户往往需要耗费大量的时间来搜索所需的信息或产品,而搜索的解往往受到制约。为解决信息过载问题,推荐系统应运而生。推荐系统根据用户的历史行为推测其需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。作为推荐领域中一类重要的推荐方法,基于记忆的协同过滤方法通常依据用户或产品的近邻信息来构造评分预测函数,其核心在于准确度量用户或产品之间的相似度。传统的相似度量,如皮尔逊、余弦及秩相关系数等,通常只考虑了用户之间的线性关系;而启发式相似度如基于3个特殊因子的PIP相似度及其改进方法,则只刻画了用户之间的非线性关系。事实上,在推荐系统中,就用户之间的相似关系而言,仅用线性或是非线性函数来度量均是不准确的。为了更为精细地刻画用户之间的相似程度,文中提出了基于非线性函数的用户极端评分行为的相似程度度量指数,通过将该指数融入传统的线性相关系数,构造了一个考虑极端评分行为的新的相似度。为验证该方法的有效性,基于Ml(100k)和Ml-latest-small两个数据集,将其与传统相似度以及启发式相似度进行比较,结果显示基于极端评分行为相似度的协同过滤方法在MAE和RMSE指标上能够获得更好的表现。

融合渐近性的灰狼优化支持向量机模型

武玉坤,肖杰,李伟,楼吉林

计算机科学. 2020, 47 (2): 37-43. doi:10.11896/jsjkx.190100092

摘要 ( 769 )

PDF(1531KB) ( 870 )

参考文献 | 相关文章 | 多维度评价

大数据的发展对数据分类领域的分类准确性有了更高的要求;支持向量机(Support Vector Machine,SVM)的广泛应用需要一种高效的方法来构造一个分类能力强的SVM分类器;SVM的核函数参数与惩罚因子以及特征子集对预测模型的复杂度和预测精度有着重要影响。为提高SVM的分类性能,文中将SVM的渐近性融合到灰狼优化(Grey Wolf Optimization,GWO)算法中,提出了新的SVM分类器模型,该模型对SVM的参数与数据的特征子集同时进行优化,融合SVM渐近性的新灰狼个体将灰狼优化算法的搜索空间导向超参数空间中的最佳区域,能够更快地获得最优解;此外,将获得的分类准确率、所选特征个数和支持向量个数相结合,提出了一种新的适应度函数,新的适应度函数与融合渐近性的灰狼优化算法将搜索引向最优解。采用UCI中的多个经典数据集对所提模型进行验证,将其与网格搜素算法、未融合渐近性的灰狼优化算法以及其他文献中的方法进行对比,其分类准确率在不同数据集上均有不同程度的提升。实验结果表明,所提算法能找到SVM的最优参数与最小特征子集,具有更高的分类准确率和更短的平均处理时间。

基于粗糙集和改进鲸鱼优化算法的特征选择方法

王生武,陈红梅

计算机科学. 2020, 47 (2): 44-50. doi:10.11896/jsjkx.181202285

摘要 ( 732 )

PDF(1471KB) ( 1294 )

参考文献 | 相关文章 | 多维度评价

随着互联网和物联网技术的发展,数据的收集变得越发容易。但是,高维数据中包含了很多冗余和不相关的特征,直接使用会徒增模型的计算量,甚至会降低模型的表现性能,故很有必要对高维数据进行降维处理。特征选择可以通过减少特征维度来降低计算开销和去除冗余特征,以提高机器学习模型的性能,并保留了数据的原始特征,具有良好的可解释性。特征选择已经成为机器学习领域中重要的数据预处理步骤之一。粗糙集理论是一种可用于特征选择的有效方法,它可以通过去除冗余信息来保留原始特征的特性。然而,由于计算所有的特征子集组合的开销较大,传统的基于粗糙集的特征选择方法很难找到全局最优的特征子集。针对上述问题,文中提出了一种基于粗糙集和改进鲸鱼优化算法的特征选择方法。为避免鲸鱼算法陷入局部优化,文中提出了种群优化和扰动策略的改进鲸鱼算法。该算法首先随机初始化一系列特征子集,然后用基于粗糙集属性依赖度的目标函数来评价各子集的优劣,最后使用改进鲸鱼优化算法,通过不断迭代找到可接受的近似最优特征子集。在UCI数据集上的实验结果表明,当以支持向量机为评价所用的分类器时,文中提出的算法能找到具有较少信息损失的特征子集,且具有较高的分类精度。因此,所提算法在特征选择方面具有一定的优势。

一种融合科研人员标签的学术论文推荐方法

吴磊,岳峰,王含茹,王刚

计算机科学. 2020, 47 (2): 51-57. doi:10.11896/jsjkx.190300121

摘要 ( 487 )

PDF(2827KB) ( 850 )

参考文献 | 相关文章 | 多维度评价

近年来,科研社交网络的兴起在一定程度上转变了科研人员原有的科研交流合作模式,深受科研人员的欢迎;然而,科研社交网络上激增的研究成果数量使得科研人员很难找到自己真正感兴趣的学术论文。因此,为科研人员推荐其感兴趣的学术论文,成为一项重要任务。考虑到科研社交网络中科研人员阅读论文数据的特殊性,文中从单类协同过滤角度考虑科研社交网络中的论文推荐问题。一方面,利用科研人员的标签信息进行更精确的负例抽取,并在此基础上考虑科研人员的活跃度以确定负例数量;另一方面,基于添加完负例的科研人员-学术论文评分矩阵进行概率矩阵分解,在概率矩阵分解阶段融合科研人员标签关联矩阵以及论文相似度信息来进行约束,以缓解数据稀疏对最终结果的不利影响。最后,在科研社交网络“科研之友”上进行实验,采用准确率、召回率、平均准确率、平均倒数排名这4项评价指标对推荐结果的准确性及推荐排序进行验证。实验结果表明,所提方法相较于主流方法取得了更好的结果,在准确率指标上提升了4.19%,验证了所提方法将论文推荐考虑为单类协同过滤问题的有效性,以及社会化信息对推荐的有效辅助作用;并且,所提方法在推荐系统中具有良好的可扩展性,能够在科研社交网络中为科研人员进行有效的论文推荐。

基于特征向量局部相似性的社区检测算法

杨旭华,沈敏

计算机科学. 2020, 47 (2): 58-64. doi:10.11896/jsjkx.181202433

摘要 ( 400 )

PDF(3473KB) ( 911 )

参考文献 | 相关文章 | 多维度评价

社区的发现和分析是复杂网络结构和功能研究中的一个热点。目前广泛应用的社区划分算法存在时间复杂度过高、社区核心数量无法准确量化、划分精度不高等问题。文中提出了一种基于特征向量局部相似性的社区检测算法ELSC。该算法首先计算网络中每个节点的特征向量中心性,在此基础上提出了特征向量局部相似性(ELS)和特征向量吸引性(EA)指标。ELS指标表示节点之间的相似性,用来形成初始社区,在同一个社区内部节点之间的相似性较高,在不同社区节点之间的相似性较低;EA指标同时考虑了局部相似性和特征向量中心性的占比,表示节点之间的吸引性,用来优化初始社区,并在此基础上完成网络的社区划分。该算法由最值确定节点,避免了节点数量阈值不确定的问题。在7个真实网络上将所提算法与6种知名算法的模块度和标准化互信息两个指标进行综合比较,结果表明,该算法具有良好的准确性,并且具有较低的时间复杂度。

基于文本深层语义特征的亚马逊商品推荐

李可,陈光平

计算机科学. 2020, 47 (2): 65-71. doi:10.11896/jsjkx.190200362

摘要 ( 375 )

PDF(1838KB) ( 975 )

参考文献 | 相关文章 | 多维度评价

商品评论挖掘在商品推荐领域取得了越来越多的成果。传统的评论挖掘方法只集中在挖掘评论中隐含的浅层语义,其语义表达效果不理想。因此,目前商品推荐领域的一大挑战是如何挖掘商品评论的深层语义,提升语义表达能力,以及最大化地利用商品评论来提升商品的推荐效果。文中使用深度学习中的跨思维向量模型(Skip-Thought Vectors,STV)来学习评论的潜在语义特征。为了提升评论的语义表达能力,把深度学习中的长短记忆模型(Long Short-Term Memory,LSTM)应用于STV,结合双向信息流挖掘方法、用户情感偏好挖掘方法以及深度层级模型,引入了一种深层语义特征挖掘模型。该模型不仅能挖掘评论的深层语义特征,还能挖掘发表评论的用户的情感偏好。然后,将深层语义特征挖掘模型与矩阵分解模型(Singular Value Decomposition,SVD)相结合来实现商品推荐。在两个亚马逊数据集上的实验结果证明,所提模型在深度语义挖掘能力上优于传统的评论挖掘模型,相比使用传统评论挖掘模型的商品推荐系统提升了商品推荐的效果。

一种粗糙不确定的图像分割方法

饶梦,苗夺谦,罗晟

计算机科学. 2020, 47 (2): 72-75. doi:10.11896/jsjkx.190500177

摘要 ( 417 )

PDF(1766KB) ( 728 )

参考文献 | 相关文章 | 多维度评价

图像分割是计算机视觉领域的一个基础问题,涉及图像检索、物体检测、物体识别、行人跟踪等众多后续任务。目前已有大量研究成果,有基于阈值、聚类、区域生长的传统方法,也有基于神经网络的流行算法。由于图像区域边界的不确定性问题,现有算法并没有很好地解决图像部分区域渐变导致的边界模糊问题。粒计算是解决复杂问题的有效工具之一,在不确定的、模糊的问题上取得了良好的效果。针对现有图像分割算法在不确定性问题上的局限性,基于粒计算思想,提出了一种粗糙不确定性的图像分割方法。该算法在K均值算法的基础上,结合邻域粗糙集模型,先对类别边界区域的像素点进行粒化,运用邻域关系矩阵,得到各类别对各粒化像素点的包含度,从而对边界区域类别模糊的像素点进行重新划分,优化了图像分割的结果。在Matlab2019编程环境中,实验选取了BSDS500数据集中的一张马术训练图片和一张建筑物图片来测试算法性能。实验先对彩色图像进行灰度处理,用K均值算法对图像进行初步分割,再设置邻域因子值,依据边界像素点邻域信息重新划分边界点。对比K均值算法的分割结果可知,所提算法取得了更佳的效果。实验结果表明,该方法在粗糙度这一评价标准上优于K均值算法,可以有效降低图像区域边界的模糊性,实现灰度边界模糊的图像渐变区域的分割。

基于运动矢量细化的帧率上变换与HEVC结合的视频压缩算法

蔡于涵,熊淑华,孙伟恒,Karn Pradeep,何小海

计算机科学. 2020, 47 (2): 76-82. doi:10.11896/jsjkx.190500092

摘要 ( 404 )

PDF(2087KB) ( 1189 )

参考文献 | 相关文章 | 多维度评价

将帧率变换技术与新型视频压缩编码标准HEVC相结合有利于提升视频的压缩效率。针对直接利用HEVC码流信息中的低帧率视频的运动矢量进行帧率上变换时效果不理想的问题,文中提出了一种基于运动矢量细化的帧率上变换与HEVC结合的视频压缩算法。首先,在编码端对原始视频进行抽帧,降低视频帧率;其次,对低帧率视频进行HEVC编解码;然后,在解码端与从HEVC码流中提取出的运动矢量相结合,利用前向-后向联合运动估计对其进行进一步的细化,使细化后的运动矢量更加接近于对象的真实运动;最后,利用基于运动补偿的帧率上变换技术将视频序列恢复至原始帧率。实验结果表明,与HEVC标准相比,所提算法在同等视频质量下可节省一定的码率。同时,与其他算法相比,在节省码率相同的情况下,所提算法重建视频的PSNR值平均可提升0.5dB。

基于角度特征的分类网络

王立华,杜明辉,梁亚玲

计算机科学. 2020, 47 (2): 83-87. doi:10.11896/jsjkx.190500077

摘要 ( 358 )

PDF(1361KB) ( 852 )

参考文献 | 相关文章 | 多维度评价

卷积神经网络(Convolutional Neural Networks,CNN)在图像分类任务中的卓越表现,使得其被广泛应用于计算机视觉的各个领域。图像分类模型精度与效率的提升,除了归功于网络结构的改变外,还有很大一部分原因来自于归一化技术以及分类损失函数的改进。在人脸识别任务中,随着精度的不断提升,分类损失函数从Softmax Loss到Triplet Loss,又从L-Softmax Loss到Arcface Loss,度量方式从几何度量发展到角度度量。度量方式的改变实际上是特征形式的变化,即特征形式从一般特征转变为角度特征。在Mnist数据集上,使用角度度量损失函数训练得到的特征点呈角度分布,同时准确率比几何度量高;将角度度量方式用更直接的角度特征来表示,训练得到的同类特征点呈直线分布,准确度也比一般角度度量更高。这不禁令人思考,在CNN分类模型中是否可以使用角度特征来代替一般特征。在CNN分类模型中,其主要架构往往由多个卷积层和一个或多个全连接层组成,通过统一卷积层与全连接层的归一化操作,得到角度卷积层与角度全连接层。在普通分类网络的基础上,用角度卷积层替换卷积层,用角度全连接层替换全连接层,可以得到一个由角度特征组成的角度分类网络。在Cifar-100数据集上,基于ResNet-32构造的角度分类网络相比原分类网络,分类准确率提高了2%,从而论证了角度特征在分类网络中的有效性。

考虑行人相对速度的改进社会力模型的验证与评估

钟圳伟,纪庆革

计算机科学. 2020, 47 (2): 88-94. doi:10.11896/jsjkx.190500055

摘要 ( 362 )

PDF(2874KB) ( 1420 )

参考文献 | 相关文章 | 多维度评价

在人群仿真的研究领域中,社会力模型是由Helbing提出的一种非常经典的微观仿真模型,能够模拟一些常见的人群自组织现象。但社会力模型仍然存在行人震荡、行人重叠等问题,因此许多学者在参数设置、受力范围、算法优化等方面对社会力模型进行了丰富和改进。目前,Gao等提出的一种考虑行人相对速度的改进社会力模型依然是一些学者进行改进社会力模型研究以及各种仿真实验的基础和重要参考。由于Gao等仅通过两个实验就表明了他们的改进社会力模型的优势这一情况欠缺可靠性,以及没有进行更多的人群自组织实验来表明改进后的社会力模型仍然保留原始社会力模型能够模拟人群自组织现象这一能力,因此文中对Gao等提出的改进社会力模型进行了验证性和评估性实验。通过验证性实验验证了Gao等进行的两个实验,证实了该改进社会力模型的优势。文中通过评估性实验证实了Gao等的改进社会力模型保留了能够模拟人群自组织现象的能力,发现并分析了Gao等的改进社会力模型所存在的行人重叠问题。

基于递归图分析的腭裂语音鼻漏气自动识别算法

刘新怡,田维维,梁文茹,何凌,尹恒

计算机科学. 2020, 47 (2): 95-101. doi:10.11896/jsjkx.181001848

摘要 ( 227 )

PDF(3804KB) ( 947 )

参考文献 | 相关文章 | 多维度评价

鼻漏气是腭咽闭合不全患者的典型症状,针对腭裂语音鼻漏气的特征进行研究,利用基于非线性动力学方法的递归图对特征进行发掘,并结合递归趋势分析法和基于递归图的区域进行分布处理,提取递归图分析的量化参数和最小区域矩阵作为特征参数。结合分类器,实现对腭裂语音鼻漏气的自动识别。实验针对降采样点、延迟时间、临界距离、语音单元、分类器种类等因素,进行了识别效果的分析,并综合权衡各因素对识别正确率的影响,选取了最优取值。实验结果表明,采用KNN分类器并当降采样点为30000点、延迟时间为3ms、临界距离5个单位、语音单元为4帧时,腭裂语音鼻漏气自动识别的正确率达84.63%。腭裂语音鼻漏气自动识别算法能为临床腭咽功能评估提供高效、客观的辅助诊断依据。

基于改进BP神经网络的尿液中红白细胞识别算法

刘晓彤,王伟,李泽禹,沈思婉,姜小明

计算机科学. 2020, 47 (2): 102-105. doi:10.11896/jsjkx.191100195

摘要 ( 354 )

PDF(1407KB) ( 861 )

参考文献 | 相关文章 | 多维度评价

对显微图像中的尿液有形成分包括红白细胞等进行分析,可以帮助医生对有肾脏和泌尿系统疾病的患者进行评估。针对无染色、无标记的尿液图像中红白细胞存在对比度低、边缘模糊等问题,提出一种基于改进BP神经网络的识别方法。首先,将遗传算法引入BP神经网络对网络权值和阈值进行优化,解决训练过程中网络容易陷入局部极值等问题,提高BP神经网络的识别精度;其次,使用动量梯度下降法消除网络在梯度下降中产生的摆动,加快网络的收敛,提高BP神经网络的学习速度。与基础BP神经网络相比,改进方法对红白细胞的识别准确度分别提高了6.9%和9.5%,且识别时间分别缩短了19.3s和42.1s;与CNN识别算法相比,改进算法对白细胞的识别准确度提高了1.7%;与SVM识别算法相比,改进算法对红白细胞的识别准确度分别提高了12.9%和12.7%。验证实验和对照实验的结果表明,改进方法能以较高的准确率和较快的速度实现红白细胞的识别。

基于深度邻近连接网络的单幅图像去雨方法

傅雪阳,孙琦,黄悦,丁兴号

计算机科学. 2020, 47 (2): 106-111. doi:10.11896/jsjkx.190100228

摘要 ( 576 )

PDF(2504KB) ( 1334 )

参考文献 | 相关文章 | 多维度评价

雨天环境下的雨线导致图像内容被遮挡,严重影响人眼的视觉效果和后续系统的处理性能。目前主流的深度学习方法为了提升处理性能,均以复杂的网络结构和较大的参数量为代价,导致相关方法难以服务于实际应用。为此,文中提出一种新的深度邻近连接网络结构。它通过关注深度网络中所学特征图之间的关系,采用融合操作将邻近特征图进行连接,以获得更加丰富和有效的特征表示。实验数据表明,所提方法在3个公开合成数据集及真实有雨图像上的主客观处理效果、模型参数量和运行时间等相关性能都有所提升。在合成数据集Rain100H上的平均结构相似性(SSIM)值达到0.84,在合成数据集Rain100L和Rain1200上的平均SSIM值分别达到0.96和0.91。在真实有雨图像上,所提方法在有效去除前景雨线的同时,能够保护更完整的背景图像信息,从而获得更好的主观视觉效果。相比于同时期的深度学习方法JORDER,文中方法在保证相近的处理效果的前提下,模型参数量和CPU运行时间分别降低了一个和两个数量级。实验数据充分说明,通过将网络中邻近特征图进行融合,能够获取更加有效的特征表示。因此,所提方法虽然仅使用较少的模型参数和简洁的神经网络结构,却依旧能够较好地实现图像去雨效果,解决了现有方法模型参数量较大和网络结构较为复杂的问题。同时,该网络结构设计方案也能够为基于深度学习的相关图像复原任务提供参考和借鉴。

基于图像扩散速度模型和纹理信息的人脸活体检测

李新豆,高陈强,周风顺,韩慧,汤林

计算机科学. 2020, 47 (2): 112-117. doi:10.11896/jsjkx.181202339

摘要 ( 504 )

PDF(2605KB) ( 904 )

参考文献 | 相关文章 | 多维度评价

为了解决人脸身份认证中的欺诈问题,提出了一种基于图像扩散速度模型和纹理信息的人脸活体检测算法。真实人脸和虚假人脸图像的空间结构不同,为了提取这种差异特征,该方法使用各向异性扩散增强图像的边缘信息。然后,将原始图像与扩散后图像的差值作为图像的扩散速度,并构建扩散速度模型。接着使用局部二值算法提取图像扩散速度特征并训练分类器。真实人脸图像和虚假人脸图像之间存在很多差异特征,为了进一步提高人脸活体检测算法的泛化能力,该方法同时提取人脸图像的模糊程度特征和色彩纹理特征,通过特征矩阵级联的方法将两种特征进行融合,并训练另一个分类器。最后根据分类器输出概率加权融合的结果做出判决。实验结果表明,该算法能够快速有效地检测出虚假的人脸图像。

基于卷积去噪自编码器的芯片表面弱缺陷检测方法

罗月,童卞,景帅,张蒙,饶永明,闫峰

计算机科学. 2020, 47 (2): 118-125. doi:10.11896/jsjkx.190100141

摘要 ( 476 )

PDF(3041KB) ( 1279 )

参考文献 | 相关文章 | 多维度评价

芯片表面缺陷会影响芯片的外观和性能,因此表面缺陷检测是芯片生产过程中的重要环节。具有缺陷与背景对比度低、缺陷较小等特点的弱缺陷给传统检测方法带来了挑战。因为近年来深度学习在机器视觉领域展现出了强大的能力,所以文中采用基于深度学习的方法来研究芯片表面弱缺陷的检测问题。该方法将芯片表面缺陷看作噪音,首先应用卷积去噪自编码器(Convolutional Denoising Auto-encoders,CDAE)重构无缺陷图像,然后用重构的无缺陷图像减去输入图像,获得包含缺陷信息的残差图。因为残差图中已经消除了背景的影响,所以最后可以基于残差图较容易地进行缺陷检测。由于基于CDAE重构芯片背景的无缺陷图像时存在随机噪音,导致弱缺陷可能会湮没在重构噪音中,为此,文中提出了重叠分块策略抑制重构噪音,以便更好地检测弱缺陷。因为CDAE是无监督学习网络,所以训练时无需进行大量的人工数据标注,这进一步增强了该方法的可应用性。通过对真实芯片表面数据进行测试,验证了所提方法在芯片表面检测上的有效性。

基于深度特征融合的图像语义分割

周鹏程,龚声蓉,钟珊,包宗铭,戴兴华

计算机科学. 2020, 47 (2): 126-134. doi:10.11896/jsjkx.190100119

摘要 ( 705 )

PDF(3116KB) ( 1304 )

参考文献 | 相关文章 | 多维度评价

在图像语义分割中使用卷积网络进行特征提取时,由于最大池化和下采样操作的重复组合引起了特征分辨率降低,从而导致上下文信息丢失,使得分割结果失去对目标位置的敏感性。虽然基于编码器-解码器架构的网络通过跳跃连接在恢复分辨率的过程中逐渐细化了输出精度,但其将相邻特征简单求和的操作忽略了特征之间的差异性,容易导致目标局部误识别等问题。为此,文中提出了基于深度特征融合的图像语义分割方法。该方法采用多组全卷积VGG16模型并联组合的网络结构,结合空洞卷积并行高效地处理金字塔中的多尺度图像,提取了多个层级的上下文特征,并通过自顶向下的方法逐层融合,最大限度地捕获上下文信息;同时,以改进损失函数而得到的逐层标签监督策略为辅助支撑,联合后端像素建模的全连接条件随机场,无论是在模型训练的难易程度还是预测输出的精度方面都有一定的优化。实验数据表明,通过对表征不同尺度上下文信息的各层深度特征进行逐层融合,图像语义分割算法在目标对象的分类和空间细节的定位方面都有所提升。在PASCAL VOC 2012和PASCAL CONTEXT两个数据集上获得的实验结果显示,所提方法分别取得了80.5%和45.93%的mIoU准确率。实验数据充分说明,并联框架中的深度特征提取、特征逐层融合和逐层标签监督策略能够联合优化算法架构。特征对比表明,该模型能够捕获丰富的上下文信息,得到更加精细的图像语义特征,较同类方法具有明显的优势。

一种基于Zernike矩的局部特征检测方法

贺超雷,毕秀丽,肖斌

计算机科学. 2020, 47 (2): 135-142. doi:10.11896/jsjkx.181202403

摘要 ( 297 )

PDF(5819KB) ( 881 )

参考文献 | 相关文章 | 多维度评价

针对图像发生几何或质量畸变时局部特征区域提取效果不理想的问题,提出了一种基于Zernike矩的具有旋转不变性与尺度不变性的图像局部特征检测算子。该算法利用Zernike矩构建Hessian矩阵,以基于Zernike矩的Hessian矩阵的行列式与迹确定潜在兴趣点的位置,使用非极大值抑制获得多尺度模板下的最大角点响应,再经二维二次插值运算精确定位兴趣点位置,最后利用主曲率进行边缘响应抑制,利用梯度方向直方图确定兴趣点主方向,由兴趣点4×4邻域的8个方向构建描述算子。实验结果表明,该特征检测方法在视角变换、旋转缩放、图像模糊、图像压缩以及光照变化等图像畸变条件下是有效的,且具有良好的抗噪性能。

基于快速SLIC的图像超像素算法

雷涛,连倩,加小红,刘鹏

计算机科学. 2020, 47 (2): 143-149. doi:10.11896/jsjkx.190400121

摘要 ( 680 )

PDF(6214KB) ( 1485 )

参考文献 | 相关文章 | 多维度评价

针对SLIC(Simple Linear Iterative Clustering)算法在超像素聚类过程中耗时较长的缺陷,提出一种基于快速SLIC的图像超像素算法。该算法首先剔除在颜色空间上与聚类中心相似度较低的像素,从而仅用部分近邻像素更新聚类中心,以确保聚类中心快速达到稳定并阻止误差传播,提高边缘命中率;其次,在初始化网格后,将每个超像素的边缘像素视为不稳定像素,将超像素的非边缘像素视为稳定像素并保持稳定像素的类别不变;最后,通过对不稳定像素进行迭代标记来实现快速超像素图像分割。在MATLAB环境下分别对所提算法与6种对比算法进行测试,在超像素个数相同的情况下,所提算法在BSD500数据集上与经典的SLIC算法相比分割误差率降低5%,分割精度提高0.5%,运行时间减少0.18s。实验结果表明,与主流的超像素算法相比,所提算法在提升超像素分割质量的同时能够有效降低算法的计算复杂度。

计算机化神经认知评估系统研究综述

张政霖,张利伟,王文娟,夏莉,符豪,王宏志,杨立状,李海

计算机科学. 2020, 47 (2): 150-156. doi:10.11896/jsjkx.190100150

摘要 ( 465 )

PDF(1536KB) ( 2099 )

参考文献 | 相关文章 | 多维度评价

神经及精神类疾病、外科损伤、肿瘤以及衰老会导致人类神经认知功能减退。干预和康复需要专业的神经认知评估工具来确定认知受损情况、跟踪认知变化。为了推进适合中国人群的计算机化神经认知评估系统的研发,提高中国认知神经心理学的临床应用水平,首先,对神经认知评估的研究背景与发展历史进行了概述;其次,调查研究了国内外近10年间有论文或临床数据支撑其信效度的计算机化神经认知评估系统,对比了各自的特点;接着,论证了开发适用于中国人的计算机化神经认知评估系统的必要性,并初步介绍了其开发流程,提出将计算机自适应测试策略用于评估系统;然后,分析了目前计算机化的神经认知评估系统所面临的主要问题,并在此基础上,展望了虚拟现实、脑认知计算模型和在线评估等现代信息技术在未来计算机化神经认知评估系统中的应用;最后,提出了基于人工智能医疗、移动医疗和数字医疗等的计算机化神经认知评估系统的商业化模式。

基于密集连接卷积神经网络的远程监督关系抽取

钱小梅,刘嘉勇,程芃森

计算机科学. 2020, 47 (2): 157-162. doi:10.11896/jsjkx.190100167

摘要 ( 529 )

PDF(2007KB) ( 872 )

参考文献 | 相关文章 | 多维度评价

密集连接卷积神经网络(DenseNet)是一种新型深度卷积神经网络架构,通过建立不同层间的连接关系,来确保网络层与层间最大程度的信息传输。在文本远程监督关系抽取任务中,针对现有神经网络方法使用浅层网络提取特征的局限,设计了一种基于密集连接方式的深度卷积神经网络模型。该模型采用五层卷积神经网络构成的密集连接模块和最大池化层作为句子编码器,通过合并不同层次的词法、句法和语义特征,来帮助网络学习特征,从而获取输入语句更丰富的语义信息,同时减轻深度神经网络的梯度消失现象,使得网络对自然语言的表征能力更强。模型在NYT-Freebase数据集上的平均准确率达到了82.5%,PR曲线面积达到了0.43。实验结果表明,该模型能够有效利用特征,并提高远程监督关系抽取的准确率。

融合语义角色的神经机器翻译

乔博文,李军辉

计算机科学. 2020, 47 (2): 163-168. doi:10.11896/jsjkx.190100048

摘要 ( 555 )

PDF(1551KB) ( 905 )

参考文献 | 相关文章 | 多维度评价

近年来,深度学习取得了重大突破,融合深度学习技术的神经机器翻译逐渐取代统计机器翻译,成为学术界主流的机器翻译方法。然而,传统的神经机器翻译将源端句子看作一个词序列,没有考虑句子的隐含语义信息,使得翻译结果与源端语义不一致。为了解决这个问题,一些语言学知识如句法、语义等被相继应用于神经机器翻译,并取得了不错的实验效果。语义角色也可用于表达句子语义信息,在神经机器翻译中具有一定的应用价值。文中提出了两种融合句子语义角色信息的神经机器翻译编码模型,一方面,在句子词序列中添加语义角色标签,标记每段词序列在句子中担当的语义角色,语义角色标签与源端词汇共同构成句子词序列;另一方面,通过构建源端句子的语义角色树,获取每个词在该语义角色树中的位置信息,将其作为特征向量与词向量进行拼接,构成含语义角色信息的词向量。在大规模中-英翻译任务上的实验结果表明,相较基准系统,文中提出的两种方法分别在所有测试集上平均提高了0.9和0.72个BLEU点,在其他评测指标如TER(Translation Edit Rate)和RIBES(Rank-based Intuitive Bilingual Evaluation Score)上也有不同程度的性能提升。进一步的实验分析显示,相较基准系统,文中提出的融合语义角色的神经机器翻译编码模型具有更佳的长句翻译效果和翻译充分性。

基于深度强化学习的交通信号控制方法

孙浩,陈春林,刘琼,赵佳宝

计算机科学. 2020, 47 (2): 169-174. doi:10.11896/jsjkx.190600154

摘要 ( 678 )

PDF(2295KB) ( 3257 )

参考文献 | 相关文章 | 多维度评价

交通信号的智能控制是智能交通研究中的热点问题。为更加及时有效地自适应协调交通,文中提出了一种基于分布式深度强化学习的交通信号控制模型,采用深度神经网络框架,利用目标网络、双Q网络、价值分布提升模型表现。将交叉路口的高维实时交通信息离散化建模并与相应车道上的等待时间、队列长度、延迟时间、相位信息等整合作为状态输入,在对相位序列及动作、奖励做出恰当定义的基础上,在线学习交通信号的控制策略,实现交通信号Agent的自适应控制。为验证所提算法,在SUMO(Simulation of Urban Mobility)中相同设置下,将其与3种典型的深度强化学习算法进行对比。实验结果表明,基于分布式的深度强化学习算法在交通信号Agent的控制中具有更好的效率和鲁棒性,且在交叉路口车辆的平均延迟、行驶时间、队列长度、等待时间等方面具有更好的性能表现。

基于通信信号时频特性的卷积神经网络调制识别

徐茂,侯进,吴佩军,刘雨灵,吕志良

计算机科学. 2020, 47 (2): 175-179. doi:10.11896/jsjkx.181202361

摘要 ( 436 )

PDF(2469KB) ( 1087 )

参考文献 | 相关文章 | 多维度评价

在通信环境日益密集、信号调制样式层出不穷的情况下,信号的调制识别变得愈加困难。寻求一种高精度、时效性好的自动调制识别新方法,对无线电通信应用领域有重大意义。对此,文中提出了一种结合通信信号时频特性的卷积神经网络(Convolutional Neural Network Based on Time-Frequency Characteristics,TFC-CNN)调制识别算法。首先,采集大量调制信号,将信号的时频特征通过短时傅里叶变换转换成图像特征,并将其作为网络的输入;然后,设计一种特征提取能力更强、参数更少的卷积神经网络,通过改进网络中不同层的连结方式来增加网络的特征提取能力,同时通过减小卷积核的尺度、使用全局均值池化层来减少模型参数,提高了模型的时效性;最后,在网络中添加批归一化(Batch Normalization,BN)层,在增加模型稳定性的同时防止模型出现过拟合。实验结果表明,所提算法在参数和训练时间上比传统方法明显减少,同时有更高的准确率,体现了所提算法的优越性。

基于群体分布的自适应差分进化算法

李章维,王柳静

计算机科学. 2020, 47 (2): 180-185. doi:10.11896/jsjkx.181202356

摘要 ( 502 )

PDF(2085KB) ( 957 )

参考文献 | 相关文章 | 多维度评价

差分进化算法是一种简单有效的启发式全局优化算法,但是其优化性能受差分进化策略及控制参数取值的影响较大,不合适的策略和参数容易导致算法早熟收敛。因此,针对差分进化算法搜索过程中变异策略和控制参数的选择问题,文中提出了一种基于群体分布的自适应差分进化算法(Population Distribution-based Self-adaptive Differential Evolution,PDSDE)。首先,设计适应因子以衡量当前种群的分布情况,进而实现算法所处进化阶段的自适应判断;然后,根据不同进化阶段的特点,设计阶段特定的变异策略和控制参数,并设计自适应机制以实现算法策略和参数的动态调整,从而平衡算法的全局探测和局部搜索能力,以达到提高算法搜索效率的目的;最后,将所提算法与6种主流改进算法进行比较。15个典型测试函数的数值实验表明,所提算法在平均函数评价次数、求解精度、收敛速度等指标的评价优于文中给出的6种主流改进算法,因此可以证明所提算法的计算代价、优化性能和收敛性能更具优势。

保护区种群迁移动力学优化算法

黄光球,陆秋琴

计算机科学. 2020, 47 (2): 186-194. doi:10.11896/jsjkx.181202338

摘要 ( 344 )

PDF(1856KB) ( 678 )

参考文献 | 相关文章 | 多维度评价

为了求解一些复杂优化问题的全局最优解,基于保护区种群迁移动力学模型,提出了一种新的群智能优化算法,简称PZPMDO算法。在该算法中,假设有很多生物种群生活在某生态系统中,该生态系统被分成两个区域,即非保护区和保护区,对生活在保护区内的生物种群实施各种保护。在非保护区与保护区之间存在种群迁移通道,若某区域内的某生物种群的密度过高,该生物种群就会自发地迁移到低密度区域,从而导致低密度区域内的生物种群受到迁移过来的生物种群的影响;若某生物种群的占比越大,该生物种群的影响也就越大;若某生物种群越强壮,该生物种群就越会将其优势传播给其他生物种群。不同区域内的各生物种群因生存竞争而相互影响,这种影响会体现在种群部分特征间的相互作用上,且该影响是随时间变化的。文中采用ZGI指数描述一个生物种群的强弱程度,利用保护区种群迁移动力学模型、种群迁移和相互影响关系构造算子。PZPMDO算法拥有8个算子,且演化时每次仅处理总变量数的1/1000~1/100,具有搜索速度快和全局收敛性的特点,适用于求解维数较高的全局优化问题。

基于篇章层次结构的商品评论摘要

张宜飞,王中卿,王红玲

计算机科学. 2020, 47 (2): 195-200. doi:10.11896/jsjkx.181202410

摘要 ( 472 )

PDF(1461KB) ( 773 )

参考文献 | 相关文章 | 多维度评价

商品评论摘要是从一个商品的所有评论中抽取出一系列有序的能够代表评论广泛意见的句子作为该商品的综合评论。篇章层次结构分析旨在对篇章内部各个语义单元之间的层次结构和语义关系进行分析。由此可见,分析篇章层次结构有利于更加准确地判断篇章内各个语义单元的语义信息和重要程度,这对于抽取篇章的重要内容有很大帮助。因此,文中提出了一种基于篇章层次结构的商品评论摘要方法。该方法基于LSTM(Long Short Term Memory Network)神经网络构建抽取式商品评论摘要模型,并利用注意力机制将篇章层次结构信息作为判断篇章单元重要程度的参照加入该模型中,以便更加准确地抽取出商品评论中的重要内容,从而提升整个任务的性能。将所提方法在Yelp 2013数据集上进行实验,并在ROUGE评价指标上进行评测。实验结果表明,加入篇章层次结构信息后,模型的ROUGE-1值达到了0.3608,与仅考虑评论句子信息的标准LSTM方法相比提升了1.57%,这说明在商品评论摘要任务中引入篇章层次结构信息能够有效地提升该任务的性能。

基于可能回答集程序的多Agent信念协调

吴甜甜,王洁

计算机科学. 2020, 47 (2): 201-205. doi:10.11896/jsjkx.190100101

摘要 ( 320 )

PDF(1369KB) ( 628 )

参考文献 | 相关文章 | 多维度评价

多Agent系统(Multi-Agent System,MAS)是人工智能领域的一个非常活跃的研究方向。在多Agent系统中,由于Agent之间信念的差异,会不可避免地造成行动冲突。Sakama等提出的严格协调方法只适用于各Agent之间有共同信念的情境,当不存在共同信念时,此协调方法无解。针对该问题,文中提出了一种基于可能回答集程序(Possibilistic Answer Set Programming,PASP)的信念协调方法。首先,针对各Agent的不同信念集,基于加权定量的方法计算PASP的回答集相对Agent信念的满足度,以此来弱化某些信念,并且引入缺省决策理论推理得到Agent信念协调的一致解。然后,根据一致解建立一致的协调程序,将其作为Agent共同认同的背景知识库。最后,以dlv求解器为基础实现了多Agent信念协调算法,使Agent之间可以自主完成信念协调。文中以旅游推荐系统为例,说明该算法能够打破严格协调方法的局限,有效解决各Agent之间无共同信念时的协调问题。

基于Logistic模型和随机差分变异的正弦余弦算法

徐明,焦建军,龙文

计算机科学. 2020, 47 (2): 206-212. doi:10.11896/jsjkx.181102197

摘要 ( 420 )

PDF(2073KB) ( 700 )

参考文献 | 相关文章 | 多维度评价

针对标准正弦余弦算法(Sine Cosine Algorithm,SCA)处理全局优化问题时存在收敛速度慢、易陷入局部最优和求解精度低的缺点,文中提出了一种基于非线性转换参数和随机差分变异策略的改进正弦余弦算法(LS-SCA)。首先,设计一种基于Logistic模型的非线性转换参数策略以平衡算法的全局搜索和局部开发能力;其次,引入随机差分变异策略以增强种群的多样性与避免算法陷入局部最优;最后,将非线性转换参数和随机差分变异策略进行融合。一方面,选取12个标准测试函数进行全局寻优的仿真实验。结果表明,与其他SCA类算法和最新智能算法相比,LS-SCA在收敛精度和收敛速度指标上均能达到较优的效果。其中,随机差分变异策略对LS-SCA全局寻优能力的提升尤为明显。另一方面,利用LS-SCA优化神经网络参数解决了两类经典分类问题。实验结果表明,与传统的BP算法和其他智能算法相比,基于LS-SCA的神经网络能达到较高的分类准确率。

区块链在车载自组网中的应用研究及展望

周畅,陆慧梅,向勇,吴竞邦

计算机科学. 2020, 47 (2): 213-220. doi:10.11896/jsjkx.190600001

摘要 ( 667 )

PDF(1604KB) ( 1607 )

参考文献 | 相关文章 | 多维度评价

车载自组织网络(简称车载网)是一种由车辆节点和路侧节点(基础设施)构成的自组织网络,是智能交通(Intelligent Transport System,ITS)领域的核心技术之一。区块链的分布式数据存储、点对点传输、共识机制、加密算法等技术可保证车载网中的安全性、可靠性,但是区块链的强一致性和链式结构特点无法满足车载网的两个主要特性,即车辆节点快速移动性和网络不稳定性。文中重点研究区块链在车辆节点移动性和网络不稳定性条件下的节点、存储、跨链、共识等技术特性,分析存在的问题并提出解决方法,最后展望区块链在车载网中的新应用及研究方向,为今后的研究提供参考。

基于节点兴趣和Q-learning的P2P网络搜索机制

李龙飞,张泾周,王鹏德,郭鹏军

计算机科学. 2020, 47 (2): 221-226. doi:10.11896/jsjkx.190400002

摘要 ( 510 )

PDF(1847KB) ( 607 )

参考文献 | 相关文章 | 多维度评价

将智能手机设备加入基于非结构化P2P网络的资源共享系统中能够满足人们对资源共享的多样化、便利性、高频性、实时性、高效性等要求,但是该系统网络规模的扩张和网络节点互异性的加大,必将导致系统资源搜索效率的降低、冗余信息的剧增以及网络更加不稳定。为了解决这些问题,文中设计了一种改进的基于节点兴趣和Q-learning的资源搜索机制。首先将节点根据兴趣相似度进行兴趣聚类,划分兴趣集,然后根据兴趣集中节点的能力值构建兴趣树,该结构避免了消息环路的产生,极大地降低了冗余信息;在资源搜索中,兴趣树内采用洪泛算法转发消息,兴趣树之间采用基于Q-learning的消息转发机制,不断强化最可能获取目标资源的路径,查询消息优先在这些路径上传播。另外,针对“热点”资源问题,设计了自适应热点资源索引机制,减少了重复路径搜索,进一步减少了冗余消息量;针对节点失效的问题,给出了根节点冗余机制和捎带检测的策略方法,分别解决了根节点失效和普通节点失效导致的兴趣树的不完整性问题,分析表明该方法能够减少消息冗余量。仿真实验结果表明,与GBI-BI算法和Interest CN算法相比,所提搜索算法能够提高命中率,缩短响应时间,减少冗余信息,具有较好的综合性能,最终解决了由于智能手机设备加入P2P网络导致的资源搜索效率下降、网络流量开销大的问题。

基于循环神经网络的通信卫星故障检测

刘云,尹传环,胡迪,赵田,梁宇

计算机科学. 2020, 47 (2): 227-232. doi:10.11896/jsjkx.190600147

摘要 ( 601 )

PDF(1523KB) ( 1085 )

参考文献 | 相关文章 | 多维度评价

随着现代航天事业的飞速发展,通信卫星的结构日益复杂,其故障也逐渐增多,通信卫星的故障检测已成为当前航天领域关注的重点问题。目前,各大航天机构对故障的检测仍以简单的上下限阈值检测为主,只能检测出少部分特定的故障。早期利用传统机器学习算法进行检测的研究也仅能检测出数量特征上的故障。针对传统的机器学习算法难以有效学习遥测数据趋势变化的问题,文中提出了基于长短时记忆(Long Short-term Memory,LSTM)网络的阈值化方法。通过LSTM预测模型来学习卫星遥测数据的趋势变化,同时以最大化相关系数与F1分数的方式为多维遥测数据的故障判定确定合适的阈值,此方式能够有效地通过卫星遥测数据的趋势变化来判断故障。实验数据采用某航天机构提供的时长为2年的24维通信卫星遥测数据,其核心模型LSTM网络在NVIDIA Corporation GP102[TITAN Xp]上训练,最终整体模型的准确率为99.34%,查准率为81.93%,查全率为94.62%。同时,与传统机器学习算法以及基于LSTM的非阈值方法进行对比,该模型的精度明显更高。实验结果表明,LSTM网络能够高效地学习到卫星遥测数据的趋势变化特征;同时,采用合适的方法选定阈值,能够有效地检测出通信卫星发生的故障,在很大程度上成功地解决航天领域中通信卫星的故障检测难题。

基于异步优势动作评价的RFID室内定位算法

李丽,郑嘉利,王哲,袁源,石静

计算机科学. 2020, 47 (2): 233-238. doi:10.11896/jsjkx.190100070

摘要 ( 391 )

PDF(2240KB) ( 675 )

参考文献 | 相关文章 | 多维度评价

针对现有的RFID室内定位算法的精度容易受到环境因素影响的问题,提出了一种基于异步优势动作评价(Asynchronous Advantage Actor-critic,A3C)的RFID室内定位算法。该算法的主要步骤为:1)将RFID的信号强度RSSI值作为输入值,多个线程子动作网络并行交互采样学习,利用子评价网络评价动作值的优劣,使模型不断优化,找到最优信号强度RSSI值,并训练定位模型;子线程网络定期将网络参数异步更新到全局网络上,全局网络最后输出参考标签的具体位置,同时训练得到异步优势动作评价定位模型。2)在线定位阶段,当待测目标进入待测区域时,记录待测目标的信号强度RSSI值,将其输入异步优势动作评价定位模型中,子线程网络从全局网络中获取最新定位信息,对待测目标进行定位,最后输出目标的具体位置。实验数据表明,基于异步优势动作评价的RFID室内定位算法与传统的基于向量机(Support Vector Machines,SVM)定位、基于极限学习机(Extreme Learning Machine,ELM)定位、基于多层神经网络定位(Multi-Layer Perceptron,MLP)的RFID室内定位算法相比,定位平均误差分别下降了66.114%,50.316%,44.494%;定位稳定性分别平均提高了59.733%,53.083%,43.748%。实验结果表明,基于异步优势动作评价的RFID室内定位算法在处理大量室内定位目标时具有较好的定位性能。

基于地址空间的树型网络地址分配

刘宁宁,樊建席,林政宽

计算机科学. 2020, 47 (2): 239-244. doi:10.11896/jsjkx.190400130

摘要 ( 589 )

PDF(2205KB) ( 709 )

参考文献 | 相关文章 | 多维度评价

无线传感器网络(WSN)是由大量部署在监测区域内的微型传感器节点通过无线通信方式组成的一个多跳、自组织的网络。分布式的环境感知能力和简单灵活的部署方式,使得WSN成为影响人们日常生活的重要因素;并且随着微电子技术和通信技术的不断发展,WSN已被广泛应用于国防军事、环境监测、医疗健康、智能家居和工业制造等领域。ZigBee是一种支持低速率传输、低功耗、安全可靠的面向可用产品及应用的无线个人局域网的全球标准,与蓝牙、Wi-Fi等其他无线个人局域网标准不同,其提供了低功耗的无线树状和网状网络,可以支持上千个无线传感器设备在网络中使用。ZigBee技术的分布式地址分配机制(Distributed Address Assignment Mechanism,DAAM)中存在网络孤立节点,这种情况导致闲置地址无法使用,且造成了资源浪费。针对这一问题,提出了一种新的树型网络地址分配和路由算法(Address Assignment Algorithm for Tree Network,AAN),在保持与原有协议兼容的基础上通过协调器节点对网络进行维护和控制,各节点根据算法设定的步骤依次进行地址空间分配。该算法可以减少网络中的闲置地址空间及网络中的孤立节点数,优化网络拓扑结构,减少建立与维护路由表所需的时间与存储空间。仿真实验结果表明,所提算法在地址分配成功率、孤立节点数以及网络深度方面优于DAAM算法。

基于增强BiLSTM-CRF模型的推文恶意软件名称识别

古雪梅,刘嘉勇,程芃森,何祥

计算机科学. 2020, 47 (2): 245-250. doi:10.11896/jsjkx.190500063

摘要 ( 582 )

PDF(1644KB) ( 965 )

参考文献 | 相关文章 | 多维度评价

针对推文中恶意软件名称识别任务存在的文本简短、非正式、实体类别单一以及实体歧义等问题,提出了一种基于BERT-BiLSTM-Self-attention-CRF的实体识别方法,以实现推文中恶意软件名称的自动识别。在BiLSTM-CRF模型的基础上,利用BERT模型编码单词语境信息,提升词嵌入的上下文语义质量,增强原有模型的语义消歧能力;同时,借助Self-attention机制学习单词间关系和句子结构特征,利用加权表征帮助单一类别实体的解码,以提升恶意软件名称实体的识别效果。通过构建包含恶意软件名称实体的推文标记数据集进行实验测试,结果表明,提出的方法可以实现更好的性能,其精确率、召回率、F1值分别为86.38%,84.73%,85.55%,相较于基线模型BiLSTM-CRF,F1值提升了12.61%。

基于改进边权重的成对马尔可夫随机场模型的社交异常账号检测方法

宋畅,禹可,吴晓非

计算机科学. 2020, 47 (2): 251-255. doi:10.11896/jsjkx.190600172

摘要 ( 932 )

PDF(1465KB) ( 679 )

参考文献 | 相关文章 | 多维度评价

社交媒体系统为人们提供了便利的共享、交流和协作平台。人们在享受社交媒体的开放性和便利性时,可能会发生许多恶意行为,例如欺凌、恐怖袭击计划和欺诈信息传播。因此,尽可能准确、及早地发现这些异常活动,以防止灾难和袭击,是非常重要的。近年来,随着在线社交网络(OSN)如Twitter,Facebook,Google+,LinkedIN等的成功,丰厚的利益资源使得它们成为了攻击者的目标。社交网络的开放性,使其特别容易受到异常账号攻击的威胁。现有基于图形的最先进分类模型大多使用首先为图的边分配权重,在加权图中迭代地传播节点的信誉分数,并使用最终的后验分数来对节点进行分类的方法。边权重的分配是其中一项重要的任务,此参数将直接影响检测结果的准确度。为此,文中针对社交媒体中异常账号的检测任务,分析了基于社交图全局结构的方法,通过在成对马尔可夫随机场模型中改进边权重的计算方法,使其能够在迭代过程中自适应优化,提出了准确度更高的GANG+LW,GANG+LOGW和GANG+PLOGW算法。这3种算法使用了不同的改进边权重的方法。实验证明,新提出的方法相对于基本的成对马尔可夫随机场模型,可取得更准确的异常账号检测结果,3种算法中GANG+PLOGW得到的结果最好。结果证明,此改进模型在检测社交网络中的异常账号时,能够更有效地解决问题。

一种面向云存储的数据动态验证方案

李树全,刘磊,朱大勇,熊超,李锐

计算机科学. 2020, 47 (2): 256-261. doi:10.11896/jsjkx.181202371

摘要 ( 497 )

PDF(1569KB) ( 772 )

参考文献 | 相关文章 | 多维度评价

云存储是一种新型的数据存储体系结构,云储存中数据的安全性、易管理性等也面临着新的挑战。由于用户在本地不再保留任何数据副本,无法确保云中数据的完整性,因此保护云端数据的完整性是云数据安全性研究的重点方向。数据完整性证明(Provable Data Integrity,PDI)被认为是解决这一问题的重要手段。文中提出了一种面向云存储环境的、基于格的数据完整性验证方案。本方案在已有研究的基础上,基于带权默克尔树(Ranked Merkle Hash Tree,RMHT),实现了云数据的动态验证。方案实现了数据粒度的签名,降低了用户方生成认证标签所需的消耗;引入RMHT对数据进行更改验证,支持数据动态更新;具有较强的隐私保护能力,在验证过程中对用户的原始数据进行盲化,使得第三方无法获取用户的真实数据信息,用户的数据隐私得到了有效的保护。此外,为了防止恶意第三方对云服务器发动拒绝服务攻击,方案中只有授权的第三方才能对用户数据进行完整性验证,这在保护云服务器安全的同时也保障了用户数据的隐私性。安全分析和性能分析表明,该方案不仅具有不可伪造性、隐私保护等特性,其签名计算量也优于同类算法。

一种易部署的Android应用程序动态监测方案

苏祥,胡建伟,崔艳鹏

计算机科学. 2020, 47 (2): 262-268. doi:10.11896/jsjkx.190100117

摘要 ( 426 )

PDF(1550KB) ( 1629 )

参考文献 | 相关文章 | 多维度评价

Android应用程序动态监测方案通常有3种实现形式:1)定制ROM镜像;2)在获取设备Root权限的情况下,修改系统文件或者利用ptrace技术对目标进程注入代码;3)重打包APK。这3种方式都是以侵入式方式实现,依赖于系统环境,难以部署到不同的设备上。针对上述问题,文中提出了一种基于插件化技术的非侵入式动态监测方案。该方案将监测系统以宿主App形式发布并安装到目标设备上;将待监测应用以插件形式加载到宿主App环境中运行,同时由宿主App加载相应的监控模块,完成对待监测App应用行为的动态监测。在待监测应用作为插件运行前,预先启动一个进程,通过动态代理方式对该进程中的Binder服务代理对象进行替换,将Binder服务请求重定向到虚拟服务进程中的虚拟服务进行处理,从而使待监测应用中的四大组件能在预先启动的进程中运行。然后,在待监测应用Application的初始化过程中加载Java层和Native层监控模块,完成监控。根据该思想,在VirtualApp沙箱基础上实现了原型系统AndroidMonitor,并在Nexus5设备上对其进行测试。实验结果表明,与其他方案相比,该方案虽然会使待监测应用的启动时间增加1.4s左右,但不需要获取设备系统Root权限,能够同时对Java层和Native层的敏感API进行监控;同时,引入了设备信息防护模块,以防止App监控过程中设备信息发生泄露。系统以App形式发布,容易部署到不同设备上,同时适应多种应用场景。

基于“奖励制度”的DPoS共识机制改进

陈梦蓉,林英,兰微,单今朝

计算机科学. 2020, 47 (2): 269-275. doi:10.11896/jsjkx.190400013

摘要 ( 699 )

PDF(1874KB) ( 1625 )

参考文献 | 相关文章 | 多维度评价

共识机制是区块链技术的核心。授权股权证明(Delegated Proof-of-Stake,DPoS)作为一种共识机制,其中每个节点都能够自主决定其信任的授权节点,从而实现快速共识验证。但DPoS机制仍然存在着节点投票不积极以及节点腐败的安全问题。针对这两个问题,文中提出了基于奖励的DPoS改进方案,投票奖励用以激励节点积极参与投票,举报奖励用以激励节点积极举报贿赂节点。Matlab仿真结果表明,投票奖励方法的引入提高了节点投票的积极性。与原始DPoS共识机制下投票节点数占比45%~50%相比,两种投票奖励方法使得参与投票节点数占比分别增加至65%~70%以及55%~60%。相比原始DPoS共识机制下不接受贿赂节点占比会随着恶意节点贿赂力度的加大而不断减少的情况,举报奖励方法的引入使得选择举报节点的占比出现了明显增加,在投票轮数为20的情况下,选择举报节点的总占比可以增至54%。实验结果表明,奖励制度的引入不但能够提高节点投票的积极性,而且增强了普通节点对恶意节点的贿赂抵抗性,使恶意节点成“代理人节点”的概率变小,保障了网络安全性。

基于快速置换和可选择像素扩散的医疗图像加密算法的安全性分析

禹峰,龚馨慧,王世红

计算机科学. 2020, 47 (2): 276-280. doi:10.11896/jsjkx.190100051

摘要 ( 434 )

PDF(2010KB) ( 607 )

参考文献 | 相关文章 | 多维度评价

图像加密算法的安全性是最基本和最重要的。医疗图像加密是保护患者隐私的一种手段,分析医疗图像加密算法的安全性,对设计医疗图像加密算法、增强算法的安全性和促进医疗图像加密算法的应用非具有常重要的意义。最近,Hua等提出了一种基于快速置换和可选择像素扩散的医疗图像加密方案。加密方案的一个关键操作是在图像的四周插入随机值,然后通过置乱使得随机值分散到整幅图像,最后通过扩散混乱等操作加密整幅图像。每次加密都会产生不同的随机值,即使加密相同的图像,每次加密得到的密文也不一样,这就保证了“一次一密”的加密效果。文中采用差分分析和选择密文攻击,从理论上详细地分析了Hua等提出的算法。首先分析解密过程,通过差分分析构造明文-密文的线性关系,并根据构造的线性关系建立密码本;然后使用密码本攻击便可破解该算法。密码本的大小与图像尺寸相关,若密文图像的尺寸为M×N,则构造的密码本包含(M×N＋1)个明文-密文对。仿真实验验证了理论分析的正确性。为了提高该算法的安全性,抵抗文中提出的密码本攻击,进一步提出了一种基于差分分析的改进方案。该方案引入了与明文相关的置换矩阵。仿真实验结果和统计分析结果表明,改进方案不仅继承了原算法的优点,而且具有很好的抗差分攻击能力。

基于CNN的恶意Web请求检测技术

崔艳鹏,刘咪,胡建伟

计算机科学. 2020, 47 (2): 281-286. doi:10.11896/jsjkx.181202455

摘要 ( 485 )

PDF(1518KB) ( 1098 )

参考文献 | 相关文章 | 多维度评价

目前,基于卷积神经网络的Web恶意请求检测技术领域内只有针对URL部分进行恶意检测的研究,并且各研究对原始数据的数字化表示方法不同,这会造成检测效率和检测准确率较低。为提高卷积神经网络在Web恶意请求检测领域的性能,在现有工作的基础上将其他多个HTTP请求参数与URL合并,将数据集HTTP data set CSIC 2010 和 DEV_ACCESS作为原始数据,设计对比实验。首先采用6种数据数字向量化方法对字符串格式的原始输入进行处理;然后将其分别输入所设计的卷积神经网络,训练后可得到6个不同的模型,同时使用相同的训练数据集对经典算法HMM,SVM和RNN进行训练,得到对照组模型;最后在同一验证集上对9个模型进行评估。实验结果表明,采用多参数的Web恶意请求检测方法将词汇表映射与卷积神经网络内部嵌入层相结合对原始数据进行表示,可使卷积神经网络取得99.87%的准确率和98.92%的F1值。相比其他8个模型,所提方法在准确率上提升了0.4~7.7个百分点,在F1值上提升了0.3~13个百分点。实验充分说明,基于卷积神经网络的多参数Web恶意请求检测技术具有明显的优势,且使用词汇表映射和网络内部嵌入层对原始数据进行处理能使该模型取得最佳的检测效果。

边缘计算构架下基于孤立森林算法的DoS异常检测

陈佳,欧阳金源,冯安琪,吴远,钱丽萍

计算机科学. 2020, 47 (2): 287-293. doi:10.11896/jsjkx.190100047

摘要 ( 595 )

PDF(2206KB) ( 1209 )

参考文献 | 相关文章 | 多维度评价

随着网络技术的快速发展,网络攻击带来了极大的负面影响,因此网络安全问题亟待解决。针对网络攻击中的拒绝服务(Denial of Service,DoS)攻击,提出了一种基于边缘计算框架的孤立森林网络异常检测方法。该方法根据每个边缘节点的特性实现对模型训练任务的合理分配,有效地提高了边缘节点的利用效率;同时,利用边缘计算的特点实现了对云中心模型训练任务的分流,从而更好地减少系统的耗时,减轻云中心的任务负担。为了验证所提方法的有效性,对10%-KDDCUP99网络数据集进行预处理,并提取部分数据用于实验。实验结果表明,与支持向量机(Support Vector Machine,SVM)和多层感知器(Multi-Layer Perceptron,MLP)方法相比,所提方法将系统建立时间分别缩短了90%和60%,且得出的曲线下面积(Area Under Curve,AUC)可达0.9以上,这证明该方法能够在确保较高异常检测性能条的件下有效减少异常检测系统的建立时间。

面向云端的安全高效的电子健康记录

屠袁飞,张成真

计算机科学. 2020, 47 (2): 294-299. doi:10.11896/jsjkx.181202256

摘要 ( 253 )

PDF(1846KB) ( 644 )

参考文献 | 相关文章 | 多维度评价

随着移动设备的发展和普及,基于体域网(Body Area Network,BAN)的电子健康记录正变得越来越流行。人们将从体域网中获取的医疗数据备份到云端,导致几乎任何地方的医疗人员都能够使用移动终端来访问用户的医疗数据。但是对于一些病患来说,这些医疗数据属于个人隐私,他们只想让拥有某些权限的人查看。文中提出了一种高效、安全的细粒度访问控制方案,不仅实现了授权用户对云存储中医疗数据的访问,而且还支持某些特权医生对记录进行修改。为了提高整个系统的效率,加入了先匹配再解密的手段,用于执行解密测试而不解密。此外,该方案将双线性配对操作外包给网关,而不会泄露数据内容,因此在很大程度上消除了用户的解密开销。性能评估显示所提解决方案在计算、通信和存储方面的效率得到了显著提高。

WSNs中基于信任度的节能机会路由算法

苏凡军,杜可怡

计算机科学. 2020, 47 (2): 300-305. doi:10.11896/jsjkx.190100172

摘要 ( 469 )

PDF(1691KB) ( 630 )

参考文献 | 相关文章 | 多维度评价

为了防止网络中存在的潜在恶意节点被加入到机会路由的候选转发集中,减少网络能量的消耗,并保证数据的可靠传输,提出了一种在无线传感器网络中基于信任度的节能机会路由(Trust Based Energy Efficient Opportunistic Routing in Wireless Sensor Networks,TBEEOR)算法。该算法根据网络的拓扑结构计算节点的代数连通度,进而计算节点的连通度诚意;再联合节点的转发诚意和ACK诚意,利用信息熵的概念计算综合信任度;最后,用节点的综合信任度来计算节点之间通信和协作造成的能量消耗,从而得到网络的预期成本。此外,该算法能够有效地识别和判断网络中的恶意节点,进一步减小了恶意节点对网络性能的影响。实验结果表明,TBEEOR算法有效地保证了数据传输的可靠性,有助于延长网络生命周期,从而增加了网络吞吐量,减少了网络能量消耗。

多Agent的航空器滑行策略优化

张红颖,申荣苗,罗谦

计算机科学. 2020, 47 (2): 306-312. doi:10.11896/jsjkx.181202400

摘要 ( 492 )

PDF(2427KB) ( 794 )

参考文献 | 相关文章 | 多维度评价

快速发展的民航事业导致很多机场容量不足。为缓解大型机场交通拥堵的现状,研究了航空器滑行策略优化问题。滑行路径优化是指在特定的时间段内,根据机场资源信息和地面运行管理系统对进离场航空器在跑道和停机位之间的距离进行优化管理。通过深入剖析机场地面的网络结构,综合考虑滑行冲突、地面运行规则等因素,提出了多Agent滑行策略优化方法,该方法提升了机场资源利用率;基于地面网络链路结构的概念,建立了航空器滑行策略优化模型;结合多Agent的基本理论,设计了跑道出口选择概率函数和多Agent系统滑行路径优化结构,以寻求航空器的最优滑行路径。以国内某大型机场的实际情况为研究背景进行了航空器滑行策略实验,结果表明,与以往的算法相比,多Agent滑行策略优化方法的效果更为显著。设置跑道口的速度和同一交叉口航空器的最小间隔距离,通过对跑道出口的选择和Agent间的交互协商,航空器能够对原滑行路径进行有效调整,并缩短其在机场场面上的滑行时间。与最短路径算法相比,多Agent滑行策略方法在航空器的总滑行距离、航空器在滑行道上的密度以及平均等待时间方面的优化效果更好,且其对滑行道资源的分配更合理。其中,航空器在节点处的平均等待时间减少了8.26%。所提策略可有效缓解机场交通拥堵的现状,提高场面运行效率,对减少航空器延误和保障机场的运营安全具有重要意义。

基于RBEC的副本动态存储方法

洪海诚,陈丹伟

计算机科学. 2020, 47 (2): 313-319. doi:10.11896/jsjkx.181102161

摘要 ( 558 )

PDF(1604KB) ( 532 )

参考文献 | 相关文章 | 多维度评价

随着云存储技术的飞速发展,现有的云存储架构和存储模式都以一种静态的方式呈现在用户和攻击者面前,使得数据面临着更多的安全威胁。针对这种数据静态存储模式的不足,文中提出了一种基于二元随机扩展码(RBEC)的副本动态存储方法。该方法利用一种网络编码将数据块存储在云节点上,通过基于二元随机扩展码进行节点数据变换,可随机时变地改变节点的数据信息,通过变换攻击面来增加攻击者实施攻击的复杂度和成本,降低系统的脆弱性曝光和被攻击的概率,提高系统的弹性。理论分析和仿真实验结果表明,该方法对变换时的编码计算时间开销在整个动态变换中的占比不高,主要的时间开销是在节点间数据编码块的传输上。此外,文中还将该方法与一般再生码拟态变换方案做了性能对比分析。REBC的特性,即重新生成的编码矩阵满足MDS性质的概率几乎为1,所以文中所提方法的编码过程的性能开销优于一般再生码可能多次变换的性能开销。