计算机科学

第48卷第8期目录

计算机科学. 2021, 48 (8): 0-0.

摘要 ( 235 )

PDF(5199KB) ( 756 )

相关文章 | 多维度评价

数据科学平台:特征、技术及趋势

朝乐门, 王锐

计算机科学. 2021, 48 (8): 1-12. doi:10.11896/jsjkx.210600033

摘要 ( 693 )

PDF(1952KB) ( 4089 )

参考文献 | 相关文章 | 多维度评价

以2015年以来的《Gartner数据科学平台魔力象限系列年度报告》为线索,分析调研35种数据科学平台产品,提出数据科学平台的定义和类型。数据科学平台相关学术研究中的主要科学问题涉及数据科学平台的设计、数据科学平台的可扩展性、基于数据湖的数据科学平台研发、数据科学平台的支持团队协作能力、数据科学平台的开放策略以及数据科学平台工程方法论。数据科学平台的主要特征包括模块化开发及集成能力、开发运维一体化、重视可扩展性、强调用户体验、重视非专业级数据科学家以及重视人机协同场景;数据科学平台的实现需要的关键技术为机器学习、流处理技术、数据规整化、容器化技术和数据可视化;数据科学平台的未来发展趋势主要体现在与人工智能的融合、对开源技术的支持、对非专业级数据科学家的重视、数据治理的集成、数据湖的引入、高级分析及应用的探索、向数据科学全流水线的转型和应用领域的多样化等;数据科学平台的研发活动应遵循以激活数据价值为中心、人在环路(human-in-the loop)的设计模式、开发运维一体化、可用性和可解释性的平衡、数据科学产品生态系统的培育、强调用户体验以及与其他业务系统的集成等设计原则。现阶段的数据科学平台研发亟待在数据偏见与公平性、鲁棒性及稳定性、隐私保护、因果分析、可信任/负责任数据科学平台等方面进行理论突破。

跨模态检索研究进展综述

冯霞, 胡志毅, 刘才华

计算机科学. 2021, 48 (8): 13-23. doi:10.11896/jsjkx.200800165

摘要 ( 1148 )

PDF(3706KB) ( 3711 )

参考文献 | 相关文章 | 多维度评价

随着互联网上多媒体数据的爆炸式增长,单一模态的检索已经无法满足用户需求,跨模态检索应运而生。跨模态检索旨在以一种模态的数据去检索另一种模态的相关数据,其核心任务是数据特征提取和不同模态间数据的相关性度量。文中梳理了跨模态检索领域近期的研究进展,从传统方法、深度学习方法、手工特征的哈希编码方法以及深度学习的哈希编码方法等角度归纳论述了跨模态检索领域的研究成果。在此基础上,对比分析了各类算法在跨模态检索常用标准数据集上的性能。最后,分析了跨模态检索研究存在的问题,并对该领域未来发展趋势以及应用进行了展望。

基于残差注意力网络的地震数据超分辨率方法

周文辉, 石敏, 朱登明, 周军

计算机科学. 2021, 48 (8): 24-31. doi:10.11896/jsjkx.200900034

摘要 ( 652 )

PDF(3843KB) ( 1566 )

参考文献 | 相关文章 | 多维度评价

地震数据在油气勘探、地质勘探领域发挥着至关重要的作用。精确详细的地震数据有助于对油气勘探做出精确指导,减小勘探的风险,从而产生巨大的社会效益和经济效益。在提升地震数据分辨率方面,现有的方法在面对海量数据时,在高分辨恢复、去噪性能和效率上效果欠佳,难以恢复出细节丰富的地质信息,无法满足实际需求。地震数据能够反映地质构造以及地层的组成,具有局部相关性高、全局相关性低的特点。同时,地震数据高频部分通常蕴含着地质勘探等重要信息,如分层、断层信息等。针对地震数据的特点,文中将地震数据重建问题转化为图像超分辨率问题,提出了采用基于生成对抗网络的地震数据超分辨方法。针对地震数据分布具有局部相关性高、全局相关性低的特点,设计残差注意力模块,挖掘地震数据的内在相关性,通过训练含有相对生成对抗损失函数的生成对抗网络模型,来对地震数据进行超分辨率恢复,以得到更加精确的地震数据。在真实的地震数据集上进行了实验验证,结果表明,所提方法在地震数据超分辨上效果良好,在性能指标PSNR和SSIM上有3%~4%的提升,具有较强的实用性。

基于层析分析改进的联邦平均算法

罗长银, 陈学斌, 马春地, 张淑芬

计算机科学. 2021, 48 (8): 32-40. doi:10.11896/jsjkx.201000093

摘要 ( 558 )

PDF(3890KB) ( 1305 )

参考文献 | 相关文章 | 多维度评价

联邦平均(Fedavg)算法采用权重更新来更新全局模型,该算法在权重更新时仅考虑每个客户端数据量的大小,未考虑数据质量对模型的影响。针对该问题,文中提出了基于层次分析改进的联邦平均算法,首次从数据质量的角度来处理多源数据。首先采用熵权法计算数据中各属性的重要度,并将其作为层次分析中准则层的数值,计算每个客户端数据的质量,然后结合客户端数据量的大小,重新计算全局模型中的权重。仿真实验的结果表明,对于中小型数据集而言,使用支持向量机训练的模型准确度最高,达到了85.715 2%;对于大型数据集而言,采用随机森林训练的模型准确率最高,达到了91.932 1%。与传统联邦平均方法相比,所提方法在中小数据集上准确率提升了3.5%,在大数据集上提升了1.3%,能够在提升模型准确率的同时提高数据与模型的安全性。

基于动态附加布隆过滤器的RFID数据冗余处理算法

段雯, 周良

计算机科学. 2021, 48 (8): 41-46. doi:10.11896/jsjkx.200700093

摘要 ( 463 )

PDF(1915KB) ( 932 )

参考文献 | 相关文章 | 多维度评价

针对RFID设备在读取标签信息时产生的高度冗余会造成实时传输压力、存储空间浪费和上层应用分析结果不可靠等问题,提出一种动态附加布隆过滤器算法(Dynamic-Additional Bloom Filter,DATRBF)来清除RFID冗余数据。首先结合RFID动态数据流特点,利用时间和阅读器因素的影响设计了基础布隆过滤器(Time-Reader Bloom Filter,TRBF),然后根据定时间区间内数据量变化动态决定是否调整或附加额外的TRBF,通过附加TRBF从而扩充数组的方式将误判率控制在阈值内,最后结合两个过滤器对数据是否冗余进行综合判断。实验证明,在过滤RFID实时动态数据流中的冗余数据时,DATRBF算法相比传统布隆过滤器(Bloom Filter,BF)和时空布隆过滤器(Temporal-Spatial Bloom Filter,TSBF)有明显的优势,在数据量随机波动时DATRBF的误判率平均约为TSBF的49%,且DATRBF算法能够在数据量持续上升时保持平稳的低误判率。

基于局部回归融合的多核聚类方法

杜亮, 任鑫, 张海莹, 周芃

计算机科学. 2021, 48 (8): 47-52. doi:10.11896/jsjkx.201000106

摘要 ( 528 )

PDF(1461KB) ( 860 )

参考文献 | 相关文章 | 多维度评价

针对现有多核聚类方法较少考虑多核数据局部流形结构以及在多核融合时学习参数过多进而易受多核噪声异常等干扰的问题,文中首先提出了基于局部核回归的聚类方法(CKLR)。该方法通过局部学习来刻画单核数据的流形结构并采用稀疏化的局部核回归系数来进行预测和聚类。文中进一步提出了基于单核局部核回归融合的多核聚类方法(CMKLR)。该方法为每个核矩阵构造对应的稀疏化的局部核回归系数,并采用全局线性加权融合的方式获得了多核数据下的局部流形结构和同样稀疏化的多核局部回归系数。所提方法较好地避免了现有方法的两个缺陷,且该方法仅包含局部邻域大小这一超参数。实验结果表明,所提方法在测试数据集上的聚类性能优于当前的主流多核聚类方法。

基于自编码器和流形正则的结构保持无监督特征选择

杨蕾, 降爱莲, 强彦

计算机科学. 2021, 48 (8): 53-59. doi:10.11896/jsjkx.200700211

摘要 ( 353 )

PDF(3508KB) ( 789 )

参考文献 | 相关文章 | 多维度评价

高维数据中存在着大量的冗余和不相关特征,严重影响了数据挖掘的效率、质量以及机器学习算法的泛化性能,因此特征选择成为计算机科学与技术领域的重要研究方向。文中利用自编码器的非线性学习能力提出了一种无监督特征选择算法。首先,基于自编码器的重建误差选择出单个特征对数据重建贡献大的特征子集。其次,利用单层自编码器的特征权重最终选择出对其他特征重建贡献大的特征子集,通过流形正则保持原始数据空间的局部与非局部结构,并且对特征权重增加L2/1稀疏正则来提高特征权重的稀疏性,使之选择出更具区别性的特征。最后,构造一个新的目标函数,并利用梯度下降算法对所提目标函数进行优化。在6个不同类型的典型数据集上进行实验,并将所提算法与5个常用的无监督特征选择算法进行对比。实验结果验证了所提算法能够有效地选择出重要特征,显著提高了分类准确率和聚类准确率。

基于细粒度差异特征的文本匹配方法

王胜, 张仰森, 陈若愚, 向尕

计算机科学. 2021, 48 (8): 60-65. doi:10.11896/jsjkx.200700008

摘要 ( 405 )

PDF(2010KB) ( 1394 )

参考文献 | 相关文章 | 多维度评价

文本匹配是检索系统中的关键技术之一。针对现有文本匹配模型对文本语义差异捕获不准确的问题,文中提出了一种基于细粒度差异特征的文本匹配方法。首先,使用预训练模型作为基础模型对匹配文本进行语义的抽取与初步匹配;然后,引入对抗学习的思想,在模型的编码阶段人为构造虚拟对抗样本进行训练,以提升模型的学习能力与泛化能力;最后,通过引入文本的细粒度差异特征,纠正文本匹配的初步预测结果,有效提升了模型对细粒度差异特征的捕获能力,进而提升了文本匹配模型的性能。在两个数据集上进行了实验验证,其中在LCQMC数据集上的实验结果显示,所提方法在ACC性能指标上达到了88.96%,优于已知的最好模型。

基于耦合随机投影的张量填充方法

杨宏鑫, 宋宝燕, 刘婷婷, 杜岳峰, 李晓光

计算机科学. 2021, 48 (8): 66-71. doi:10.11896/jsjkx.200900055

摘要 ( 435 )

PDF(1870KB) ( 932 )

参考文献 | 相关文章 | 多维度评价

现代信号处理中,越来越多的领域都需要存储和分析规模大、维度高、结构复杂的数据。张量作为向量和矩阵的高阶推广,在保证原始数据内在关系的前提下,可以更为直观地表示大规模数据的结构性。张量填充作为张量分析的一个重要分支,目前已被广泛应用于协同过滤、图像恢复、数据挖掘等领域。张量填充指从被噪声污染或存在数据缺失的张量中恢复出原始张量的手段,文中着眼于当前张量填充技术中时间复杂度较高的缺点,提出了基于耦合随机投影的张量填充方法。该方法的核心包括两个部分:耦合张量分解以及随机投影矩阵。通过随机投影矩阵,文中将原始高维张量投影到低维空间内生成替代张量,同时在低维空间内实现张量填充,进而提高算法的执行效率。同时,所提算法还利用耦合张量分解将填充后的低维张量映射到高维空间,从而实现原始张量的重构。最后,通过实验分析了所提算法的有效性和高效性。

基于异质信息网络表示学习与注意力神经网络的推荐算法

赵金龙, 赵中英

计算机科学. 2021, 48 (8): 72-79. doi:10.11896/jsjkx.200800226

摘要 ( 370 )

PDF(2391KB) ( 1282 )

参考文献 | 相关文章 | 多维度评价

推荐系统能够有效解决信息过载等问题,得到了国内外众多学者的广泛关注。真实世界中的应用场景往往可以建模成异质信息网络,因此基于异质信息网络表示学习的推荐算法成为了近年来的研究热点。然而,当前的研究工作仍然存在异质信息提取缺乏深度、节点的复杂关系发掘不充分等问题。为解决这些问题,文中提出了基于异质信息网络表示学习与注意力神经网络的推荐算法。首先,提出了保持语义关系与结构拓扑的异质信息网络表示方法;然后,设计了基于元路径的随机游走策略来获取异质信息网络中的节点序列,对序列过滤并生成用户和项目在不同元路径下的表示向量;最后,设计了基于注意力神经网络的推荐算法,将上述向量输入注意力神经网络,深入挖掘表示向量之间的关系以实现有效的推荐。在两个真实数据集上进行实验并与3种主流的算法进行比较,结果表明,所提算法在MAE与RMSE这2个推荐指标方面都有提升,最高提升了8.9%。

基于深度学习的民事案件判决结果分类方法研究

王立梅, 朱旭光, 汪德嘉, 张勇, 邢春晓

计算机科学. 2021, 48 (8): 80-85. doi:10.11896/jsjkx.210300130

摘要 ( 389 )

PDF(1505KB) ( 1868 )

参考文献 | 相关文章 | 多维度评价

裁判文书数量的快速增长对自动化分类提出了迫切要求,然而已有研究缺乏在民事案件这一细分领域下以判决结果为分类标准的方法的研究,无法实现对民事案件判决结果的准确分类。文中将深度学习技术应用于民事案件判决结果分类领域,通过横向对比多种深度学习模型得出了该领域下表现较好的模型,并依据裁判文书的数据特点对该模型进行了进一步的优化。实验结果证明,Transformer模型的判决结果分类的宏精准率、宏召回率和宏F1分数均高于其他模型。通过对数据预处理流程的优化和对Transformer模型位置嵌入方式的优化,模型的性能指标提升了1%～2%。

基于FP-Growth算法和GRNN的电力知识文本挖掘

白勇, 张占龙, 熊隽迪

计算机科学. 2021, 48 (8): 86-90. doi:10.11896/jsjkx.210600031

摘要 ( 618 )

PDF(1738KB) ( 876 )

参考文献 | 相关文章 | 多维度评价

为了提高电力知识文本挖掘的性能,采用FP-Growth算法对影响电力需求的强关联因素进行挖掘,运用广义回归神经网络(General Regression Neural Network,GRNN)算法实现电力需求预测。首先,对待挖掘的电力文本进行指标提取并编码,生成电力文本初始FP-Tree;接着采用FP-Growth算法遍历所有FP-Tree,生成频繁集,过滤掉小于最小支持度的项,留下频数较高的频繁项;然后根据更新后的FP-Tree统计关联项,选择与总用电量增长率关联强的变量生成训练样本;最后采用GRNN算法对电力需求文本进行训练,输入电力需求预测样本,设置平滑因子,通过模式层的输出和加权求和来获得电力需求预测结果。实验结果证明,通过合理设置最小支持度和GRNN的平滑因子,能够获得较好的电力文本挖掘性能,与常用挖掘算法相比,所提算法能够获得更高的电力需求预测准确率。

基于感知损失的遥感图像全色锐化反馈网络

王乐, 杨晓敏

计算机科学. 2021, 48 (8): 91-98. doi:10.11896/jsjkx.200700112

摘要 ( 477 )

PDF(2909KB) ( 942 )

参考文献 | 相关文章 | 多维度评价

全色锐化旨在通过一个高分辨率的单通道全色图像(Panchromatic,PAN)锐化一个低分辨率的多通道多光谱图像(Multispectral,MS),得到一个高分辨率的多通道多光谱图像(High Resolution Multispectral,HRMS),这是遥感图像处理中的重要任务。文中提出了一个基于感知损失的反馈网络,首先对PAN图像和MS图像分别提取细节信息和光谱信息,然后将其合并后利用堆叠的上下采样层和密集连接进行信息融合,利用反馈连接使高层次的信息丰富低层次的信息,最后重建HRMS图像。与传统全色锐化算法相比,所提算法将PAN图像和HRMS图像一起作为网络输出的监督,通过求取PAN图像和网络重建HRMS图像的感知损失使输出图像含有更丰富的空间细节信息。无论是在客观指标还是视觉感受方面,与现有广泛使用的算法相比,所提算法都有更好的效果。

基于随机森林的空域-频域联合特征全参考彩色图像质量评价方法

杨小琴, 刘国军, 郭建慧, 马文涛

计算机科学. 2021, 48 (8): 99-105. doi:10.11896/jsjkx.200700106

摘要 ( 444 )

PDF(2679KB) ( 711 )

参考文献 | 相关文章 | 多维度评价

文中旨在设计一种可以自动评估图像质量,并达到与人类视觉系统相一致的客观评价算法。针对大多数传统的全参考图像质量评价方法只在空域中分析图像,并且在池策略上存在不足,文中提出了一种基于随机森林的空域-频域联合特征全参考彩色图像质量评价方法。该方法首先在空域上提取色度和梯度特征,刻画图像的颜色信息和空间结构信息;在频域上提取log-Gabor滤波器组响应后的纹理细节信息以及空间频率特征,将二者作为联合特征;然后利用随机森林学习特征向量与主观意见得分之间的映射关系,预测客观质量得分。在TID2013,TID2008和CSIQ 3个标准数据库上的实验结果表明,所提方法的综合评价性能优于目前主流的全参考评价算法,尤其是在TID2013数据库上其皮尔逊线性相关系数值达到了0.9397。

基于关键点检测的无锚框轻量级目标检测算法

龚浩田, 张萌

计算机科学. 2021, 48 (8): 106-110. doi:10.11896/jsjkx.200700161

摘要 ( 504 )

PDF(1891KB) ( 1127 )

参考文献 | 相关文章 | 多维度评价

针对基于关键点的目标检测参数量大、检测框误匹配的问题,提出一种轻量级的基于关键点检测的无锚框目标检测算法。首先将输入图片输入优化过的特征提取算法,通过级联角池化与中心池化,输出3个关键点的热力图与它们的嵌入向量;然后通过嵌入向量匹配热力图并画出检测框。文中的创新点在于将SqueezeNet中的轻量级模块firemodule适配至CenterNet,并用深度可分离卷积代替主干网的常规卷积,同时,针对CenterNet的检测框误匹配问题优化了算法输出形式与训练时的损失函数。实验结果表明,改良后的算法使得原有的CenterNet算法模型尺寸缩小为原来的1/7,同时检测精度与速度较YOLOv3,CornerNet-Lite等相同量级的算法仍有所提高。

融合Tamura纹理特征的改进FCM脑MRI图像分割算法

乔颖婧, 高保禄, 史瑞雪, 刘璇, 王朝辉

计算机科学. 2021, 48 (8): 111-117. doi:10.11896/jsjkx.200700003

摘要 ( 379 )

PDF(3273KB) ( 768 )

参考文献 | 相关文章 | 多维度评价

针对FCM算法在分割脑MRI图像时存在噪声敏感性和初始聚类中心随机性的问题,提出一种融合图像Tamura纹理特征的改进FCM图像分割算法。首先提取图像的Tamura纹理特征,将其与灰度特征线性加权构成融合特征。然后使用模糊邻域关系计算像素点的密度,将其与距离关系结合自适应选取初始聚类中心。最后使用融合特征作为更新隶属度和聚类中心的特征约束。实验利用该方法与FCM,D-FCM,WKFCM方法对Brain Web脑MRI数据集中的图像进行分割,并在抗噪性、准确性和运行效率方面进行了比较。实验结果表明,所提算法能获取更优的初始聚类中心,在处理噪声和灰度不均匀图像上表现出更好的鲁棒性,能够快速有效地分割脑MRI图像。

融合时序监督和注意力机制的脉络膜新生血管分割

叶中玉, 吴梦麟

计算机科学. 2021, 48 (8): 118-124. doi:10.11896/jsjkx.200600150

摘要 ( 475 )

PDF(2776KB) ( 1225 )

参考文献 | 相关文章 | 多维度评价

脉络膜新生血管(Choroidal Neovascularization,CNV)一般出现在老年性黄斑变性(Age-related macular degeneration,AMD)晚期,在光学相干断层成像(SD-OCT)中对CNV进行准确分割对AMD的诊疗具有重要意义。文中提出了一种融合时序模型与注意力机制的CNV分割网络。该方法将连续的SD-OCT图像输入分割网络,在编码器部分提取图片多尺度信息,为了更好地提取图片局部特征,又在跳跃连接部分加入注意力门;同时,为了解决分割不连续的问题,在分割网络池化后加入了时序约束网络以构建相邻帧连续性约束,并在损失函数中加入梯度约束以更好地保留病变边界;采用空间金字塔将两部分网络特征图融合以产生分割损失,提高了最终的分割精度。基于患者独立性对12名患者的200组眼睛数据进行实验,该方法的Dice系数为76.3%,overlap达到60.7%,能够在SD-OCT图像中对CNV进行可靠的分割。

基于非凸低秩矩阵逼近和全变分正则化的高光谱图像去噪

陶星朋, 徐宏辉, 郑建炜, 陈婉君

计算机科学. 2021, 48 (8): 125-133. doi:10.11896/jsjkx.200400143

摘要 ( 362 )

PDF(4373KB) ( 1211 )

参考文献 | 相关文章 | 多维度评价

高光谱图像在采集过程中经常受到混合噪声的干扰,严重影响了图像后续应用的性能,因此图像去噪已成为一个极其重要的预处理过程。文中采用非凸正则项代替传统的核范数重新构造逼近问题,使稀疏正则项更贴近本质秩函数的属性,进而提出了一种将非凸代理函数、全变分正则项和l_2,1范数集成于统一框架的混合噪声去除算法。所提算法旨在将退化的高光谱图像以矩阵的形式分解为低秩分量和稀疏项,并利用全变分正则化保持边缘信息,提高了高光谱图像的空间分段平滑性。最后利用非凸代理函数的特殊性质,采用一种基于增广拉格朗日乘子法的迭代算法进行变量优化求解。通过多组实验进行验证,结果表明所提算法不仅能有效地去除混合噪声,而且能较好地保持图像的结构和细节,与现有的其他高光谱去噪方法相比,其在视觉效果和定量评价结果上都明显提升。

基于改进SIFT的无人机航拍图像快速配准研究

胡育诚, 芮挺, 杨成松, 王东, 刘恂

计算机科学. 2021, 48 (8): 134-138. doi:10.11896/jsjkx.200600140

摘要 ( 320 )

PDF(3750KB) ( 1121 )

参考文献 | 相关文章 | 多维度评价

为了提高无人机航拍图像配准的实时性,通过分析无人机巡航高度相对稳定及图像缺乏高频的细节信息的特点,提出了一种改进SIFT特征点检测方法,显著提高了图像的配准速度,并构建了一个用于图像拼接的航空影像数据集进行实验验证。首先分析了SIFT(Scale Invariant Feature Transform)算法关于特征点尺度不变性的理论依据及实现方法,提出了消除冗余性能的策略;然后采用减少高斯金字塔阶数与层数以及选择在每阶的第三层图像开始检测极值点,以减小差分尺度空间规模的方法;最后在数据集上进行了与现有图像配准方法的对比实验。实验结果证明,所提方法能够获得匹配稳健、鲁棒性高的特征点,匹配耗时只有经典SIFT的1/10,该方法为无人机航拍图像快速拼接提供了技术支持。

基于通道注意递归残差网络的图像超分辨率重建

郭琳, 李晨, 陈晨, 赵睿, 范仕霖, 徐星雨

计算机科学. 2021, 48 (8): 139-144. doi:10.11896/jsjkx.200500150

摘要 ( 435 )

PDF(2691KB) ( 1046 )

参考文献 | 相关文章 | 多维度评价

近年来,深度学习被广泛应用于图像超分辨率重建。针对基于深度学习的超分辨率重建方法存在的特征提取不充分、细节丢失和梯度消失等问题,提出一种基于通道注意的递归残差深度神经网络模型,用于单幅图像的超分辨率重建。该模型采用残差嵌套网络和跳跃连接构成一种简洁的递归残差网络结构,能够加快深层网络的收敛,同时避免网络退化和梯度问题。在特征提取部分,引入注意力机制来提升网络的判别性学习能力,以提取到更准确、有效的深层残差特征;随后结合并行映射重建网络,最终实现超分辨率重建。在数据集Set5,Set14,B100和Urban100上进行放大2倍、3倍和4倍的重建测试实验,并从客观指标和主观视觉效果上将所提方法与主流方法进行比较。实验结果显示,所提方法在全部4个测试数据集上的客观指标较对比方法均有明显提升,其中,相比插值法和SRCNN 算法,在放大2倍、3倍、4倍时所提方法的平均PSNR值分别提升了3.965dB和1.56dB、3.19dB和1.42dB、2.79dB和1.32dB。视觉效果对比也表明所提方法能更好地恢复图像细节。

利用全局与局部帧级特征进行基于共享注意力的视频问答

王雷全, 候文艳, 袁韶祖, 赵欣, 林瑶, 吴春雷

计算机科学. 2021, 48 (8): 145-149. doi:10.11896/jsjkx.200800207

摘要 ( 371 )

PDF(2588KB) ( 974 )

参考文献 | 相关文章 | 多维度评价

视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获得高质量的答案。文中提出了一个通过利用局部和全局帧级别的视觉信息来进行视频问答的多共享注意力网络。具体来说,以不同帧率提取视频帧,并以此提取帧级的全局与局部视觉特征,这两种特征包含了多个帧级别特征,用于对视频时间动态建模,再以共享注意力的形式建模全局与局部视觉特征的相关性,然后结合文本问题来推断答案。在天池视频问答数据集上进行了大量的实验,验证了所提方法的有效性。

基于Graph Cuts多特征选择的双目图像分割方法

金海燕, 彭晶, 周挺, 肖照林

计算机科学. 2021, 48 (8): 150-156. doi:10.11896/jsjkx.200800221

摘要 ( 316 )

PDF(2739KB) ( 732 )

参考文献 | 相关文章 | 多维度评价

双目图像分割对后续立体目标合成与三维重建等应用至关重要。由于双目图像中包含场景深度信息,因此直接将单目图像分割方法应用于双目图像尚不能得到理想的分割结果。目前,大多数双目图像分割方法将双目图像的深度特征作为颜色特征的额外通道来使用,仅对颜色特征与深度特征做简单整合,未能充分利用图像的深度特征。文中基于多分类Graph Cuts框架,提出了一种交互式双目图像分割方法。该方法将颜色、深度和纹理等特征融合到一个图模型中,以更充分地利用不同特征信息。同时,在Graph Cuts框架中引入了特征空间邻域系统,增强了图像前景区域与背景区域内部像素点之间的关系,提高了分割目标的完整性。实验结果表明,所提方法有效提升了双目图像分割结果的精确度。

基于深度学习SuperGlue算法的单目视觉里程计

刘帅, 芮挺, 胡育成, 杨成松, 王东

计算机科学. 2021, 48 (8): 157-161. doi:10.11896/jsjkx.200700134

摘要 ( 472 )

PDF(2794KB) ( 1396 )

参考文献 | 相关文章 | 多维度评价

基于特征点法的视觉里程计中,光照和视角变化会导致特征点提取不稳定,进而影响相机位姿估计精度,针对该问题,提出了一种基于深度学习SuperGlue匹配算法的单目视觉里程计建模方法。首先,通过SuperPoint检测器获取特征点,并对得到的特征点进行编码,得到包含特征点坐标和描述子的向量;然后,通过注意力GNN网络生成更具代表性的描述子,并创建M×N型得分分配矩阵,采用Sinkhorn算法求解最优得分分配矩阵,从而得到最优特征匹配;最后,根据最优特征匹配进行相机位姿恢复,采用最小化投影误差法进行相机位姿优化。实验结果表明,在无后端优化的条件下,该算法与基于ORB或SIFT算法的视觉里程计相比,不仅对视角和光线变化更鲁棒,而且其绝对轨迹误差和相对位姿误差的精度均有显著提升,进一步验证了基于深度学习的SuperGlue匹配算法在视觉SLAM中的可行性和优越性。

基于U-Net特征融合优化策略的遥感影像语义分割方法

王施云, 杨帆

计算机科学. 2021, 48 (8): 162-168. doi:10.11896/jsjkx.200700182

摘要 ( 608 )

PDF(2839KB) ( 901 )

参考文献 | 相关文章 | 多维度评价

高分辨率遥感影像的空间分辨率高、地物信息丰富、复杂程度高、各类地物的大小尺寸不一,这为分割精度的提高带来了一定的难度。为提高遥感影像语义分割精度,解决U-Net模型在结合深层语义信息与浅层位置信息时受限的问题,文中提出了一种基于U-Net特征融合优化策略的遥感影像语义分割方法。该方法采用基于U-Net模型的编码器-译码器结构,在特征提取部分沿用U-Net模型的编码器结构,提取多个层级的特征信息;在特征融合部分保留U-Net的跳跃连接结构,同时使用提出的特征融合优化策略,实现了高层语义特征与底层位置特征的融合-优化-再融合。此外特征融合优化策略还使用空洞卷积获取了更多的全局特征,并采用Sub-Pixel卷积层代替传统转置卷积,实现了自适应上采样。所提方法在ISPRS的Potsdam数据集和Vaihingen数据集上得到了验证,其总体分割精度、Kappa系数和平均交并比mIoU 3个评价指标在Potsdam数据集上分别为86.2%,0.82,0.77,在Vaihingen数据集上分别为84.5%,0.79,0.69;相比传统的U-Net模型,所提方法的3个评价指标在Potsdam数据集上分别提高了5.8%,8%,8%,在Vaihingen数据集上分别提高了3.5%,4%,11% 。实验结果表明,基于U-Net特征融合优化策略的遥感影像语义分割方法,在Potsdam数据集和Vaihingen数据集上都能达到很好的语义分割效果,提高了遥感影像的语义分割精度。

基于深层卷积残差网络的航拍图建筑物精确分割方法

许华杰, 张晨强, 苏国韶

计算机科学. 2021, 48 (8): 169-174. doi:10.11896/jsjkx.200500096

摘要 ( 334 )

PDF(2818KB) ( 898 )

参考文献 | 相关文章 | 多维度评价

针对建筑物3D建模场景下所需的建筑物主体轮廓俯视平面图获取成本较高、航拍图建筑物的分割精度低、建筑物屋顶存在干扰物影响分割等问题,文中提出了一种将5个点的位置表示为热图作为网络额外输入通道的基于深层残差网络的航拍图建筑物精确分割方法,该方法在航拍图建筑物的精确分割任务中取得了比较好的分割效果。实验结果表明,该方法具有比传统半自动分割方法Grabcut更高的分割精度和分割效率;具有比DEXTR方法更好的鲁棒性和抗干扰性。该方法可以为建筑物3D重建任务提供高精度的建筑物俯视轮廓图和建筑物顶部图片,还可以在航拍图建筑物数据集的制作过程中,作为一种准确和有效的掩码注释工具或半自动轮廓标注工具,以提高数据集的标注效率。

具有旋转不变性的立体轨道积木编码系统

周佳立, 冯媛媛, 武敏, 吴超

计算机科学. 2021, 48 (8): 175-184. doi:10.11896/jsjkx.200400064

摘要 ( 207 )

PDF(3432KB) ( 643 )

参考文献 | 相关文章 | 多维度评价

因编码问题的目的和对象不同,需要针对问题调整编码方法。针对轨道积木的编码问题,文中提出了轨道积木的二维函数表示方法,并利用相位相关对积木进行识别。首先,将三维轨道积木在二维极坐标系下展开,将轨道积木表示成二维离散函数,由于积木具有旋转不变性,同一积木的表示结果并不唯一,因此引入参数矩阵,以指定积木的标准型。其次,采用相位相关算法判断两个积木的相似度。最后,在二维离散函数表示的基础上,根据积木所包含的基础轨道和相对位置,对积木进行压缩编码。实例表明,该方法能很好地支持内部空间结构的表示,并具有旋转不变性,相比传统的编码方法其更具延拓性。这种编码问题和匹配问题的解决方案对于积木自主搭建及搭建优化问题具有更好的适应性。

基于多判别器的多波段图像自监督融合方法

田嵩旺, 蔺素珍, 杨博

计算机科学. 2021, 48 (8): 185-190. doi:10.11896/jsjkx.200600132

摘要 ( 457 )

PDF(3955KB) ( 690 )

参考文献 | 相关文章 | 多维度评价

针对多波段图像融合领域利用深度学习方法进行融合时过度依赖标签图像导致融合结果受限的问题,文中提出了一种基于多判别器生成对抗网络的多波段图像自监督融合方法。首先,设计并构建反馈密集网络作为特征增强模块,分别提取多波段图像特征并进行特征增强;其次,将多波段图像特征增强结果合并连接,并通过设计的特征融合模块重构融合图像;最后,将初步融合结果与各波段源图像分别输入判别网络,通过多个判别器的分类任务来不断优化生成器,使生成器在输出最终结果的同时保留多个波段图像的特征,以达到图像融合的目的。实验结果表明,与当前代表性的融合方法相比,所提方法具有更好的清晰度和更多信息量,细节信息更丰富,更符合人眼的视觉特性。

基于模糊颜色特征和模糊相似度的图像检索方法

王春静, 刘丽, 谭艳艳, 张化祥

计算机科学. 2021, 48 (8): 191-199. doi:10.11896/jsjkx.200800202

摘要 ( 358 )

PDF(3894KB) ( 691 )

参考文献 | 相关文章 | 多维度评价

基于内容的图像检索系统的性能主要依赖于两个关键技术:图像特征提取和图像特征匹配。文中提取了所有图像的颜色特征,并在颜色特征提取过程中采用了适当的模糊算法以得到图像的模糊颜色特征。图像特征匹配主要取决于两个图像特征向量之间的相似度,文中提出了一种新的模糊相似度衡量方法,该方法利用给定的查询图像与其k幅近邻图像之间的相似度构成查询图像的k维模糊特征向量,利用每幅被检索图像与查询图像的k幅近邻图像之间的相似度构成每幅被检索图像的k维模糊特征向量,计算查询图像的k维模糊特征向量与每幅被检索图像的k维模糊特征向量之间的模糊相似度,并将检索到的图像按照模糊相似度按从大到小的顺序反馈给用户。为了验证提出的模糊颜色特征的有效性,文中在WANG数据集上进行了一系列的实验对比;为了衡量基于不同相似度的图像检索系统的性能,文中在WANG,Corel-5k和Corel-10k数据集上分别进行了一系列的实验对比。实验结果表明,基于最大最小值的图像检索系统的性能优于基于其他3种常用相似度的图像检索系统的性能,而基于模糊相似度的图像检索系统的性能优于基于最大最小值的图像检索系统的性能。在WANG,Corel-5k和Corel-10k数据集上,基于模糊相似度的图像检索系统检索到的前20幅图像的平均查准率比基于最大最小值的图像检索系统检索到的前20幅图像的平均查准率分别高4.92%,17.11%和19.48%;基于模糊相似度的图像检索系统检索到的前100幅图像的平均查准率比基于最大最小值的图像检索系统检索到的前100幅图像的平均查准率分别高4.94%,22.61%和33.02%。

基于深度学习的语音合成与转换技术综述

潘孝勤, 芦天亮, 杜彦辉, 仝鑫

计算机科学. 2021, 48 (8): 200-208. doi:10.11896/jsjkx.200500148

摘要 ( 771 )

PDF(2629KB) ( 3195 )

参考文献 | 相关文章 | 多维度评价

语音信息处理技术在深度学习的推动下发展迅速,其中语音合成和转换技术相结合能实现实时高保真的指定对象、内容的语音输出,在人机交互、泛娱乐等领域具有广泛的应用前景。文中旨在对基于深度学习的语音合成与转换技术进行综述。首先,简要回顾了语音合成和转换技术的发展历程;接着,列举了在语音合成、转换领域的常见公开数据集以便研究者开展相关探索;然后,讨论了从文本到语音模型,包括在风格、韵律、速度等方面进行改进的经典和前沿的模型、算法,并分别对比评述了其效果与发展潜力;进一步针对语音转换进行综述,归纳总结了转换方法与优化思路;最后,总结了语音合成与转换的应用与挑战,并根据其在模型、应用和规范方面所面临的问题,展望了未来在模型压缩、少样本学习和伪造检测方面的发展方向。

分类学习算法的性能度量指标综述

杨杏丽

计算机科学. 2021, 48 (8): 209-219. doi:10.11896/jsjkx.200900216

摘要 ( 405 )

PDF(2253KB) ( 1238 )

参考文献 | 相关文章 | 多维度评价

在机器学习的分类问题研究中,对分类学习算法的正确评价是非常重要的。现实中,许多性能度量指标被从不同的角度提出,文中主要介绍了基于错误率的、基于混淆矩阵的和基于统计显著性检验的三大类性能度量指标,详细地讨论了分类学习算法各性能度量指标的提出背景、意义以及适用范围,分析了各种性能度量之间的差异,提出和分析了各方法中有待进一步研究的问题和方向。进一步,通过实验数据横向(每类度量中各方法之间的类内差异)和纵向(3类度量之间的类间差异)对照了各性能度量指标之间的差异,分析了各性能度量指标在分类算法选择上的一致性。

DragDL:一种易用的深度学习模型可视化构建系统

汤世征, 张岩峰

计算机科学. 2021, 48 (8): 220-225. doi:10.11896/jsjkx.200900045

摘要 ( 465 )

PDF(2913KB) ( 1298 )

参考文献 | 相关文章 | 多维度评价

深度学习在各个领域得到了普遍的应用,但是用户在应用深度学习时仍然面临两方面的问题:1)深度学习有着复杂的理论背景,非专业用户缺乏建模以及调优的背景知识,难以构建性能优化的模型;2)数据预处理、模型训练、预测等过程往往涉及比较复杂的编程实现,给没有程序设计基础的非专业用户在入门时带来了一定的困难。针对以上两点易用性问题,文中提出了一种易用的深度学习模型可视化构建系统DragDL,其目的在于降低用户进行数据预处理、模型训练、监控、在线预测等工作的难度。该系统基于PaddlePaddle框架,支持以拖拽图形算子的方式在画布上搭建深度学习网络结构以及推理预测功能,并将数据预处理操作过程抽象成数据流图展示,以方便用户理解和调试。系统还提供训练过程中的质量监控和性能监控的可视化功能,帮助用户实时观察训练情况。同时,DragDL提供经典模型库帮助用户完成建模任务,支持以微调经典模型的方式构建新的模型,降低用户建模时的难度。DragDL基于集群服务器和Web客户端进行部署,服务器为每个训练任务构建虚拟机服务,并支持大规模异步任务调度,具有一定的并发处理能力。

基于注意力与门控机制相结合的细粒度情感分析

张瑾, 段利国, 李爱萍, 郝晓燕

计算机科学. 2021, 48 (8): 226-233. doi:10.11896/jsjkx.200700058

摘要 ( 554 )

PDF(2623KB) ( 1419 )

参考文献 | 相关文章 | 多维度评价

细粒度情感分析(fine-grained sentiment analysis)是自然语言处理领域的关键问题之一,其通过学习文本的上下文信息来进行特定方面的情感分析,可以帮助用户和商家更好地了解用户评论特定方面的情感。针对基于用户评论的方面级别细粒度情感分析任务,提出了BiGRU-Attention与门控机制(gated mechanisms)相结合的文本情感分类模型。首先,通过整合现有的情感资源,将HOWNET评价情感词典作为种子情感词典,利用SO-PMI算法扩充用户评论情感词典,结合否定词典以及词性信息扩充用户评论情感知识,将用户评价情感知识作为用户评论情感特征信息;其次,引入字词特征与情感特征信息,将它们联合作为模型输入,使用BiGRU对文本进行深层次的特征提取;然后,结合门控机制以及注意力机制,根据获取的方面词信息进一步提取与方面词相关的上下文情感特征信息;最后,在输出层进行文本情感分析,经过softmax获得最终的情感极性。在AIchallenger2018细粒度情感分析中文数据集上,所提模型的Macro_F1_ score值达到了0.7218,性能超过基线系统,获得了较好的实验结果。

融合检索与生成的复合对话模型

杨慧敏, 马廷淮

计算机科学. 2021, 48 (8): 234-239. doi:10.11896/jsjkx.200700162

摘要 ( 440 )

PDF(1427KB) ( 1040 )

参考文献 | 相关文章 | 多维度评价

对话模型是自然语言处理的重要方向之一。现如今的对话模型主要分为基于检索的方式和基于生成的方式。然而,检索方式无法回应语料库中未出现的问句,而生成方式容易出现安全回复的问题。鉴于此,提出融合检索与生成的复合对话模型,通过将检索方式与生成方式相结合来弥补各自的缺点。首先通过检索模块得到K个检索上下文以及所对应的K个检索候选回应。在多回应生成模块中进一步结合检索上下文得到若干生成候选回应。最后的候选回应排序模块分为预筛选与后排序两个步骤。预筛选部分通过计算输入问题与候选回应的相似度得到最优检索回应与最优生成回应,后排序部分进一步选出对于输入问题最合适的回答。实验结果显示,相对于传统模型,复合对话模型在BLUE指标上提升了6%,在多样性指标上提升了12%。

识别关键蛋白质的混合深度学习模型

刘文洋, 郭延哺, 李维华

计算机科学. 2021, 48 (8): 240-245. doi:10.11896/jsjkx.200700076

摘要 ( 274 )

PDF(2119KB) ( 935 )

参考文献 | 相关文章 | 多维度评价

关键蛋白质是有机体生存不可或缺的蛋白质。关键蛋白质的识别有助于理解细胞生命的最低要求、发现致病基因和药物靶点,对疾病的诊治和药物设计等有重要意义。现有方法表明整合蛋白质互作网络和序列的相关特征可以提高对关键蛋白质的识别精度和鲁棒性。文中整合了基因表达谱、蛋白质互作网络和亚细胞位置信息,设计了一种混合神经网络模型IEPHDL。该模型首次使用双向门控循环单元对基因表达谱进行特征学习,使用由多个全连接层组成的深度神经网络对3种数据特征进行深度再学习,充分发挥双向门控循环单元网络、全连接网络、Node2vec在特征学习和表示方面的优势,实现对关键蛋白质的有效识别。实验表明,IEPHDL对关键蛋白质识别的准确率为88.7%,精确率为86.2%,AUC为85.2%,其准确率比当前最优的中心性方法、机器学习方法、深度学习方法依次高出13%,8.9%,3.8%,其他指标也均高于这三者。最后,通过实验分析,证实了双向门控循环单元网络依赖自身强大的特征学习能力,在关键蛋白质识别中起着关键作用。

基于模糊神经网络的运动目标智能分配定位算法

屈立成, 吕娇, 屈艺华, 王海飞

计算机科学. 2021, 48 (8): 246-252. doi:10.11896/jsjkx.200600050

摘要 ( 450 )

PDF(3380KB) ( 694 )

参考文献 | 相关文章 | 多维度评价

为解决特殊应用场景下智能视频监控系统存在的监测范围有限、监控资源分配不合理、运动目标发现不及时等问题,利用雷达探测电磁波穿透能力强、搜索范围大、不受特殊气候及光学条件影响的特点,结合无人机和自动导航小车的灵活性和机动性,提出了一种雷达指引的综合联动视频监控方法,并在此基础上研究了一种基于大地坐标的统一坐标定位体系以及使用粒子群优化算法进行优化的基于模糊神经网络的运动目标智能分配定位算法。该算法根据雷达探测信号可自动计算出每台摄像机在水平、垂直和变焦3个维度上的控制参数,结合联动控制系统实现运动目标的实时定位和追踪。通过对某文物保护现场的实地测试,大地坐标定位体系的目标定位精度达到了99.84%,基于模糊神经网络的运动目标智能分配算法的准确率达到了95%,能够实现目标的精准定位和监控资源的智能分配,具有较高的实际应用价值。

基于Stackelberg与边拉普拉斯矩阵的多智能体系统

张杰, 岳韶华, 王刚, 刘家义, 姚小强

计算机科学. 2021, 48 (8): 253-262. doi:10.11896/jsjkx.200700032

摘要 ( 420 )

PDF(1670KB) ( 901 )

参考文献 | 相关文章 | 多维度评价

针对分布式环境下多智能体系统的交互模型存在效率低、局部冲突消解困难、缺少实际应用场景等问题,基于Stac-kelberg博弈设计了多主多从的交互模型,并将其应用于指挥控制流程中指控方与参与方之间的交互博弈问题。首先通过对Stackelberg博弈模型的优化与多属性决策,设计出多主多从Stackelberg博弈的多智能体系统,并利用半正定的二次型性能指标的最优化正则性,引入一个正则Riccati方程来对Stackelberg博弈下的闭环解问题进行求解;然后基于图论相关知识建立基于边拉普拉斯矩阵的多智能体系统模型以降低复杂问题的求解难度;最后经过数值推导仿真与实验分析,从多个角度验证了模型的高效性与强鲁棒性,证明了所提模型的真实性与高效性。

社交网络中的虚假信息:定义、检测及控制

王剑, 王玉翠, 黄梦杰

计算机科学. 2021, 48 (8): 263-277. doi:10.11896/jsjkx.210300053

摘要 ( 1008 )

PDF(1623KB) ( 3190 )

参考文献 | 相关文章 | 多维度评价

近年来,社交网络上虚假信息传播愈演愈烈,在政治、经济、心理学等方面造成了严重的社会影响。有效检测社交网络中的虚假信息并对其实施控制,是改善社交网络生态系统质量的重要手段,能为人们营造一个安全、可信的网络环境。文中首先通过调研近年来国内外社交网络虚假信息领域的代表性研究,针对虚假信息中的假新闻和谣言,梳理并给出其定义、特征及传播模型,然后介绍了目前虚假信息检测及传播控制的各种手段及方法,最后总结并分析了目前的检测及控制方法中仍存在的问题,继而进一步探讨和提出了该领域未来的研究方向。

基于本地化差分隐私的键值数据关联分析

孙林, 平国楼, 叶晓俊

计算机科学. 2021, 48 (8): 278-283. doi:10.11896/jsjkx.201200122

摘要 ( 489 )

PDF(1897KB) ( 966 )

参考文献 | 相关文章 | 多维度评价

在群智感知系统中,从分布式数据源中持续收集和分析数据可以为先进的数据挖掘模型提供决策支持。由于数据中可能包含个人相关的信息,数据的采集和分析过程中通常伴随着隐私泄露的风险。本地化差分隐私作为先进的隐私保护方案可在用户的隐私性和数据的可用性之间提供较好的权衡。当前,键值数据作为异构类型数据,其同时含有分类数据和数值数据,基于本地化差分隐私在多维度下对键值数据进行关联分析面临着一定的挑战。针对隐私保护前提下键值数据的发布和关联分析问题,首先定义了键值数据的频率关联和均值关联问题,然后提出了适用于键值对的索引独热编码,为键值数据提供本地化差分隐私保护,最后在扰动的数据上对键值数据进行关联分析。基于仿真数据集和真实数据集的实验和理论分析验证了所提方案的有效性。

FAWA:一种异构执行体的负反馈动态调度算法

杨林, 王永杰, 张俊

计算机科学. 2021, 48 (8): 284-290. doi:10.11896/jsjkx.200900059

摘要 ( 612 )

PDF(3054KB) ( 666 )

参考文献 | 相关文章 | 多维度评价

拟态防御作为一种新提出的网络防御方法,其不可预测的特性使其具有出色的防御效果。异构执行体是拟态防御中由各类防御策略构成的异构部件,拟态防御机制通过对异构执行体的动态调度来获得防御的动态性。传统的调度方法具有一定的局限性,针对这些局限性,综合考虑防御的全面性和历史防御成功率信息,提出了一种新的具有负反馈能力的动态调度算法FAWA,并设计了仿真碰撞实验来模拟网络攻防过程,并与其他调度方法的防御效果作对比。实验结果表明,在攻击方随机装载攻击载荷的场景下,FAWA算法的调度效果始终优于其他算法,能够很好地提高防御成功率;在攻击方同样采取负反馈装载的场景下,FAWA算法的调度效果优于完全随机算法、CRA算法和一些改进的动态人工加权算法,但弱于先进先出算法FIFO。另外,仿真实验通过对比攻击方两种载荷装载场景发现,在随机装载场景下,防御方的防御成功率更低,表明此时攻击方的成功率反而优于负反馈装载场景,这一结论说明攻击方也需要在网络攻防博弈中具备随机性和不可预测性,而不应被过度干扰和调整。

基于不完全信息博弈的反指纹识别分析

李少辉, 张国敏, 宋丽华, 王秀磊

计算机科学. 2021, 48 (8): 291-299. doi:10.11896/jsjkx.210100148

摘要 ( 241 )

PDF(1843KB) ( 955 )

参考文献 | 相关文章 | 多维度评价

网络侦察为网络攻击杀伤链的首要阶段,而指纹识别是网络侦察的重要组成部分,是成功实施网络攻击的先决条件。主动防御尤其是欺骗防御理念的推广促使防御者采取指纹信息隐藏、混淆等手段迷惑攻击者,降低其网络侦察效能,从而使防御者在对抗中获得一定的先发优势,攻防双方的对抗行为也因此提前到了网络侦察阶段。欺骗是攻防双方理性主体之间的战略对抗,博弈论正是研究理性决策者之间冲突与合作的定量科学,可以对各种防御性欺骗的参与者、行动等元素进行建模,指导防御者如何更好地利用欺骗技术。文中使用不完全信息动态博弈模型分析网络攻防双方从侦察到攻击的交互过程,分析计算了可能出现的各种精炼贝叶斯纳什均衡,并基于不同场景对均衡结果进行了讨论,为防御者优化欺骗策略达到更好的反指纹识别效果提出建议。

融合语义位置的差分私有位置隐私保护方法

张学军, 杨昊英, 李桢, 何福存, 盖继扬, 鲍俊达

计算机科学. 2021, 48 (8): 300-308. doi:10.11896/jsjkx.200900198

摘要 ( 256 )

PDF(2549KB) ( 911 )

参考文献 | 相关文章 | 多维度评价

如何在位置差分隐私保护中实现更合理的噪声添加是当前研究的一大热点,但在不同的位置添加相同噪声的隐私保护模式会导致服务可用性和隐私保护度下降。针对这问题,提出了一种融合语义位置的差分私有位置隐私保护方法,该方法首先利用“地理不可区分性”的框架构建预期距离,然后通过定义隐私质量函数和需求函数构建语义位置信息来确定不同位置点的敏感度,最后依据位置点的敏感度为不同类型的区域细粒度地添加Laplace噪声,系统地解决了位置隐私保护、服务可用性和时间开销之间的矛盾。在两个公开数据集上进行仿真实验,与已有的方法从基于贝叶斯攻击的查询成功率、基于预期距离量化的服务可用性和时间开销方面进行了对比分析,结果证明了所提方法的可行性和有效性,并且在隐私保护度、服务可用性和时间开销方面取得了更好的权衡。

SSVEP刺激数量对AR-BCI性能的影响

杜钰琳, 黄章瑞, 赵新灿, 刘晨阳

计算机科学. 2021, 48 (8): 309-314. doi:10.11896/jsjkx.200700219

摘要 ( 449 )

PDF(3212KB) ( 746 )

参考文献 | 相关文章 | 多维度评价

基于稳态视觉诱发电位(Steady-State Visual Evoked Potentials,SSVEP)的脑-机接口(Brain-Computer Interfaces,BCI)可将不同频率的视觉刺激目标映射到某种控制指令中以达到控制外部设备的目的。为了探究AR-BCI对刺激数量的可容纳性及多目标刺激数量对AR-BCI分类精度的影响,文中设计了4组不同数量的刺激界面,并通过HoloLens(AR)眼镜进行显示。对比分析表明,随着刺激数量的增加,4种布局的分类正确率逐渐降低,并且刺激目标的位置会影响分类的精度。相同的实验范式下,通过比较计算机屏幕(PC)和AR两种显示终端的分类结果发现,刺激目标数量增多对AR-BCI的分类性能影响较大。目前的研究结果表明,刺激数量是影响AR环境中构建AR-BCI的关键因素。

虚拟现实环境下基于眼动跟踪的导航需求预测与辅助

朱晨爽, 程时伟

计算机科学. 2021, 48 (8): 315-321. doi:10.11896/jsjkx.200500031

摘要 ( 403 )

PDF(2854KB) ( 648 )

参考文献 | 相关文章 | 多维度评价

针对复杂虚拟现实场景中传统导航方法对用户支持不足和用户沉浸感较低等问题,文中提出了基于梯度提升迭代决策树的二分类模型,利用用户在虚拟现实环境中使用辅助导航时需要的眼动数据,来分析和预测用户在任务过程中是否需要辅助导航。根据用户的注视序列对该模型进行评估,得到用户需求判定方法的平均精确率和准确率分别为77.6%与77.2%。此外,文中借助所设计模型实现了一个导航辅助原型系统,通过对用户的眼动数据进行分类,来自动呈现导航辅助界面。实验结果表明,与传统的永久性辅助导航方法相比,新提出的自适应辅助导航具有更好的用户体验。

基于3D卷积神经网络的CSI跨场景手势识别方法

王炽, 常俊

计算机科学. 2021, 48 (8): 322-327. doi:10.11896/jsjkx.200600122

摘要 ( 382 )

PDF(2701KB) ( 1321 )

参考文献 | 相关文章 | 多维度评价

手势识别在人机交互中有着广泛的应用前景,近年来随着无线通信与物联网的飞速发展,几乎任何地方都部署了WiFi设备,并涌现了大批关于WiFi信道状态信息(Channel State Information,CSI)的手势识别方法,目前大多数基于CSI手势识别的研究仅针对了已知场景下的手势识别研究,对于未知场景,需要增加未知场景中的新数据进行额外的学习训练,否则识别精度将会大幅下降,限制了其实用性。针对这一问题,提出了一种基于3D卷积神经网络的CSI跨场景手势识别方法,该系统通过提取与场景无关的特征,并结合3D卷积神经网络学习模型来实现跨场景手势识别,在实验中使用网络公开数据集来验证该方法,结果显示该方法对于6个不同动作手势,在已知场景中的平均识别准确率达到了86.50%,在未知场景中的平均识别准确率达到了84.67%,能够实现跨场景的手势识别。

基于LSTM的多维度特征手势实时识别

刘亮, 蒲浩洋

计算机科学. 2021, 48 (8): 328-333. doi:10.11896/jsjkx.210300079

摘要 ( 445 )

PDF(1763KB) ( 1452 )

参考文献 | 相关文章 | 多维度评价

手势识别广泛应用于传感领域,主要有基于计算机视觉、基于深度传感器与基于运动传感器等3种手势识别方式。基于运动传感器的手势识别具有输入数据少、速度快、直接获取手部三维信息的优点,逐渐成为当前的研究热点。传统基于运动传感器的手势识别本质为模式识别问题,其准确率严重依赖于先验经验提取的特征数据集。与传统的模式识别方法不同,深度学习可以在很大程度上减少人工启发式提取特征的工作量。为解决传统模式识别存在的问题,文中提出一种基于长短期记忆网络(LSTM)的多特征手势实时识别方法,通过充分的实验验证了该方法的性能。该方法首先定义了5种基本手势和7种复杂手势的手势库,基于手部姿态的运动学特征,进一步提取角度特征和位移特征,随后利用短时傅里叶变换(SFTF)提取传感器数据的频域特征,将3种特征输入深度神经网络LSTM中进行训练,从而对采集的手势进行分类识别。同时为了验证所提方法的有效性,通过自设计的手持式体验棒收集了6名志愿者的手势数据作为实验数据集。实验结果表明,提出的识别方法对于基本手势和复杂手势的识别准确率达到94.38%,与传统的支持向量机、K-近邻法和全连接神经网络相比,识别精度提升了近2％。

基于骨骼轨迹聚合模型的课堂交互群体发现

高岩, 闫秋艳, 夏士雄, 张紫涵

计算机科学. 2021, 48 (8): 334-339. doi:10.11896/jsjkx.201000036

摘要 ( 304 )

PDF(2403KB) ( 819 )

参考文献 | 相关文章 | 多维度评价

传统的课堂行为识别方法侧重于交互行为本身的辨识,而非群体发现。课堂环境下实现交互群体的准确定位与发现,是进行个体行为识别的基础,但存在由遮挡造成的行为数据缺失问题。使用骨骼数据表示人体行为及运动轨迹,具有不受光线和背景干扰、数据表达简单等优点。针对骨骼数据的多人交互群体发现进行研究,提出了一种基于骨骼轨迹聚合模型的交互群体发现算法(Interactive Group Discovery Algorithm Based on Skeleton Trajectory Aggregation,IGSTA)。首先,将骨骼数据标准化到以人为中心的坐标系,减小尺寸变化和初始位置不同对识别精度的影响;其次,提出了一种多核表示的骨骼轨迹聚合模型,准确描述了学生交互行为群体的变化;最后,对聚合后的骨骼轨迹进行聚类,实现交互群体发现。采用Kinect获取模拟的课堂学生交互行为视频,通过实验验证了该方法的有效性,即在骨骼节点缺失的情况下,仍可准确发现课堂环境下的学生交互群体。