1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2022年第5期, 刊出日期:2022-05-15
  
目录
第49卷第5期目录
计算机科学. 2022, 49 (5): 0-0. 
摘要 ( 190 )   PDF(5365KB) ( 692 )   
相关文章 | 多维度评价
计算机图形学&多媒体*
面向图像分类的小样本学习算法综述
彭云聪, 秦小林, 张力戈, 顾勇翔
计算机科学. 2022, 49 (5): 1-9.  doi:10.11896/jsjkx.210500128
摘要 ( 992 )   PDF(2244KB) ( 1598 )   
参考文献 | 相关文章 | 多维度评价
目前,以深度学习为代表的人工智能算法凭借超大规模数据集以及强大的计算资源,在图像分类、生物特征识别、医疗辅助诊断等领域取得了优秀的成果并成功落地。然而,在许多实际的应用场景中,因诸多限制,研究人员无法获取到大量样本或者获取样本的代价过高,因此研究图像分类任务在小样本情形下的学习算法成为了推动智能化进程的核心动力,同时也成为了当下的研究热点。小样本学习指在监督信息数量有限的情况下进行学习并解决问题的算法。首先,从机器学习理论的角度描述了小样本学习困难的原因;其次,根据小样本学习算法的设计动机将现有算法归为表征学习、数据扩充、学习策略三大类,并分析其优缺点;然后,总结了常用的小样本学习评价方法以及现有模型在公用数据集上的表现;最后,讨论了小样本图像分类技术的难点及未来的研究趋势,为今后的研究提供参考。
深度卷积神经网络图像实例分割方法研究进展
胡伏原, 万新军, 沈鸣飞, 徐江浪, 姚睿, 陶重犇
计算机科学. 2022, 49 (5): 10-24.  doi:10.11896/jsjkx.210200038
摘要 ( 611 )   PDF(4948KB) ( 1147 )   
参考文献 | 相关文章 | 多维度评价
图像实例分割是图像处理和计算机视觉技术中关于图像理解的重要环节,随着深度学习和深层卷积神经网络日趋成熟,基于深度卷积神经网络的图像实例分割方法取得了跨越性进展。实例分割任务实际上是目标检测和语义分割两项任务的结合,可以在像素层面完成识别图像中目标轮廓的任务。实例分割不仅可以定位图像中目标的位置,从像素层面上分割所有目标,还可以标注出图像中同一类别的不同个体,既是对图像的像素级分割,又是实例级理解。首先,阐述了图像实例分割产生的原因和深度卷积神经网络的作用。然后,根据图像实例分割方法的过程和特征,分别从两阶段和单阶段的角度介绍了图像实例分割的研究进展,详细阐述了两类方法的优势和不足,进而总结了各类实例分割方法对区域、特征提取和掩膜的设计思路。此外,归纳了图像实例分割方法的性能评价标准和常用的公开数据集,并在此基础上对比和评估了主流的图像实例分割模型的分割精度。最后,指出了当前图像实例分割存在的问题及解决思路,并对其未来发展进行了总结和展望。
一种基于遮罩的稀疏点云滤波算法
封雷, 朱登明, 李兆歆, 王兆其
计算机科学. 2022, 49 (5): 25-32.  doi:10.11896/jsjkx.210600129
摘要 ( 401 )   PDF(3761KB) ( 811 )   
参考文献 | 相关文章 | 多维度评价
基于图像的三维重建硬件约束小、成本低、灵活度高,在实际中得到广泛应用,但物体各部分之间存在遮挡,导致由图像生成的三维点云数据稀疏和密度不均等问题,一直是处理的难点和热点。文中提出一种基于遮罩的稀疏点云滤波算法。首先计算点云的包围盒,并在包围盒中根据点云的稀疏度自适应地划分栅格;其次,利用深度优先搜索,递归求出所有由栅格组成的自定义连通域;然后基于量化重要性指标来自适应计算阈值,通过该自适应阈值选择应保留的连通域,将所有保留的连通域集合定义为遮罩,用于描述稀疏点云的全局空间拓扑信息;最后,保留遮罩覆盖区域的点云,剔除遮罩未覆盖区域的点云,从而达到滤除离群点的目的。该方法能很好地处理由于遮挡生成的、空间疏密程度有较大差异的点云数据,可以有效去除原始三维点云数据中的离群点,同时较好地保持点云的细节信息。
基于共同子空间分类学习的跨媒体检索研究
韩红旗, 冉亚鑫, 张运良, 桂婕, 高雄, 易梦琳
计算机科学. 2022, 49 (5): 33-42.  doi:10.11896/jsjkx.210200157
摘要 ( 296 )   PDF(2721KB) ( 514 )   
参考文献 | 相关文章 | 多维度评价
不同媒体数据间由于存在严重的异构鸿沟和语义鸿沟,而不能直接计算它们之间的语义相似度,从而影响了跨媒体检索的实现和效果。当前提出的共同子空间学习虽能实现跨媒体语义关联和检索,但多采用一般的特征提取技术,且在语义匹配时的分类效果较差,不能有效实现跨媒体数据的高层语义关联计算,影响了检索效果。对此,提出Stacking-DSCM-WR跨媒体关联方法,用于文档和图像之间的跨媒体检索。该方法基于词向量技术形成文档的特征表示向量,通过残差网络技术抽取图像的特征表示向量,采用深度典型相关性分析技术将不同模态的数据投影到共同子空间下,然后采用Stacking集成学习算法获取文本和图像在同一高层概念语义空间上的分布,使得两种不同模态的数据可以进行语义匹配、相似性计算。在Wikipedia和Pascal Sentence两个小型跨媒体数据集和一个较大规模跨媒体数据集INRIA-Websearch上分别开展跨媒体检索实验,证实了所提方法能够有效地抽取文本和图像的特征,实现跨媒体数据在高层语义空间上的关联和匹配,与相近跨媒体检索方法在MAP指标上的对比显示,该方法能够取得较好的检索效果。
面向事件相机的时间信息融合网络框架
徐化池, 史殿习, 崔玉宁, 景罗希, 刘聪
计算机科学. 2022, 49 (5): 43-49.  doi:10.11896/jsjkx.210400047
摘要 ( 252 )   PDF(2516KB) ( 535 )   
参考文献 | 相关文章 | 多维度评价
事件相机是一种启发式传感器,它通过感知光线强度变化输出事件,响应异步和稀疏事件形式的像素级亮度变化,缓解了传统相机在光线条件变化复杂和物体高速运动场景下成像不清晰的问题。最近,基于学习的模式识别方法将事件相机的输出转化为伪图像的表示形式,在光流估计、目标识别等视觉任务中取得了巨大的进步。但是,这类方法丢弃了事件流之间的时间相关性,导致伪图像的纹理不够清晰,特征提取困难。为此,提出了基于事件流划分算法的神经网络框架,显式地融合了事件流的时间信息。该框架将输入的事件流划分成多份,使用权重分配网络给每一份事件流赋予不同的权重,并使其通过卷积神经网络融合时空信息、提取高级特征,最后对输入分类。在N-Caltech101和N-Cars数据集上进行的对比实验表明,与现有最先进算法相比,所提框架在分类准确率上有明显的提升。
结合注意力机制的多尺度特征融合图像去雾算法
范新南, 赵忠鑫, 严炜, 严锡君, 史朋飞
计算机科学. 2022, 49 (5): 50-57.  doi:10.11896/jsjkx.210400093
摘要 ( 405 )   PDF(3843KB) ( 559 )   
参考文献 | 相关文章 | 多维度评价
针对传统图像去雾算法容易受到先验知识制约以及颜色失真等问题,提出了一种结合注意力机制的多尺度特征融合图像去雾算法。该算法首先通过下采样操作得到多个尺度的特征图,然后在不同尺度的特征图之间采用跳跃连接的方式将编码器部分的特征图与解码器部分的特征图连接起来以进行特征融合。同时,在网络中加入一个由通道注意力子模块和像素注意力子模块组成的特征注意力模块来控制不同通道与像素的重要性,这种特征注意力模块让网络更加关注细节信息和重要特征,因此能取得更好的去雾效果。为了验证所提算法的有效性,首先在RESIDE数据集上将所提算法与5种流行的去雾算法进行定性与定量对比实验。实验结果表明,所提算法能比较完全地除雾,而且对图像色彩的保持度较好;同时,在两个评价指标峰值信噪比(Peak Signal to Noise Ratio,PSNR)和结构相似性(Structure Similarity,SSIM)上的平均值分别为28.83 dB和0.957 5,相较于对比算法中性能位居第二的模型分别提高了2.23 dB和0.017 2。然后在MSD数据集以及真实图像上将所提算法与5种对比算法进行了定性对比实验。实验结果进一步证明了所提算法的去雾性能以及色彩保持度良好。
基于特征分离的红外与可见光图像融合算法
高元浩, 罗晓清, 张战成
计算机科学. 2022, 49 (5): 58-63.  doi:10.11896/jsjkx.210200148
摘要 ( 227 )   PDF(3066KB) ( 489 )   
参考文献 | 相关文章 | 多维度评价
在同一场景下被捕获的一对红外与可见光图像虽然具有不同的模态,但是具有共享的公有信息和互补的私有信息,学习并融合上述信息可以得到一幅完整的融合图像。受益于残差网络的启发,在训练学习阶段,通过网络分支间特征层面的互换和相加,强制每一个分支映射到一幅具有全局特征的标签图上,来鼓励各个分支学习对应模态图像的私有特征。直接学习得到图像的私有特征可以避免设计复杂的融合规则并保证特征细节信息的完整。在融合预测阶段,采用最大值融合策略融合私有特征,并在解码层与学习得到的公有特征相叠加,最后解码出集成了红外和可见光图像信息的融合图像。使用在NYU-D2上合成的多聚焦图像数据集训练该模型,在TNO真实的红外和可见光数据集上进行测试,实验结果表明,与当前主流的红外与可见光融合算法相比,所提算法在主观效果和客观评价指标上都取得了较好的成绩。
基于局部注意力图互迁移的可解释性优化方法
成科扬, 王宁, 崔宏纲, 詹永照
计算机科学. 2022, 49 (5): 64-70.  doi:10.11896/jsjkx.210400176
摘要 ( 293 )   PDF(3182KB) ( 497 )   
参考文献 | 相关文章 | 多维度评价
目前,深度学习模型已被广泛部署于各个工业领域。然而,深度学习模型具有的复杂性与不可解释性已成为其应用于高风险领域最主要的瓶颈。在深度学习模型可解释性方法中,最重要的方法是可视化解释方法,其中注意力图是可视化解释方法的主要表现方式,可通过对样本图像中的决策区域进行标注,来直观地展示模型决策依据。目前已有的基于注意力图的可视化解释方法中,单一模型注意力图存在标注区域易出现标注错误而造成可视化可解释性置信度不足的问题。针对上述问题,文中提出了一种基于局部注意力图互迁移的可解释性优化方法,用于提升模型注意力图的标注准确度,展示出精准的决策区域,加强视觉层面对模型决策依据的可解释性。具体表现为:采用轻量模型构建互迁移网络结构,于单一模型层间提取特征图并进行叠加,对全局注意力图进行局部划分,使用皮尔逊相关系数对模型间对应的局部注意力图进行相似度度量,随后将局部注意力图进行正则化并结合交叉熵函数对模型注意力图进行迁移。实验结果表明,所提算法显著提升了模型注意力图标注的准确性,并分别实现了28.2%的平均下降率和29.5%的平均增长率,与最先进的算法相比,其在平均下降率方面实现了3.3%的提升。实验结果表明,所提算法能成功地找出样本图像中预测标签最相关区域,而不局限于视觉可视化区域;与现有的同类方法相比,所提方法能更准确地揭示原始CNN模型的决策依据。
基于边云协同的人脸识别方法研究
魏勤, 李瑛娇, 娄平, 严俊伟, 胡辑伟
计算机科学. 2022, 49 (5): 71-77.  doi:10.11896/jsjkx.210300222
摘要 ( 293 )   PDF(2417KB) ( 801 )   
参考文献 | 相关文章 | 多维度评价
人脸识别被广泛应用于购物、安检、出行、支付和考勤等日常生活中,人脸识别系统需要大的算力与存储空间,因此往往将需要识别的人脸通过网络传送到云平台进行识别,但网络覆盖、拥塞或延时等问题造成人脸识别系统难以满足实际应用的需求,用户体验差。针对人脸识别中存在的问题,提出了基于边云协同的人脸识别方法。该方法结合云计算的处理能力和边缘计算的实时性,使人脸识别系统不受网络状态的约束,应用更加广泛,用户体验更好。在云端,提出了LResNet特征提取方法,改进了ResNet34网络结构,并利用ArcFace人脸损失函数监督训练过程,使网络学习到更多的人脸角度特性;在边缘端,针对计算资源和存储资源有限的问题,提出了SResNet特征提取方法,利用深度可分离卷积轻量化LResNet网络结构,大大减少了网络参数和计算量。边云协同的人脸识别实验表明,所提系统在任何网络状态下都能进行实时识别且准确率较高。
基于SVM的类别增量人体活动识别方法
邢云冰, 龙广玉, 胡春雨, 忽丽莎
计算机科学. 2022, 49 (5): 78-83.  doi:10.11896/jsjkx.210400024
摘要 ( 275 )   PDF(1654KB) ( 538 )   
参考文献 | 相关文章 | 多维度评价
基于人体活动识别(Human Activity Recognition,HAR)的健康监护是发现健康异常的一种重要手段。然而,在日常活动识别中,很难提前获取包含所有可能活动类别的训练样本。当预测阶段出现新增类别时,传统的支持向量机(Support Vector Machine,SVM)会将其错误地分类为已知类别。一个鲁棒的分类器应该能够分辨出新增类别,以便后续区别于已知类别并对其进行处理。文中提出一种基于SVM的类别增量人体活动识别方法,引入超球面的思想,既能高精度地识别已知活动类别,又能检测出新增类别。通过训练得到的多个超球面将整个特征空间进行划分,使分类器具有对新增活动类别的检测能力。实验结果表明,与传统多分类SVM方法相比,该方法能够在不显著降低已知类别分类效果的前提下实现对新增类别的检测,从而提高分类器在开放环境下的人体活动识别能力。
基于改进CenterNet的航拍绝缘子缺陷实时检测模型
李发光, 伊力哈木·亚尔买买提
计算机科学. 2022, 49 (5): 84-91.  doi:10.11896/jsjkx.210400142
摘要 ( 396 )   PDF(3342KB) ( 358 )   
参考文献 | 相关文章 | 多维度评价
针对无人机在电力巡检过程中对绝缘子及其缺陷检测的准确率较低、实时性较差的问题,提出一种改进CenterNet的绝缘子缺陷检测模型。首先,使用轻量级网络EfficientNet-B0代替原始模型的特征提取网络ResNet18,在保证模型提取能力的同时加快了其推理速度;其次,搭建特征加强模块(Feature Enhancement Module,FEM),并对经过上采样后的特征通道权重进行合理分配,抑制无效特征,并借鉴FPN(Feature Pyramid Networks)融合浅层与深层特征,使特征层信息更加丰富;然后在CenterNet-Head中引入空间和通道混合的注意力机制CA(Coordinate Attention),使类别和位置信息的预测更加准确;最后,使用Soft-NMS解决在模型检测过程中由中心点预测不准导致的“单目标多框”问题。实验结果表明,改进的CenterNet比原始模型的精度提高了11.92%,速度提高了8.95 FPS,模型大小减小了54 MB。与其他检测模型相比,改进模型的精度与速度均有提高,证明了其实时性和鲁棒性。
基于ARIMA预测MFCC特征的声纹同一性鉴定方法
王学光, 诸珺文, 张爱新
计算机科学. 2022, 49 (5): 92-97.  doi:10.11896/jsjkx.210400071
摘要 ( 276 )   PDF(2920KB) ( 549 )   
参考文献 | 相关文章 | 多维度评价
声纹识别技术的关键是从语音信号中提取具有说话人特征的语音特征参数。考虑到当下大多是运用鉴定人的经验对两段语音是否来源于同一人进行判定,在前期研究的基础上,结合MFCC特征,提出一种基于ARIMA预测的声纹同一性鉴定方法,以提高具有年份差距的检材与样本比对的准确率。此方法在Mel倒谱系数声纹同一性鉴定方法基础上,采用自回归综合移动平均季节序列作出线性最小均方估计,对声纹特征进行预测,改良了包含元音与响辅音的共振峰特性。实验证明,ARIMA时间序列的预测结果很好,且使用ARIMA改良的基于Mel倒谱系数的文本无关同一性鉴定的准确率较高,相似度在60%以上。
基于HVS的水下图像质量评价
鹿婷, 侯国家, 潘振宽, 王国栋
计算机科学. 2022, 49 (5): 98-104.  doi:10.11896/jsjkx.210100224
摘要 ( 264 )   PDF(3340KB) ( 439 )   
参考文献 | 相关文章 | 多维度评价
因为水的吸收和散射效应,导致水下图像普遍存在模糊、低对比度和色彩不均衡等问题,而自然图像质量评价方法没有考虑水下成像的特殊性,难以应用于水下图像;同时目前有效的水下图像的质量评价方法较少,且存在一定局限性。针对此问题,提出了一种新的与主观感知密切相关的无参考水下图像质量评价方法,选择与视觉感知相关性高的色度特征(Col)、基于人类大脑视觉皮层的对比度特征(Con)、反映图像信息丰富程度的清晰度特征(Sharp)这3种属性,来构成水下图像质量评价模型,简称CCS。这些视觉特征对水的物理特性比较敏感,而且人类视觉系统(Human Visual System,HVS)易受色彩、对比度和边缘结构等视觉特性变化的影响。为了验证所提方法的性能,在自建小型水下图像数据集上与CPDB,BRISQUE,UCIQE,UIQM这4种无参考评价算法进行了大量的对比实验,在与主观评价相关性度量方面,CCS方法比UIQM方法的RMSE度量指标提升了大约13%,比UCIQE和UIQM方法的PLCC,SROCC和KROCC度量指标提升均超过10%。实验结果表明,CCS算法与人类视觉感知具有高度一致性,能有效、准确地评估水下图像的质量。
基于多分支注意力增强的细粒度图像分类
张文轩, 吴秦
计算机科学. 2022, 49 (5): 105-112.  doi:10.11896/jsjkx.210100108
摘要 ( 349 )   PDF(3181KB) ( 514 )   
参考文献 | 相关文章 | 多维度评价
针对细粒度图像类间差距小、类内差距大的问题,文中提出以弱监督学习的方式使用多分支注意力增强卷积网络,从而实现细粒度图像分类。文中采用Inception-V3网络提取图像的基础特征,从中获取多个局部响应区域并进行特征融合,在此基础上采用注意力机制对图像关键区域进行自约束的局部裁剪和局部擦除,避免仅提取目标单个部位的特征,促使网络更加关注目标物体不同部位的细节特征,同时也提升了目标区域的定位精度。此外,文中提出中心正则化损失函数来约束训练过程中获取的注意力区域,以进一步提升目标定位精度和扩大图像特征的类间差距。在3个公开数据集上进行了实验,结果表明,所提方法取得了比当前最优方法更好的结果。
数据库&大数据&数据科学
面向化学结构的线段聚类算法
朱哲清, 耿海军, 钱宇华
计算机科学. 2022, 49 (5): 113-119.  doi:10.11896/jsjkx.210700131
摘要 ( 248 )   PDF(2060KB) ( 2474 )   
参考文献 | 相关文章 | 多维度评价
化学键识别是化学结构识别任务的重要组成部分。化学键中的单键、双键和三键都是由线段组成的,采用霍夫变换进行线段检测时容易产生冗余数据和干扰数据。为此,提出了一种面向化学键的线段聚类算法,对霍夫变换检出的线段进行聚类,进而合并冗余线段。具体而言,基于线段间空间关系的分析,定义线段间的相对相似性与间隔相似性度量;利用这两种度量,进行基于线段合并的聚类方法。实验结果表明,所提出的相似性度量可以全面地刻画线段间的相似关系;该算法能获得较好的聚类结果,同时能够准确复原化学键组成线段的真实位置,是一种有效的化学结构图像预处理方法。
面向数据融合的多粒度数据溯源方法
杨斐斐, 沈思妤, 申德荣, 聂铁铮, 寇月
计算机科学. 2022, 49 (5): 120-128.  doi:10.11896/jsjkx.210300092
摘要 ( 242 )   PDF(3300KB) ( 669 )   
参考文献 | 相关文章 | 多维度评价
随着数据量的增加、数据间的关联和交叉,需要通过数据融合来实现数据的价值最大化。然而,由于数据融合过程复杂,为清晰解释数据融合过程,建立数据融合的回溯机制十分必要。虽然对数据溯源的研究很多,但大多是面向查询和工作流的溯源研究,而面向数据融合的溯源研究很少。文中面向数据融合溯源展开研究,提出了一种支持多粒度数据溯源的方法。首先,对数据融合过程进行抽象,以实体为核心构建模式、实体和属性的语义图,将数据融合过程语义化,并提出优化的溯源信息存储模式;然后,基于语义图,分别提出了实体级和属性级的溯源查询算法,以及相应的查询优化策略;最后,通过实验证明了提出的数据溯源方法的有效性。
结合注意力机制与几何信息的特征融合框架
董奇达, 王喆, 吴松洋
计算机科学. 2022, 49 (5): 129-134.  doi:10.11896/jsjkx.210300180
摘要 ( 241 )   PDF(1906KB) ( 389 )   
参考文献 | 相关文章 | 多维度评价
不平衡问题在现实世界中普遍存在,而不平衡数据的分布不平衡性会严重影响模型的性能。不平衡数据通常从两方面影响模型性能:一方面是数量上的不平衡导致多数类的数据对参数有更多的更新,导致模型更加偏向多数类;另一方面是少数类样本特别少,多样性不足从而导致模型表征能力不足。针对上述问题,提出了一个结合注意力机制与几何信息的特征融合框架。具体而言,该模型首先通过预训练使模型学习数据的语义信息和判别性信息,并结合注意力机制发掘模型对不同类别数据的关注点。在第二阶段,模型通过几何信息挖掘边界特征,并且结合第一阶段得到的注意力权重对边界特征进行融合,从而对少数类的数据进行补充。基于长尾CIFAR10,CIFAR100和KDDCup99数据集的实验结果表明,所提的结合注意力机制与几何信息的特征融合框架能够有效提升对不平衡数据的分类性能,并且对于不同类型的数据,包括图像数据和结构化数据,都能有效提高分类性能。
基于代价敏感激活函数XGBoost的不平衡数据分类方法
李京泰, 王晓丹
计算机科学. 2022, 49 (5): 135-143.  doi:10.11896/jsjkx.210400064
摘要 ( 399 )   PDF(5223KB) ( 472 )   
参考文献 | 相关文章 | 多维度评价
为解决在数据不平衡条件下使用XGBoost框架处理二分类问题时算法对少数类样本的识别能力下降的问题,提出了基于代价敏感激活函数的XGBoost算法(Cost-sensitive Activation Function XGBoost,CSAF-XGBoost)。在XGBoost框架构建决策树时,数据不平衡会影响分裂点的选择,导致少数类样本被误分。通过引入代价敏感激活函数改变样本在不同预测结果下损失函数的梯度变化,来解决被误分的少数类样本因梯度变化小而无法在XGBoost迭代过程中被有效分类的问题。通过实验分析了激活函数的参数与数据不平衡度的关系,并对CSAF-XGBoost算法与SMOTE-XGBoost,ADASYN-XGBoost,Focal loss-XGBoost,Weight-XGBoost优化算法在UCI公共数据集上的分类性能进行了对比。结果表明,在F1值和AUC值相同或有提高的情况下,CSAF-XGBoost算法对少数类样本的检出率比最优算法平均提高了6.75%,最多提高了15%,证明了CSAF-XGBoost算法对少数类样本有更高的识别能力,且具有广泛的适用性。
结合物品相似性的社交信任推荐算法
余皑欣, 冯秀芳, 孙静宇
计算机科学. 2022, 49 (5): 144-151.  doi:10.11896/jsjkx.210300217
摘要 ( 208 )   PDF(2506KB) ( 358 )   
参考文献 | 相关文章 | 多维度评价
随着互联网的快速发展,用户很难在大量的网络数据中找到自己感兴趣的内容,而推荐系统能帮助解决这一问题。传统的推荐系统仅依赖用户历史行为数据进行推荐,存在数据稀疏和冷启动的问题。将社交网络信息融入推荐系统中被证明能够有效地解决传统推荐系统的问题,提高了推荐质量。但是,大部分基于社交网络的推荐仅关注用户之间的单向信任关系,忽略了被信任关系和物品自身因素对推荐结果的影响,因此提出了结合物品相似性的社交信任推荐算法SocialIS。SocialIS算法考虑了用户作为信任者和被信任者时邻居用户对用户的影响,并采用Node2vec算法训练得到包含用户偏好的物品相似性向量,再使用图神经网络学习用户和物品的特征向量进行评分预测。在Epinions和Ciao数据集上进行了大量实验,采用基于误差的指标(MAE和RMSE)对所提算法的性能进行度量,并与其他算法进行对比,验证了所提算法的性能。实验结果表明,与其他算法相比,所提算法的评分预测误差更小,推荐效果更好。
基于三角不等式判定和局部策略的高效邻域覆盖模型
陈于思, 艾志华, 张清华
计算机科学. 2022, 49 (5): 152-158.  doi:10.11896/jsjkx.210300302
摘要 ( 165 )   PDF(2772KB) ( 294 )   
参考文献 | 相关文章 | 多维度评价
邻域覆盖模型由于其原理简单以及对复杂数据具有较好的处理能力,在分类任务中得到了广泛应用。然而,邻域覆盖模型普遍存在运行效率较低的问题,且缺乏相关研究工作。为解决此问题,在传统邻域覆盖模型中引入距离间的三角不等式关系以提升构建邻域的效率,同时引入局部策略,定义了局部邻域覆盖以提升构建邻域覆盖的效率。为提升运行效率,从两个角度对传统邻域覆盖模型进行了改进,提出了基于三角不等式判定和局部策略的邻域覆盖模型(Neighborhood Covering Model based on Triangle Inequality Check and Local Strategy,TI-LNC)。此外,当前基于邻域覆盖模型的分类算法通常仅根据邻域中心以及邻域半径对样本进行分类,缺乏对邻域内样本信息的使用,从而影响了分类精度。为提高邻域覆盖模型的分类精度,增加了对邻域内样本信息的考虑,并基于TI-LNC设计了新的分类算法。在10个UCI数据集上的实验结果表明,所提模型能达到较高的运行效率以及较好的分类精度,具有一定的合理性及有效性。
基于用户覆盖及评分差异的多样性推荐算法
陈壮, 邹海涛, 郑尚, 于化龙, 高尚
计算机科学. 2022, 49 (5): 159-164.  doi:10.11896/jsjkx.210300263
摘要 ( 209 )   PDF(1913KB) ( 371 )   
参考文献 | 相关文章 | 多维度评价
传统的推荐算法着重于提高推荐结果的精确度,对于推荐列表的多样性则有所忽略。但很多研究表明,用户对产品的多样性需求也是影响用户体验的重要因素之一。针对该问题,在用户覆盖定义的基础上,提出了一个基于产品评分差异的用户覆盖模型。在生成用户兴趣域(用户覆盖)的过程中,该模型一方面通过构建评分差异矩阵,将不同用户对同一产品评分上的差异与用户覆盖模型有效地结合起来,从而计算得到更精准的用户兴趣域;另一方面,该模型将用户和推荐列表的兴趣域分别映射到两个m维向量上(分别称为用户向量和产品集向量),并将推荐的目标函数向量化,有效地减少了计算过程中迭代的次数。此外,通过探讨用户向量和产品集向量之间的相似度关系,提出了一种新的推荐列表选取策略。基于该方法构建得到的模型可以在一定程度上兼顾推荐精确度与多样性。由于根据用户向量构建匹配的产品集向量是一个NP-hard问题,因此使用贪心算法来求解该问题,贪心算法的有界性有着严谨的理论依据。在两个真实的数据集上进行实验,结果表明,与多样性推荐方面相关的先进算法相比,所提算法具有一定的优势。
基于菌群优化的近邻传播聚类算法研究
张宇姣, 黄锐, 张福泉, 隋栋, 张虎
计算机科学. 2022, 49 (5): 165-169.  doi:10.11896/jsjkx.210800218
摘要 ( 162 )   PDF(1927KB) ( 348 )   
参考文献 | 相关文章 | 多维度评价
为了提高近邻传播聚类算法的聚类性能,采用菌群算法进行近邻传播偏向参数优化求解。首先,根据待聚类样本建立相似矩阵,初始化偏向参数;然后采用菌群算法优化偏向参数,将偏向参数作为菌落进行训练,设置轮廓(Silhouette)指标值作为菌群算法的适应度函数;接着通过菌落位置更新优化后的偏向参数,进行近邻传播聚类运算,不断更新近邻传播聚类算法的决策和潜力阵;最后获得稳定的聚类结果。实验结果表明,合理设置菌群优化算法的参数,能够获得较好的聚类效果。在电商数据集和UCI数据集中,相比常用聚类算法,所提算法能够获得更高的Silhouette指标值和最短的欧氏距离,在聚类分析中的适用度较高。
融合动态距离和随机竞争学习的社区发现算法
王本钰, 顾益军, 彭舒凡, 郑棣文
计算机科学. 2022, 49 (5): 170-178.  doi:10.11896/jsjkx.210300206
摘要 ( 177 )   PDF(1985KB) ( 296 )   
参考文献 | 相关文章 | 多维度评价
社区结构作为复杂网络的一个重要属性,对于了解复杂网络的组织架构和功能具有深远意义。为了解决复杂网络的社区发现问题,提出了一种融合动态距离和随机竞争学习的社区发现算法(Dynamic Distance Stochastic Competitive Learning,DDSCL)。该算法首先结合节点度值和节点间的欧氏距离来确定随机竞争学习中粒子的初始位置,使得不同粒子在游走初期不会在同一社区内进行竞争,加快了粒子的收敛速度;然后结合动态距离算法,将节点间的动态距离融入粒子优先游走过程中,使得粒子的优先游走过程更具方向性,减小了随机性,并且粒子游走的过程也会优化动态距离的变化;当粒子达到收敛状态时,节点将被对其具有最大控制力的粒子占据。最后网络中每一个粒子对应一个社区,根据各粒子占据的节点来揭示网络的社区结构。在8个真实的网络数据集上,以NMI和模块度Q值为评价指标,将DDSCL算法与现有的代表性算法进行实验比较,发现DDSCL算法整体上优于其他算法,其不仅降低了随机竞争学习中粒子优先游走的随机性,而且解决了动态距离算法中出现的碎片化社区问题,提高了社区发现结果的准确性。实验结果表明,所提算法具有有效性和可行性。
人工智能
一种平衡探索和利用的优先经验回放方法
张佳能, 李辉, 吴昊霖, 王壮
计算机科学. 2022, 49 (5): 179-185.  doi:10.11896/jsjkx.210300084
摘要 ( 342 )   PDF(2942KB) ( 508 )   
参考文献 | 相关文章 | 多维度评价
经验回放方法可以重用过去的经验来更新目标策略,提高样本的利用率,已经成为深度强化学习的一个重要组成部分。优先经验回放在经验回放的基础上进行选择性采样,期望更好地利用经验样本。但目前的优先经验回放方式会降低从经验缓冲池采样的样本的多样性,使神经网络收敛于局部最优。针对上述问题,提出了一种平衡探索和利用的优先经验回放方法(Exploration and Exploitation Balanced Experience Replay,E3R)。该方法可以综合考虑样本的探索效用和利用效用,根据当前状态和过去状态的相似性程度以及同一状态下行为策略和目标策略采取动作的相似性程度来对样本进行采样。此外,将E3R分别与策略梯度类算法软演员-评论家算法、值函数类算法深度Q网络算法相结合,并在相应的OpenAI gym环境下进行实验。实验结果表明,相比传统随机采样和时序差分优先采样,E3R可以获得更快的收敛速度和更高的累计回报。
基于深度卷积残差网络的心电单导联房颤检测方法
赵人行, 徐频捷, 刘瑶
计算机科学. 2022, 49 (5): 186-193.  doi:10.11896/jsjkx.220200002
摘要 ( 213 )   PDF(1934KB) ( 559 )   
参考文献 | 相关文章 | 多维度评价
在智能诊断需求日益增长的背景下,提出了一种基于残差网络形式构建的卷积神经网络,该模型作为心电信号房颤分类的方法,使用MIT-BIH的心房颤动公开数据集来验证所提方法的效果,以辅助房颤自动检测。针对心电信号二分类问题,首先,对数据集进行前期数据预处理,然后将处理后的数据输入到卷积神经网络,以构建深度学习模型,使其对房颤特征进行自动提取,最后利用深度学习模型进行房颤检测,通过五折交叉验证得到构建模型分类的敏感性为99.26%,特异性为99.42%,阳性预测值为99.61%,准确率为99.47%。将所提模型的性能与已有模型进行了比较,证实了所提模型用于房颤检测的可行性。由此得出结论,通过残差网络构建的房颤自动检测系统可以达到房颤的良好分类效果,有助于房颤自动检测。
基于学术知识图谱的辅助创新技术研究
钟将, 尹红, 张剑
计算机科学. 2022, 49 (5): 194-199.  doi:10.11896/jsjkx.210400195
摘要 ( 217 )   PDF(2406KB) ( 371 )   
参考文献 | 相关文章 | 多维度评价
计算机领域知识快速更新且存在较多歧义,导致学生自主创新时难以找到合理的解决方案。作为辅助创新工具,智能问答系统可以协助学生更快地把握学科发展前沿,精准地找出解决问题的方法。在大规模科技文献库上构建科研知识图谱,实现了辅助学生创新的智能问答系统。为了减小查询问句中噪声实体带来的影响,提出一种基于辅助任务的意图信息增强神经网络(Auxiliary Task Enhanced Intent Information for Question Answering in Computer Domain,ATEI-QA)。相比传统方法,该方法能够更精确地提取问句意图信息,减小噪声实体给意图识别带来的影响。在计算机领域数据集和通用数据集上与3个主流模型开展了对比实验,结果表明所提模型在领域数据集上的MAP和MRR值平均提升了3.27%和1.72%,在通用数据集上的MAP和MRR值平均提升了4.37%和2.81%。
面向对话的融入知识的实体关系抽取
陆亮, 孔芳
计算机科学. 2022, 49 (5): 200-205.  doi:10.11896/jsjkx.210300198
摘要 ( 232 )   PDF(1781KB) ( 481 )   
参考文献 | 相关文章 | 多维度评价
实体关系抽取旨在从文本中抽取出实体之间的语义关系。该任务在新闻报道、维基百科等规范文本上的研究相对丰富,并取得了一定的成果,但面向对话文本的相关研究还处于起始阶段。目前用于实体关系抽取的对话语料规模较小且信息密度低,有效特征难以捕获;深度学习模型无法像人一样进行知识联想,单纯依靠加大标注数据量和增强计算力难以精细深度地理解对话内容。针对上述问题,提出了一个融入知识的实体关系抽取模型,使用Star-Transformer从对话文本中有效捕获特征,同时通过关键词共现的方式构建一个包含关系及其语义关键词的关系集合,将该集合与对话文本进行相关性计算后得到的重要关系特征作为知识融入模型中。在DialogRE公开数据集上进行实验,得到F1值为53.6%,F1c值为49.5%,证明了所提方法的有效性。
基于多特征融合的重叠组套索脑功能超网络构建及分类
李鹏祖, 李瑶, Ibegbu Nnamdi JULIAN, 孙超, 郭浩, 陈俊杰
计算机科学. 2022, 49 (5): 206-211.  doi:10.11896/jsjkx.210300049
摘要 ( 191 )   PDF(2164KB) ( 341 )   
参考文献 | 相关文章 | 多维度评价
脑功能超网络的研究对脑疾病的准确诊断具有重要作用,目前已经有多种超网络的构建方法被应用于脑疾病的分类研究,但这些方法均未考虑到组间的重叠性问题。研究证明,组间的重叠性可能会对相关超网络模型的构建及构建后的分类应用产生影响,因此若仅使用非重叠组结构会限制其在超网络中的适用性。针对已应用于脑疾病分类研究的超网络构建方法在构建超网络模型时未考虑到分组之间的部分重叠性问题以及特征提取阶段的属性单一性问题,提出将多特征融合分析的重叠组套索方法应用于超网络的构建,并将其应用于抑郁症的诊断。结果表明,无论是在纯聚类系数属性下还是在多特征融合分析下,重叠组套索方法的分类性能较其他已有方法均有提高;在重叠组套索方法下,采用多特征融合分析较仅使用聚类系数属性分析获得了更高的分类准确率,达到了87.87%。
基于并行分区搜索的多模态多目标优化及其应用
李浩东, 胡洁, 范勤勤
计算机科学. 2022, 49 (5): 212-220.  doi:10.11896/jsjkx.210300019
摘要 ( 179 )   PDF(2110KB) ( 433 )   
参考文献 | 相关文章 | 多维度评价
基于分区搜索的多模态多目标优化属于一种决策空间分解策略,因此它具有天然的并行性。为提高求解效率,提出了一种并行分区搜索(Parallel Zoning Search,PZS)方法来辅助多模态多目标进化算法。在PZS中,首先将多模态多目标优化问题的整个决策空间划分为多个子空间,然后利用并行计算技术来实现选定的多模态多目标进化算法在各个子区域内进行并行搜索,最后将所有子空间得到的解集进行合并和选择。为验证所提方法的有效性,文中设计了两组实验:1)在所有对比算法的运行时间相同的条件下进行实验;2)在所有对比算法的函数评价次数相同的条件下进行实验。结果表明,在计算时间相同的情况下,所提方法能够有效提高选定的多模态多目标进化算法在决策空间中所得解集的质量;而在相同函数评价次数条件下,其能够节省计算时间。文中还将与PZS相结合的多模态多目标进化算法用于求解考虑碳排放的海铁联运能耗多模态多目标优化问题,所得结果可以为海铁联运中的环境保护和运输时间问题提供决策支持。
基于用户关联的立场检测
李子仪, 周夏冰, 王中卿, 张民
计算机科学. 2022, 49 (5): 221-226.  doi:10.11896/jsjkx.210400135
摘要 ( 188 )   PDF(1917KB) ( 415 )   
参考文献 | 相关文章 | 多维度评价
立场检测的主要目的是挖掘用户对话题或事件等的立场态度。与其他文本分类任务不同,立场的表达更隐晦,立场的态度对用户更加敏感。目前已有的立场检测方法主要是对话题内容自身信息进行建模,该类方法忽略了话题内容的用户背景信息,但用户及其喜好信息极大地影响着对文本信息的精准挖掘,通过关联用户信息能够获得潜在的信息特征。因此,提出了基于用户关联的立场检测模型(USDM),通过构建用户之间的图网络来建立用户关联结构,利用卷积操作挖掘相同用户下相似的文本立场信息,从全局的角度构建立场检测模型。同时,加入注意力机制以增强文本用户感知表示。在公开数据集H&N14上的实验结果表明,相比其他模型,所提模型获得了较好的性能。同时,消融实验表明,考虑用户关联以及注意力机制对检测准确率的提升具有重要作用。
解决一类非光滑伪凸优化问题的新型神经网络
喻昕, 林植良
计算机科学. 2022, 49 (5): 227-234.  doi:10.11896/jsjkx.210400179
摘要 ( 169 )   PDF(2064KB) ( 326 )   
参考文献 | 相关文章 | 多维度评价
对优化问题的研究一直以来深受科研工作者的关注。非光滑伪凸优化作为非凸优化中的一类特殊问题,频繁出现在机器学习、信号处理、生物信息学以及各类科学与工程领域中,成为学者们研究的重点。基于罚函数以及微分包含的思想,提出了一种解决带有不等式约束条件和等式约束条件的非光滑伪凸优化问题的新型神经网络方法。在给定的假设条件下,该神经网络的解可以在有限时间内进入可行域并永驻其中,最终收敛到优化问题的最优解集。相比其他神经网络模型,该模型具有以下优点:1)结构简单,为单层模型;2)不需要事先计算精确的惩罚因子;3)初始点可任意选取。在MATLAB环境下,通过数值实验得出,所提网络都能在有限时间内收敛到一个最优解;而用现有的神经网络模型解决同样的优化问题时,若初始点选取不恰当,则会导致状态解不能在有效时间内收敛甚至不能收敛。这不仅进一步地验证了所提神经网络的有效性,同时也说明其具有更广泛的应用范围。
计算机网络
混合云工作流调度综述
柳鹏, 刘波, 周娜琴, 彭心怡, 林伟伟
计算机科学. 2022, 49 (5): 235-243.  doi:10.11896/jsjkx.210300303
摘要 ( 224 )   PDF(2764KB) ( 311 )   
参考文献 | 相关文章 | 多维度评价
在数据爆发的大背景下,传统的云计算存在本地云资源不足和扩展成本高的窘境,而最新兴起的混合云结合了资源丰富的公有云与数据敏感的私有云,成为当下研究和应用的热点方向。而工作流作为一种有吸引力的范式,其数据规模和计算规模一直都在增长,因此工作流调度是混合云研究方向中的关键问题。为此,文中首先对混合云环境下的工作流调度技术做了深入的调查和分析,然后将混合云环境下的工作流调度进行分类与比较,重点阐述面向截止期限、成本、节约能耗和多目标约束的混合云工作流调度。在此基础上分析和总结了混合云环境下工作流调度的未来研究方向,如Serverless平台应用工作流调度、利用边缘服务器网络协同的工作流调度、融合Argo的云原生工作流调度和融合雾计算的工作流调度。
混合云下具有交付期约束的众包任务调度算法
严磊, 张功萱, 王添, 寇小勇, 王国洪
计算机科学. 2022, 49 (5): 244-249.  doi:10.11896/jsjkx.210300120
摘要 ( 168 )   PDF(2164KB) ( 297 )   
参考文献 | 相关文章 | 多维度评价
由多个任务组成的众包任务(Bag-of-Tasks,BoT)被广泛应用于各种领域,一般在混合云下执行。与调度问题中传统的截止时间约束不同,交付期约束允许BoT应用程序的完成时间超过预先指定的交付期,但会产生延迟惩罚。在这种情况下,为了降低总成本,文中提出了一种高效的和声搜索算法(Efficient Harmony Search,EHS),用于在混合云下优化调度任务。该算法通过随机搜索和微调得到初始任务序列,然后通过改进和声搜索步骤和产生新和声记忆库的方式,在一次搜索过程中可以获得大量优质和声,大大提高了和声搜索的效率,加快了算法的收敛速度。通过不断迭代,获得全局最优解,即使总成本最低的BoT应用调度方案。实验结果表明,相比其他算法,该算法在性能上有显著提升,可以有效地降低调度众包任务的总成本。
基于混沌序列相关性的峰均比抑制研究
赵耿, 王超, 马英杰
计算机科学. 2022, 49 (5): 250-255.  doi:10.11896/jsjkx.210400292
摘要 ( 170 )   PDF(2777KB) ( 293 )   
参考文献 | 相关文章 | 多维度评价
针对降低峰均功率比(Peak-to-Average Power Ratio,PAPR)的主要技术的降低效果普遍不理想的情况,文中提出一种基于混沌序列低相关性的部分传输序列法(Chaotic Sequence with Low Correlation of Partial Transmission Sequence,CL-PTS)。该方法使用自相关性较低的数条混沌序列与原始信号相乘,经过快速傅里叶逆变换(Inverse Fast Fourier Transform,IFFT)降低OFDM系统的瞬时功率平均值。仿真结果表明,在互补累积分布函数(Complementary Cumulative Distribution Function,CCDF)为10-3时,该方法降低PAPR的效果相比其他同类算法有1 dB左右的增益,但算法的计算复杂度过高且需消耗较多的频谱资源。在此情况下,提出了改进的相关性算法(Chaotic Sequence with Low Correlation of Modified Partial Transmission Sequence,CM-PTS),分析了PTS算法的子块数对计算量的影响。利用IFFT变换的特点,通过改变序列在系统中的插入位置达到降低PAPR的目的。实验结果表明,CM-PTS算法在增加较少计算量的同时可以使PAPR的值降低约0.5 dB,同时不会引起误比特率的提高。
一种新的基于子连接结构的混合预编码算法
蒋锐, 徐姗姗, 徐友云
计算机科学. 2022, 49 (5): 256-261.  doi:10.11896/jsjkx.210300138
摘要 ( 235 )   PDF(2433KB) ( 295 )   
参考文献 | 相关文章 | 多维度评价
毫米波通信是5G网络的关键技术,因为它可以提供较高数量级的频谱,但它具有更大的路损,采用大规模天线阵列和定向波束成形技术可以有效解决这一问题。随着天线数量的增加,传统数字预编码器的硬件和能量成本非常高,需采用混合预编码来克服这一困难,但全连接结构中该算法的功耗较高,因此提出了一种新的基于子连接结构的混合预编码算法。该算法首先将发射天线阵列分为几个独立的子阵列;然后分别对每个子阵列的模拟预编码矩阵进行设计,并依次优化每个子阵列的频谱效率,以最大限度地提高总频谱效率;最后,在求得的模拟预编码矩阵的基础上,利用最小二乘法求解数字预编码矩阵。仿真结果显示,该算法的频谱效率与正交匹配追踪算法相差不超过3bps/Hz,但能量效率最多可提高23.8%;与功率迭代算法相比,该算法的频谱效率更高,且能量效率可提高4%左右。因此,所提算法具有很好的实际应用价值。
非均匀白噪声条件下的相干MIMO雷达角度估计
唐超尘, 仇洪冰, 刘鑫, 唐清华
计算机科学. 2022, 49 (5): 262-265.  doi:10.11896/jsjkx.210300162
摘要 ( 134 )   PDF(1993KB) ( 365 )   
参考文献 | 相关文章 | 多维度评价
在多输入多输出(Multiple Input Multiple Output,MIMO)雷达系统的角度估计中,混入接收机的噪声通常被假设为均匀的。然而,实际场景下往往是非均匀噪声,使得噪声协方差矩阵是未知的。若直接应用传统的子空间估计算法,如二维多重信号分类(Two-dimensional Multiple Signal Classification,2D-MUSIC)算法,则会导致角度估计性能下降或算法失效,因此需要设计新的算法,用于估计噪声协方差矩阵,以求得噪声子空间。相对于迭代类处理算法而言,非迭代噪声子空间估计算法无需进行迭代计算,从而降低了计算复杂度。基于此,研究和分析了一种适用于非均匀噪声条件下的一维非迭代噪声子空间估计算法,并将其扩展至MIMO雷达二维角度估计。首先通过理论分析验证了该扩展的可行性,其次通过实验验证了其对目标的联合离开角(Direction of Departure,DOD)和到达角(Direction of Arrival,DOA)的估计具有较好的测角性能。
基于深度学习的自动调制识别研究
焦翔, 魏祥麟, 薛羽, 王超, 段强
计算机科学. 2022, 49 (5): 266-278.  doi:10.11896/jsjkx.211000085
摘要 ( 429 )   PDF(5456KB) ( 869 )   
参考文献 | 相关文章 | 多维度评价
非合作通信场景下,自动调制识别是实现频谱感知、频谱管理、频谱利用的关键一环,也是进行高效信号处理的重要前提。传统基于模式识别的AMR方法需要手工进行特征提取,面临着设计复杂性高、识别精度低、泛化能力弱等难题。为此,学术界将目光转向以提取数据中隐含特征见长的深度学习方法,提出了多种面向AMR的深度神经网络架构。相比传统方法,ADNN取得了更高的识别精度,且泛化能力更强,适用范围更广。文中对ADNN领域的研究进行了全面的梳理总结,使从业者可以更好地了解该领域的研究现状,明晰该领域存在的问题以及未来的发展方向。首先,介绍了ADNN设计中涉及的典型DL方法;其次,描述了AMR问题的内涵,简述了传统解决方案;然后,详细介绍了ADNN的工作流程、方法分类和各类方法中的典型代表;最后,在公开数据集上对代表性方案进行了实验对比,并指出了该领域未来需要重点研究的几个方向。
面向集能型中继窄带物联网的非正交多址接入和多维网络资源优化
沈家芳, 钱丽萍, 杨超
计算机科学. 2022, 49 (5): 279-286.  doi:10.11896/jsjkx.210400239
摘要 ( 196 )   PDF(2926KB) ( 306 )   
参考文献 | 相关文章 | 多维度评价
随着窄带物联网技术的蓬勃发展,窄带物联网设备越来越多,但是严重的同频干扰和信号衰减,导致边缘窄带物联网设备的服务质量难以得到保证。针对此问题,提出了集能型中继非正交多址接入窄带物联网。基于该网络模型,建立了以窄带物联网设备数据速率比例公平性为优化目标的传输功率、数据调度以及时隙调度多维资源分配模型,以在优化网络性能的同时,保证每个窄带物联网设备的数据速率需求。通过发掘该模型的凸优化特性,基于KKT条件提出了多维资源优化分配算法。仿真结果验证了所提算法的有效性,其数据速率比例公平性提升了11.9%,频谱效率提升了55.4%,网络能效提升了44.1%。
信息安全
区块链跨链技术发展及应用
孙浩, 毛瀚宇, 张岩峰, 于戈, 徐石成, 何光宇
计算机科学. 2022, 49 (5): 287-295.  doi:10.11896/jsjkx.210800132
摘要 ( 445 )   PDF(1669KB) ( 1798 )   
参考文献 | 相关文章 | 多维度评价
随着区块链技术的不断发展与创新,大量基于区块链的应用不断诞生,如今的区块链系统大多是异构且不互联的,链与链之间无法进行直接的价值流通,这在很大程度上限制了区块链的功能拓展与发展空间。跨链技术指在不同区块链系统实例之间交换信息,并对交换的信息加以利用,实现区块链之间的互联互通和价值转移。文中首先介绍了区块链跨链技术的发展历程,详细介绍了公证人机制、侧链中继、哈希锁定和分布式私钥控制4种当前主流的跨链技术;接着,基于上述跨链技术,介绍了几种当前的主流跨链项目与应用;最后,通过对比几种跨链技术在信任模型、安全性、原子性和可扩展性等不同性能上的异同,总结分析了当前跨链技术的发展趋势,并探讨了跨链领域面临的难点问题和今后的发展方向。
基于卷积神经网络的旁路密码分析综述
刘林云, 陈开颜, 李雄伟, 张阳, 谢方方
计算机科学. 2022, 49 (5): 296-302.  doi:10.11896/jsjkx.210300286
摘要 ( 815 )   PDF(2804KB) ( 385 )   
参考文献 | 相关文章 | 多维度评价
旁路建模分析方法可以有效攻击密码实现,其中基于卷积神经网络的旁路密码分析方法(CNNSCA)可以高效地进行密码攻击,甚至能够攻击有防护的加密算法设备。针对现阶段旁路密码分析建模方法的研究现状,对比分析了几种CNNSCA的模型特点和性能差异,并针对典型CNN模型结构以及旁路信号公共数据集ASCAD,通过模型对比及实验结果分析不同的CNN网络建模方法的效果,进而分析影响CNNSCA方法的性能因素、基于卷积神经网络的旁路建模方法的优势。由分析可知,基于VGG变体的CNNSCA在攻击各种情况的目标数据集时泛化性、鲁棒性表现最好,但使用的CNN模型训练程度及超参数设置是否最适用于SCA场景并未得到验证。今后研究者可通过调整CNN模型的各种超参数,使用数据增强技术,结合Imagenet大赛中优秀CNN网络等手段,来提升CNNSCA的分类准确率和破密性能,探索最适用于SCA场景的CNN模型是未来的发展趋势。
群智感知的隐私保护研究综述
李利, 何欣, 韩志杰
计算机科学. 2022, 49 (5): 303-310.  doi:10.11896/jsjkx.210400077
摘要 ( 468 )   PDF(2308KB) ( 763 )   
参考文献 | 相关文章 | 多维度评价
近年来,智能终端的快速普及极大地推动了集数据采集、分析、处理于一体的群智感知服务的发展。隐私保护作为保障服务安全运行和鼓励感知用户参与的必要手段,成为需要解决的首要科学问题。文中首先从群智感知的全生命周期出发,在描述其主要组成部分和业务流程之后,再从群智感知场景对隐私保护的特有需求出发,对隐私保护的定义和衡量指标进行讨论,并对现有文献设计的隐私保护机制所侧重的不同阶段进行分类,从隐私保护范围、保护强度、感知用户身份可追溯、感知数据损失和感知终端能耗的角度对文献使用的隐私保护机制进行讨论。在此基础上对文献使用的实验数据集进行梳理,最后结合群智感知应用的发展需求和全球对隐私保护的监管要求提出未来研究面临的挑战。
基于量子傅里叶变换求和的量子投票协议
冯雁, 王蕊聪
计算机科学. 2022, 49 (5): 311-317.  doi:10.11896/jsjkx.210300058
摘要 ( 172 )   PDF(1650KB) ( 366 )   
参考文献 | 相关文章 | 多维度评价
针对传统电子投票存在用户信息易被窃取,而现有量子投票普遍计算效率较低的问题,提出了一种基于量子傅里叶变换求和与向量编码结合的量子投票协议,各方通过量子傅里叶变换将自己的保密数值以单粒子态的形式纠缠叠加到发起方手中进行投票,并通过向量编码实现对候选者票数的保密排序,由获胜者公布票数及排名。通过IBM提供的量子计算模拟器对协议量子傅里叶变换求和的正确性进行了验证。通过理论分析证明了协议在面对截取-重发攻击、纠缠测量攻击、共谋攻击以及监听方-候选者攻击这4类攻击时均有较好的安全性,且与现有同类型量子投票方案相比,协议的效率较高。
基于QRNN的网络协议模糊测试用例过滤方法
胡志濠, 潘祖烈
计算机科学. 2022, 49 (5): 318-324.  doi:10.11896/jsjkx.210300281
摘要 ( 244 )   PDF(1954KB) ( 490 )   
参考文献 | 相关文章 | 多维度评价
目前,网络协议模糊测试的目标趋向于大型协议实体,而传统的测试用例过滤方法主要是基于测试对象的运行状态信息,测试对象越庞大,其执行单个测试用例的时间也越长。因此,针对传统的网络协议模糊测试用例过滤方法存在无效执行时间长、效率低下的问题,依据循环神经网络模型对序列数据较强的处理和预测能力,提出一种基于QRNN的网络协议模糊测试用例过滤方法。通过学习网络协议的结构特征,包括字段取值范围和字段间约束关系,该方法可以自动过滤无效测试用例,减少协议实体测试用例的执行次数。实验结果表明,与传统的网络协议模糊测试用例过滤方法相比,所提方法可以有效降低网络协议漏洞挖掘的时间成本,显著提高网络协议模糊测试的效率。
基于区块链与改进CP-ABE的众测知识产权保护技术研究
阳真, 黄松, 郑长友
计算机科学. 2022, 49 (5): 325-332.  doi:10.11896/jsjkx.210900075
摘要 ( 304 )   PDF(3360KB) ( 700 )   
参考文献 | 相关文章 | 多维度评价
众包测试是众包技术在软件测试领域的应用,它以分布、协作的方式开展测试,得到业界的广泛关注。然而,开放的众测环境和集中式的存储模式使众测知识产权存在泄露和被篡改的风险。为了实现众测知识产权的隐私保护以及可信存储,文中针对不同知识产权提出对应的保护方法。首先,针对众测任务与被测代码,使用AES算法和改进的CP-ABE算法对其进行细粒度的数据访问控制。该算法中的复杂加密操作被外包给可信第三方完成,降低了请求者的计算成本。同时该算法还支持属性的动态撤销,满足前向与后向安全性。此外,利用区块链技术和IPFS,该算法实现了大规模知识产权数据的分布式可信存储与一致性确权,确保存储的知识产权数据不被篡改,并可对链下知识产权进行确权,有助于解决知识产权纠纷。最后,进行性能测试与对比评估,验证了该方法的加解密效率相比以往方法有所提升,区块链性能表现较好;并进行安全性分析,证明了该方案满足安全需求。
一种量子安全拜占庭容错共识机制
任畅, 赵洪, 蒋华
计算机科学. 2022, 49 (5): 333-340.  doi:10.11896/jsjkx.210400154
摘要 ( 271 )   PDF(2505KB) ( 509 )   
参考文献 | 相关文章 | 多维度评价
针对经典区块链共识机制面临量子计算机攻击的问题,提出了一种量子安全拜占庭容错共识机制。首先,对于公钥数字签名存在的安全隐患问题,采用QKD网络进行量子密钥分发,通过经典网络传输消息和签名等信息,提出了一种基于量子密钥分发(Quantum Key Distribution,QKD)和多线性哈希函数族的无条件安全签名方案(Multilinear Hash-Unconditionally Secure Signature,MH-USS),该方案中的签名具备不可伪造性、不可抵赖性以及可传递性,并且该方案可在现有设备上实现,具有较高的实用价值。然后,针对经典拜占庭容错共识机制PBFT共识效率相对较低的问题,提出了一种QS-BFT(Quantum-Secured Byzantine Fault Tolerance)共识机制。最后,通过增设“快速-标准”双共识模式以及允许节点对空区块投票的方式,减少系统通信次数并消除视图转换过程,使方案不仅具备安全性与活性,还能够有效降低消息复杂度,提高共识效率。对所提方案进行仿真实现与性能测试,结果表明,与改进后基于MH-USS签名方案的PBFT共识机制相比,所提方案吞吐量更高、时延更短。
基于素数幂次阶分圆环的NTRU型全同态加密方案
秦小月, 黄汝维, 杨波
计算机科学. 2022, 49 (5): 341-346.  doi:10.11896/jsjkx.210300089
摘要 ( 223 )   PDF(1490KB) ( 497 )   
参考文献 | 相关文章 | 多维度评价
全同态加密支持在不解密的情况下对密文进行任意运算,为云计算的隐私安全提供了一种保护,但目前使用近似特征向量法构造的全同态加密方案需要进行复杂的矩阵乘法计算,存在计算复杂、无法抵御子域攻击等问题。文中使用素数幂次阶分圆环代替2的幂次阶分圆环,提出了一种新的全同态加密方案,并通过修改密文形式以及解密结构有效避免了同态乘法中复杂的矩阵乘法计算。与同类方案相比,所提方案在效率上至少提升了lφ(x)/2d倍,并满足IND-CPA安全。
交叉与前沿
考虑行人特征与领导者角色的改进社会力模型
林金城, 纪庆革, 钟圳伟
计算机科学. 2022, 49 (5): 347-354.  doi:10.11896/jsjkx.210500144
摘要 ( 166 )   PDF(2827KB) ( 328 )   
参考文献 | 相关文章 | 多维度评价
社会力模型是人群运动仿真中的经典模型,该模型将行人的主观意愿和行人之间的相互影响等都通过“力”的形式来表达,模型简洁且易于解释,但是影响行人运动的因素是多方面的,原始社会力模型中自驱力和社会心理力的计算存在不足。为了使模型能够仿真出真实的运动过程,研究者们对社会力模型进行了改进。文中主要研究了人群疏散过程中的主体:行人。从行人特征和行人角色两个方面对行人进行建模,其中行人特征包括行人之间的亲疏关系、行人性格以及个体情绪,不同亲密程度的行人之间的干扰程度不同,而行人情绪也会影响行人的判断;行人角色方面考虑了领导者和普通行人,分析了不同行人角色对疏散过程的影响,领导者可以帮助普通行人疏散。通过人群自组织仿真实验,验证了改进模型能够仿真出真实的人群疏散状况,保留原模型的优势。同时,统计了4种仿真模型下人群的疏散效率和出口利用率,对实验数据中的均值和分布情况进行了分析。实验结果表明,导致行人疏散时间过长的主要原因是寻找出口耗时过长以及出口利用率不平衡。一般情况下,行人特征和领导者角色对行人疏散效率有积极影响,行人特征可以加快行人聚集以及优化行人期望速度,而领导者角色在帮助行人寻找出口的基础上,平衡了行人对出口的利用,保证了各出口疏散人数基本相同。
基于国产众核处理器的深度神经网络算子加速库优化
高捷, 刘沙, 黄则强, 郑天宇, 刘鑫, 漆锋滨
计算机科学. 2022, 49 (5): 355-362.  doi:10.11896/jsjkx.210500226
摘要 ( 289 )   PDF(3325KB) ( 432 )   
参考文献 | 相关文章 | 多维度评价
基于不同硬件设备的算子加速库已经成为深度学习框架不可或缺的一部分,能够为大规模训练或者推理任务提供数倍的性能加速。当前的主流算子库都是基于GPU架构开发的,与其他异构设计并不兼容; SWDNN算子库是基于申威26010开发的,无法充分发挥升级后的申威26010 pro处理器的性能,也不能满足当前GPT-3等大型神经网络模型对大容量内存和高访存带宽的需求。文中面向申威26010 pro处理器体系结构的特点和大型神经网络模型的训练需求,提出了基于多核组的三级并行和神经网络算子任务调度方案,在满足大型模型训练内存需求的同时,提高了并行效率和整体计算性能;提出了三级异步流水机制和计算访存重叠的访存优化方法,显著缓解了神经网络算子的访存性能瓶颈。基于以上方法,文中构建了基于申威26010 pro处理器的SWTensor多核组算子加速库,在自然语言处理模型GPT-2上进行了实验,结果表明,其典型计算密集型算子和访存密集型算子在单精度浮点计算性能和访存带宽上分别达到了理论峰值的90.4%和88.7%。
红黑Gauss-Seidel Stencil并行性和局部性优化
纪璎芮, 袁良, 张云泉
计算机科学. 2022, 49 (5): 363-370.  doi:10.11896/jsjkx.220100119
摘要 ( 383 )   PDF(2233KB) ( 482 )   
参考文献 | 相关文章 | 多维度评价
Stencil(模版计算)是一类常见的循环嵌套计算模式,被广泛应用于计算电磁、天气模拟、地球物理、海洋模拟等许多科学和工程模拟应用中。随着现代处理器体系结构的发展,多核和多层存储层次不断加深,研究并行性和局部性成为了提高程序运行速度的主要途径。分块是开发数据局部性和程序并行性的主要技术之一,目前,针对Stencil已提出了大量高效分块和向量化方法,但大多局限于具有较高并行度的Jacobi 类型的Stencil。Gauss-Seidel Stencil具有更优的收敛速度,被广泛应用于多重网格的计算中。这类Stencil的数据依赖更为复杂,文中面向红黑排序的Gauss-Seidel Stencil设计了一种并行分块和向量化算法,提升了Gauss-Seidel Stencil的数据局部性、中粒度多核并行性以及核内细粒度并行性。实验结果证实了本文方案的有效性。
面向河道环境监测的群智感知参与者选择策略
李晓东, 於志勇, 黄昉菀, 朱伟平, 涂淳钰, 郑伟楠
计算机科学. 2022, 49 (5): 371-379.  doi:10.11896/jsjkx.210200005
摘要 ( 189 )   PDF(3567KB) ( 504 )   
参考文献 | 相关文章 | 多维度评价
城市内河周边环境常常受到破坏和污染,如何有效地对河道进行监测逐渐引起公众、政府和学术界的关注。目前传统的监测方式存在成本高昂、覆盖面不足等缺陷。鉴于智能移动设备的不断普及,文中提出利用群智感知来高效监测河道环境的新思路。该问题可描述为假定每一河段附近有c个位置点可监测该河段,然后根据大量用户的移动轨迹选择出其中r个用户来共同完成s个时段对所有河段的监测。文中规定用户数r越小,监测成本越少。设计了逐步贪心策略、全局贪心策略和整数规划策略用于解决该问题,即选择最少参与者达到“s时长-c范围-r用户”的监测目标。将上述策略应用于福州市台江区部分河道的环境监测,实验结果表明,上述策略均能获得比随机策略更好的解,其中整数规划策略的表现最好。但是,随着问题规模的变大,解决小规模整数规划的隐枚举算法会出现无法求解的情况,因此提出了基于贪心初始化的离散粒子群算法(Greedy Initialization-Discrete Particle Swarm Optimization,GI-DPSO)。虽然该算法可以求解大规模整数规划,但计算费时。综合考虑监测成本和计算代价,建议对小规模问题采用整数规划策略,对大规模问题采用全局贪心策略。