1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2021年第6期, 刊出日期:2021-06-15
  
目录
第48卷第6期目录
计算机科学. 2021, 48 (6): 0-0. 
摘要 ( 249 )   PDF(290KB) ( 699 )   
相关文章 | 多维度评价
计算机体系结构*
一种面向构件化并行应用程序的性能骨架分析方法
傅天豪, 田鸿运, 金煜阳, 杨章, 翟季冬, 武林平, 徐小文
计算机科学. 2021, 48 (6): 1-9.  doi:10.11896/jsjkx.201200115
摘要 ( 808 )   PDF(2185KB) ( 1302 )   
参考文献 | 相关文章 | 多维度评价
性能骨架分析技术通过刻画并行应用程序的程序结构,为并行应用程序性能建模提供输入,是大规模并行应用程序性能分析、性能优化的基础。文中针对数值模拟领域中的一类构件化并行应用程序,在面向通用程序二进制文件的动静态结构分析技术的基础上,提出并实现了一种基于“构件-循环-调用”关系树(Component-Loop-Call-Tree,CLCT)的程序结构自动化生成方法,在此基础上,研制了一种面向构件化并行应用程序的性能骨架分析工具(CLCT SkeleTon Analysis Toolkit,CLCT-STAT)。该方法可以自动识别构件化应用程序中构件类成员函数符号,生成以构件为最小单位的并行应用程序性能骨架。在多个构件化并行应用程序上的测试表明,相比分析建模手动生成性能骨架的方法,所提方法不仅能提供更丰富的程序结构信息,还可以节约人工分析的时间成本。
面向SW26010处理器的三维Stencil自适应分块参数算法
朱雨, 庞建民, 徐金龙, 陶小涵, 王军
计算机科学. 2021, 48 (6): 10-18.  doi:10.11896/jsjkx.200700059
摘要 ( 732 )   PDF(2242KB) ( 1274 )   
参考文献 | 相关文章 | 多维度评价
Stencil计算是科学应用中的一类重要计算,而分块是提升Stencil计算数据局部性的关键技术。针对现有三维Stencil优化在SW26010处理器上缺少时间分块以及分块参数需手工调优的问题,引入时间分块,提出了面向SW26010处理器的三维Stencil自适应分块参数算法。通过建立性能分析模型,结合硬件计算能力及存储容量等限制因素,文中系统地分析了分块参数对模型性能的影响,判断性能瓶颈,指导分块参数的优化方向。基于性能分析模型,自适应分块参数算法可给出预测性能最优时的分块参数,有利于三维Stencil在SW26010处理器上的快速优化部署。选取了三维7点和三维27点Stencil算例进行实验。与未使用时间分块的三维Stencil优化相比,以上两个算例在自适应选择的分块参数下可以达到1.47和1.29的加速比,且实际最优分块参数与理论最佳分块参数一致,这验证了所提性能分析模型及自适应分块参数算法的有效性。
一种面向动态部分可重构片上系统的列表式软硬件划分算法
郭彪, 唐麒, 文智敏, 傅娟, 王玲, 魏急波
计算机科学. 2021, 48 (6): 19-25.  doi:10.11896/jsjkx.200700198
摘要 ( 500 )   PDF(2039KB) ( 935 )   
参考文献 | 相关文章 | 多维度评价
并行计算是提高系统资源利用率的重要手段,越来越多的多处理器片上系统通过集成具有不同功能特点的处理器来满足不同计算任务的需求。具备动态部分可重构特性的异构多处理器片上系统(Dynamic Partial Reconfiguration-Heteroge-neous Multiprocessor Systems-on-Chip,DPR-HMPSoC)因其并行性好、计算效率高而被广泛使用,而低复杂度和高求解性能的软硬件划分算法是充分发挥其计算性能优势的重要保证。已有的相关软硬件划分算法时间复杂度高,且对DPR-HMPSoC平台的支撑不足。针对上述问题,首先提出了一种列表启发式软硬件划分与调度算法,其通过构建基于任务优先级的调度列表,完成任务的调度、映射、FPGA动态部分可重构区域划分等一系列操作;接着给出了软件应用建模、计算平台建模及所提算法的详细设计方案。仿真实验结果表明,所提算法与混合整数线性规划(Mixed Integral Linear Programming,MILP)和蚁群优化(Ant Colony Optimization,ACO)算法相比,可有效减少求解时间,且时间优势与任务规模成正比;在调度长度方面,所提算法的平均性能提升了约10%。
基于SIMD扩展部件的长向量超越函数实现方法
刘聃, 郭绍忠, 郝江伟, 许瑾晨
计算机科学. 2021, 48 (6): 26-33.  doi:10.11896/jsjkx.200400007
摘要 ( 831 )   PDF(1971KB) ( 1552 )   
参考文献 | 相关文章 | 多维度评价
基础数学函数库是计算机系统非常关键的软件模块,然而国产申威平台上的长向量超越函数只能依靠循环调用系统标量函数来间接实现,该方法无法充分发挥申威平台SIMD扩展部件的计算性能。 为了有效解决此问题,实现了申威平台基于SIMD扩展部件底层优化的长向量超越函数,提出了浮点计算融合算法,解决了两分支结构算法难以向量化的问题;提出了基于Estrin算法动态分组的大阶数多项式实现方法,提高了多项式汇编计算的流水性能。 这是在国产申威平台上首次实现长向量超越函数库,提供的函数接口包含三角函数、反三角函数、对数函数、指数函数等。 实验结果表明,双精度版本最大误差控制在3.5ULP(unit in the last place)以下,单精度版本最大误差控制在0.5ULP以下,该性能与申威平台直接循环调用系统标量函数相比有显著提高,平均加速比为3.71。
基于神威平台的Floyd并行算法的实现和优化
何亚茹, 庞建民, 徐金龙, 朱雨, 陶小涵
计算机科学. 2021, 48 (6): 34-40.  doi:10.11896/jsjkx.201100051
摘要 ( 605 )   PDF(2223KB) ( 1254 )   
参考文献 | 相关文章 | 多维度评价
求解全源最短路径的Floyd算法是许多实际应用基础上的关键构建块,由于其时间复杂度较高,串行Floyd算法不适用于大规模输入图计算,针对不同平台的并行Floyd算法设计可为解决现实问题提供有效帮助。针对Floyd算法与国产自主研发处理器匹配滞后的问题,首次提出基于神威平台的Floyd并行算法的实现和优化。根据SW26010处理器主-从核架构的特点,采用主从加速编程模型进行并行实现,并分析了影响该算法性能的关键因素,通过算法优化、数组划分和双缓冲技术进行优化,逐步提升算法性能。测试结果表明,与主核上串行算法相比,基于神威平台的Floyd并行算法在单个SW26010处理器上可以获得106倍的最高加速。
面向64位RISC-V的基础数学库自动化移植
曹浩, 郭绍忠, 刘聃, 许瑾晨
计算机科学. 2021, 48 (6): 41-47.  doi:10.11896/jsjkx.201200058
摘要 ( 456 )   PDF(1983KB) ( 848 )   
参考文献 | 相关文章 | 多维度评价
受制于核心技术和知识产权等客观条件,国产自主芯片的研发困难重重。RISC-V作为一个开源指令集架构(ISA),具有简洁、模块化等优点,成为了国产处理器的新选择。基础数学库作为计算机系统最基础的核心软件库之一,对国产处理器的软件生态建设和健康发展尤为重要,而目前RISC-V还没有相关的基础数学库。因此,文中旨在将基于国产申威处理器的基础数学库移植到64位RISC-V平台。为了解决基础数学库的高效移植问题,首先设计了一个自动化移植框架,该框架通过功能模块间的松耦合,来实现高可扩展性;然后根据64位RISC-V指令集架构的特点,提出了基于全局的主动式寄存器分配方法和基于层次的指令选择策略;最后应用该框架,实现了对申威平台基础数学库中典型函数的移植,测试结果表明移植后函数功能正确且相对于GLIBC库在性能上有一定的提升。
数据库&大数据&数据科学
基于Stack Overflow的数据库相关主题分析
刘蕴涵, 沙朝锋, 牛军钰
计算机科学. 2021, 48 (6): 48-56.  doi:10.11896/jsjkx.200800217
摘要 ( 446 )   PDF(1824KB) ( 839 )   
参考文献 | 相关文章 | 多维度评价
数据库管理系统虽是一种较为成熟的软件系统,但开发人员在应用数据库系统进行数据管理以及数据分析时还是会遇到各种问题,因此会在Stack Overflow之类的问答论坛上寻求解决方法。文中获取了Stack Overflow上94473条与数据库相关的问题,应用LDA主题模型将这些问题归为25个主题,结果显示开发者的问题可归为“表”“SQL”“SELECT”等主题。通过研究与数据库相关的不同主题的流行度和困难程度发现,“SQL”主题相关的问题较为流行。除此以外,文中还分别研究了3种不同的数据库,即MySQL,Oracle和MongoDB,分析了与不同数据库系统相关的问题的主题分布。文中的研究成果有助于了解数据库开发者所面临的挑战,从而为数据库系统版本更新、数据库课程教学内容的设置,甚至是数据库领域的研究问题提供参考。
基于查询对象的路网Skyline查询中Why-not问题的研究
朱润泽, 秦小麟, 刘嘉琛
计算机科学. 2021, 48 (6): 57-62.  doi:10.11896/jsjkx.200700016
摘要 ( 462 )   PDF(1960KB) ( 703 )   
参考文献 | 相关文章 | 多维度评价
随着信息技术的高度发展,数据成为了重要的战略资源,如何利用大数据进行查询是众多学者的研究内容。与此同时,被查询对象在未被选择时,如何利用大数据使自己能够满足用户的查询要求也成为了重要的研究方向。在分析现有算法存在的不足的基础上,根据实际生活中查询的特点,对基于查询对象的路网Skyline查询中的why-not问题进行了研究,并针对此问题提出了属性优化算法。该算法包括修改why-not点的空间属性和非空间属性,以及修改查询中心的位置。考虑到实际情况,将时间属性单列而不是简单地将其作为非空间属性的一维。算法采用剪枝策略以提高效率。最后在真实路网数据和生成的兴趣点数据集上进行对比实验,结果表明在特定时间段同时修改空间、非时空属性的方法可以有效地解决此问题。
学术论文公开评审平台数据分析
张明阳, 王刚, 彭起, 张岩峰
计算机科学. 2021, 48 (6): 63-70.  doi:10.11896/jsjkx.200500138
摘要 ( 434 )   PDF(2426KB) ( 1283 )   
参考文献 | 相关文章 | 多维度评价
我国目前的学术评价体制饱受诟病,因而构建公平、公正、公开的学术评价体制对营造良好的学术环境至关重要。近年来,学术论文公开评审网站OpenReview的出现给学术论文评价带来了一种新思路。论文评审采用双盲机制,论文及审稿意见向大众公开,这在一定程度上加强了同行对审稿过程的监督,提高了学术评价的公平性。该模式已经被部分人工智能领域的国际顶级会议所采用。文中爬取了OpenReview平台上的5527篇论文投稿及16853条评审意见数据进行大数据分析,并重点关注了参与其中的中国投稿人和中国评审人的数据分析,得到若干统计分析结果,这些统计结果对了解我国科研人员的特点、改善我国学术评价体制具有一定的参考价值。
改进KNN的时间序列分析方法
黄铭, 孙林夫, 任春华, 吴奇石
计算机科学. 2021, 48 (6): 71-78.  doi:10.11896/jsjkx.200500044
摘要 ( 987 )   PDF(2767KB) ( 1731 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着数据挖掘和机器学习的兴起,基于时间序列分析方法的研究愈加丰富。作为机器学习的经典方法,KNN(K-Nearest Neighbor)因其简单、准确度高等特性被广泛应用于时间序列分析的各个领域。然而,使用原始的KNN回归方法预测时间序列具有一定的局限性,直接使用欧氏距离作为相似度度量方法的预测效果并不理想,无法适应具有整体趋势变化的时间序列的预测场景。文中提出一种拟合时间序列趋势的KNN算法TSTF-KNN(Time Series Trend Fitting KNN)算法,该方法通过对每个时刻的特征序列进行归一化处理,改进了KNN相似度度量的效果,使之可以更有效地搜索相似的特征序列。由于序列预测前进行了归一化,文中通过为预测结果添加误差项来还原序列特征,使之可以有效地预测结果。为了验证方法的有效性,从kaggle公开数据集中选取了4个数据集,并通过对这4个数据集分别进行预处理获得5个时间序列以供实验。通过使用TSTF-KNN、KNN、单层LSTM(Long Short-Term Memory)神经网络和ANN(Artificial Neural Network)在处理后的5个时间序列上进行预测实验,分析预测结果,并对比均方误差(Mean Square Error,MSE),验证了该方法的有效性。实验结果表明,该方法能有效提高KNN回归方法对时间序列预测的准确度和稳定性,使之可以更好地适应具有整体趋势变化的时间序列的预测场景。
基于核保持嵌入的子空间学习
贺文琪, 刘保龙, 孙兆川, 王磊, 李丹萍
计算机科学. 2021, 48 (6): 79-85.  doi:10.11896/jsjkx.200900014
摘要 ( 307 )   PDF(2305KB) ( 754 )   
参考文献 | 相关文章 | 多维度评价
子空间学习是特征提取领域中的一个重要研究方向,其通过一种线性或非线性的变换将原始数据映射到低维子空间中,并在该子空间中尽可能地保留原始数据的几何结构和有用信息。子空间学习的性能提升主要取决于相似性关系的衡量方式和特征嵌入的图构建手段。文中针对子空间学习中的相似性度量与图构建两大问题进行研究,提出了一种基于核保持嵌入的子空间学习算法(Kernel-preserving Embedding based Subspace Learning,KESL),该算法通过自表示技术自适应地学习数据间的相似性信息和基于核保持的构图。首先针对传统降维方法无法挖掘高维非线性数据的内部结构问题,引入核函数并最小化样本的重构误差来约束最优的表示系数,以期挖掘出有利于分类的数据结构关系。然后,针对现有基于图的子空间学习方法大都只考虑类内样本相似性信息的问题,利用学习到的相似性矩阵分别构建类内和类间图,使得在投影子空间中同类样本的核保持关系得到加强,不同类样本间的核保持关系被进一步抑制。最后,通过核保持矩阵与图嵌入的联合优化,动态地求解出最优表示下的子空间投影。在多个数据集上的实验结果表明,所提算法在分类任务中的性能优于主流的子空间学习算法。
基于二阶近邻的核子空间聚类
王中元, 刘惊雷
计算机科学. 2021, 48 (6): 86-95.  doi:10.11896/jsjkx.200800180
摘要 ( 255 )   PDF(2834KB) ( 819 )   
参考文献 | 相关文章 | 多维度评价
高维数据集的处理是计算机视觉领域的核心,子空间聚类是实现高维数据聚类使用最广泛的方法之一。传统的子空间聚类假定数据来自不同的线性子空间,且不同子空间的区域不重叠。然而,现实中的数据往往不满足这两个约束条件,使得子空间聚类的效果受到影响。为了解决这两个问题,引入核化子空间来解决子空间数据的非线性问题,引入子空间系数矩阵的二阶近邻来处理重叠的子空间问题。随后,设计了基于二阶近邻的核化子空间三步聚类算法,首先求取核化子空间数据的自相似系数,然后消除子空间的重叠区域,最后对系数矩阵进行谱聚类。将所设计的子空间聚类算法首先在人工数据集上进行了测试,随后在人脸、场景字符和生物医学3类数据集中共12个真实数据集上进行了实验。实验结果表明,所提算法相比最新的几种算法具有一定的优势。
面向数据表示的Cauchy非负矩阵分解
段菲, 王慧敏, 张超
计算机科学. 2021, 48 (6): 96-102.  doi:10.11896/jsjkx.200700195
摘要 ( 339 )   PDF(2105KB) ( 691 )   
参考文献 | 相关文章 | 多维度评价
非负矩阵分解(Non-negative Matrix Factorization,NMF)是一类广泛应用于数据挖掘和机器学习领域的重要矩阵分解模型,可从一组高维非负向量中提取出低维、稀疏和有意义的特征。标准NMF利用Frobenius范数的平方度量重建误差,虽然在一些应用场景中表现出一定的有效性,但对非高斯噪声和离群点较为敏感。由于现实世界中的真实数据不可避免地包含各种噪声,因此有必要对非高斯噪声和离群点较为稳健的非负矩阵分解模型进行研究。为此,文中提出用Cauchy估计函数取代标准NMF中的平方形式的残差。在度量样本重建误差时,充分考虑样本特征不同维度之间的相关性,以样本的重建误差作为基本的重建误差度量单元。此外,基于半二次规划推导了高效的乘性更新规则,用于求解所提出的模型。在3个真实人脸图像库上的聚类实验中验证了所提模型和算法的有效性。实验结果表明,所提算法对人脸姿态、光照和表情变化均表现出一定的稳健性,且聚类结果对参数的依赖性较小。
计算机图形学&多媒体
学习全局引导渐进特征聚合轻量级网络的显著性目标检测
潘明远, 宋慧慧, 张开华, 刘青山
计算机科学. 2021, 48 (6): 103-109.  doi:10.11896/jsjkx.200600068
摘要 ( 326 )   PDF(3655KB) ( 1026 )   
参考文献 | 相关文章 | 多维度评价
针对目前显著性目标检测算法中存在的特征融合不充分、模型较为冗余等问题,提出了一种基于全局引导渐进特征融合的轻量级显著性目标检测算法。首先,使用轻量特征提取网络MobileNetV3对图像提取不同层次的多尺度特征;然后对MobileNetV3提取的高层语义特征使用轻量级多尺度感受野增强模块以进一步增强其全局特征的表征力;最后设计渐进特征融合模块对多层多尺度特征自顶而下逐步融合,并采用常用的交叉熵损失函数在多个阶段对这些融合特征进行优化,得到由粗到细的显著图。整个网络模型是无需预处理和后处理的端到端结构。在6个基准数据集上进行了大量实验,并采用PR_Curve,F-measure,S-measure和MAE指标来衡量性能。结果表明,所提方法明显优于10种先进的对比方法,并且算法模型大小仅约为10MB,在GTX2080Ti显卡上处理大小为400×300像素的图像的速度可以达到46帧/秒。
时间一致性保持的多任务稀疏深度表达视觉跟踪
郭文, 尹童灵, 张天柱, 徐常胜
计算机科学. 2021, 48 (6): 110-117.  doi:10.11896/jsjkx.200800212
摘要 ( 397 )   PDF(4834KB) ( 957 )   
参考文献 | 相关文章 | 多维度评价
建立一个既能充分考虑目标表观表达的判别性、又能在后续的跟踪过程中保持特征的时间一致性的模型,是解决跟踪问题的关键。为了提高跟踪算法的特征表达判别性和解决跟踪过程中的特征时效性退化问题,文中提出了一种时间一致性保持的稀疏深度表达的跟踪方法。首先,利用不同卷积层上的特征有不同的属性来构建多任务的稀疏深度表达学习方法,充分挖掘多源信息的相关性。其次,利用相关帧的残差构建时间一致性约束正则项,以对跟踪过程特征的退化起到补偿作用,提高了跟踪算法特征的时间一致性。大量实验视频的跟踪结果显示,相比当前的主流算法,所提算法在复杂背景、快速运动等情况下具有更好的跟踪效果和稳定性。
基于跨列特征融合的人群计数方法
李佳倩, 严华
计算机科学. 2021, 48 (6): 118-124.  doi:10.11896/jsjkx.200700107
摘要 ( 521 )   PDF(2418KB) ( 784 )   
参考文献 | 相关文章 | 多维度评价
人群计数是计算机视觉和机器学习领域中一个极具挑战性的课题。由于人群尺度变化和场景遮挡等现象会导致计数准确度不高,因此提出了一种基于跨列特征融合的人群计数方法(Cross-column Features Fusion Network,CCFNet)。该方法融合了来自多列不同接受域的特征,并且结合了拥有互质扩张率的空洞卷积,因此不仅能够增大感受野,还能保证信息的连续性,从而更好地适应人群规模的巨大变化;同时引入注意力模型引导网络聚焦于图片中的头部位置,根据注意力分数图为不同位置分配不同的权重,突出人群而弱化背景,最终得到高质量的密度图。在当前主流的人群计数数据集上的对比实验中,所提方法的平均绝对误差(Mean Absolute Error,MAE)在ShanghaiTech数据集的A,B子集上分别达到了63.2和8.9,在UCF_CC_50数据集上达到了222.1,在WorldExpo’10数据集上达到了7.1。这表明所提方法具有更好的计数准确度,能够很好地适应不同的场景,尤其对于尺度变化较大的场景,效果优于以往的大多数算法。
基于特征融合的文本到图像的生成
徐泽, 帅仁俊, 刘开凯, 马力, 吴梦麟
计算机科学. 2021, 48 (6): 125-130.  doi:10.11896/jsjkx.200400107
摘要 ( 523 )   PDF(2804KB) ( 1117 )   
参考文献 | 相关文章 | 多维度评价
近年来,基于生成对抗网络(Generative Adversarial Network,GAN)从文本描述中合成图像这一具有挑战性的任务已经取得了令人鼓舞的结果。这些方法虽然可以生成具有一般形状和颜色的图像,但通常也会生成具有不自然的局部细节且扭曲的全局图像。这是因为卷积神经网络在捕获用于像素级别图像合成的高级语义信息时效率低下,以及处于粗略状态的生成器-鉴别器由于缺少详细信息生成了有缺陷的结果,而这个结果会作为输入促使最终结果的生成。因此,提出了一种基于特征融合的生成对抗网络。该网络通过嵌入残差块特征金字塔结构来引入多尺度特征融合,并通过自适应融合这些特征直接生成最后的精细图像,仅使用一个鉴别器就可以生成256px×256px的逼真图像。将所提方法在花类数据集Oxford-102和加利福尼亚理工学院鸟类数据库CUB上进行验证,使用Inception Score和FID评估生成图像的质量,结果表明,生成图像的质量明显优于以往若干经典的方法。
基于深度动态联合自适应网络的图像识别方法
刘昱彤, 李鹏, 孙云云, 胡素君
计算机科学. 2021, 48 (6): 131-137.  doi:10.11896/jsjkx.210100008
摘要 ( 294 )   PDF(2300KB) ( 1017 )   
参考文献 | 相关文章 | 多维度评价
相比传统的图像识别方法,利用深度网络可以提取到表征能力更好的特征,从而获得更好的识别效果。现实中任务提供的数据多为无标签数据或部分有标签数据,其为深度网络的学习带来了困难。而迁移学习的方法可以将从源域数据中学习到的知识迁移到目标任务的学习中,以解决有标签数据不足的问题。为了在迁移过程中减小源域和目标域间的图像数据差异,文中提出基于深度动态联合自适应网络的图像识别方法。对网络进行训练时,首先在多层网络结构中利用域间动态联合自适应方法完成针对性的数据分布自适应,然后利用熵最小化原则使学习的目标分类器穿过目标域的低密度区域,从而提高对目标域图像的识别精度。在2018年AI challenge比赛提供的24种植物病害数据集的3种迁移任务(g1->g2,s1->g2和s2->g2)中,所提方法的准确率分别达到了97.27%,94.25%和93.66%,均优于其他算法。实验结果证明,文中提出的基于深度网络并使用动态联合自适应和熵最小化原则的学习框架能够准确识别图像。
改进非线性结构张量的含噪图像边缘检测
宋昱, 孙文赟
计算机科学. 2021, 48 (6): 138-144.  doi:10.11896/jsjkx.200600017
摘要 ( 394 )   PDF(4377KB) ( 806 )   
参考文献 | 相关文章 | 多维度评价
现有的边缘检测方法在含噪图像中的检测性能不佳。针对含噪图像的边缘检测问题,提出了利用引导核改进基于非线性结构张量的含噪图像边缘检测方法。首先,计算含噪图像的张量积。然后,根据图像梯度对张量积进行扩散,图像梯度依赖张量积本身。扩散方程中的扩散矩阵包含张量积,该张量积是通过各向异性的引导核进行空间自适应平均,而不是通过各向同性的高斯核进行平均。最后计算扩散张量积的特征值和特征向量,并基于此检测图像的边缘。将所提方法与基于线性结构张量的边缘检测方法、基于张量梯度扩散的非线性结构张量的边缘检测方法、基于图像梯度扩散的非线性结构张量的边缘检测方法进行比较,实验结果表明,所提方法可以得到更为清晰的边缘,并且检测结果中噪声较少。
基于生成对抗网络的图像阴影消除算法
石恒, 张玲
计算机科学. 2021, 48 (6): 145-152.  doi:10.11896/jsjkx.200900109
摘要 ( 470 )   PDF(4425KB) ( 999 )   
参考文献 | 相关文章 | 多维度评价
虽然现有基于深度学习的图像阴影消除方法已取得了一定的进步,但是这些方法主要关注图像本身,没有很好地探索其他额外与阴影相关的信息,因此这些方法常常存在图像纹理模糊、内容不协调等问题。针对这些问题,文中基于生成对抗网络(Generative Adversarial Network,GAN),提出了一种新的阴影消除网络模型。该方法首先从全局上生成一个粗糙的阴影消除结果,再利用与阴影相关的残差信息对粗糙的结果在颜色和细节上进行局部优化,从而获得更加真实自然的无阴影图像。生成网络包含3个编码-解码结构,首先利用第1个编码-解码结构对阴影图像进行整体光照恢复,生成一个初始的阴影消除结果;同时将与阴影相关的残差信息作为辅助信息输入第2个编码-解码器,对初始结果进行进一步优化;为了避免阴影区域出现纹理不协调等问题,最后利用第3个编码-解码器对阴影区域细节纹理进行修正,使得生成的阴影消除图像更加真实自然。对抗网络由Patch鉴别器构成,用来鉴别图像阴影消除结果的真实性。实验结果表明,与目前的图像阴影消除方法相比,无论在阴影区域还是在非阴影区域上所提方法都达到了最佳的RMSE值,且该方法生成的阴影消除图像与真实无阴影图像更加接近,有效解决了纹理模糊等问题,证实了该方法的有效性和可行性。
基于9轴姿态传感器的CNN旗语动作识别方法
钟岳, 方虎生, 张国玉, 王钊, 朱经纬
计算机科学. 2021, 48 (6): 153-158.  doi:10.11896/jsjkx.200500005
摘要 ( 439 )   PDF(3339KB) ( 909 )   
参考文献 | 相关文章 | 多维度评价
区别于传统光纤传感器、图像识别和Kinect深度图像的旗语动作识别方法,提出了一种基于9轴姿态传感器的旗语动作识别方法。该方法通过佩戴在手腕处的9轴姿态传感器来采集旗语动作的3轴加速度、3轴角速度以及3轴磁偏角数据;在运用卷积神经网络(Convolutional Neural Network,CNN)分类模型的基础上对其中的数据进行预处理,并通过分类识别算法对其进行改进;在数据预处理阶段,利用小波分解与重构函数对采集到的9轴数据进行高频去噪和低频信息提取,通过时间序列加窗进行分割处理,对各动作样本进行维度和长度统一;在特征提取阶段,采用构建的双卷积层、单池化层、单全连接层网络模型对重构数据进行特征提取;在分类识别阶段,提出一种CrossEntropy-Logistic联合损失函数来对5种动作进行迭代训练。实验结果表明,所提方法利用detcoef小波分解与重构函数对信号进行低频细节系数提取并采用一维CNN对降噪后的数据进行特征提取,通过CL联合损失函数对预测损失值和预测概率进行融合,分析所得到的训练准确率与测试准确率,在与各类方法的对比中取得了最高值,其平均训练识别率可达99%以上,测试准确率可达94%。
人工智能
神经问题生成前沿综述
邱嘉作, 熊德意
计算机科学. 2021, 48 (6): 159-167.  doi:10.11896/jsjkx.201100013
摘要 ( 629 )   PDF(2747KB) ( 1531 )   
参考文献 | 相关文章 | 多维度评价
问题生成是指机器主动对一段文本进行提问,生成一个自然语言的问题。神经问题生成则是完全采用端到端的训练方式,使用神经网络完成文档和答案到问题的转换,是自然语言处理中一个新兴而又重要的研究方向。文中首先对神经问题生成进行了简单介绍,包括基本概念、主流框架和评价方法。接着介绍了该研究方向的关键问题,包括输入建模、长文本处理、多任务学习、机器学习方法的应用、其他研究问题和改进点。最后,介绍了问题生成和问答系统的关系,以及问题生成的未来研究方向。
基于自适应调节策略熵的元强化学习算法
陆嘉猷, 凌兴宏, 刘全, 朱斐
计算机科学. 2021, 48 (6): 168-174.  doi:10.11896/jsjkx.200600133
摘要 ( 543 )   PDF(2263KB) ( 1102 )   
参考文献 | 相关文章 | 多维度评价
传统的深度强化学习方法依赖大量的经验样本并且难以适应新任务。元强化学习通过从以往的训练任务中提取先验知识,为智能体快速适应新任务提供了一种有效的方法。基于最大熵强化学习框架的元深度强化学习通过最大化期望奖赏和最大化策略熵来优化策略。然而,目前以最大熵强化学习框架为基础的元强化学习算法普遍采用固定的温度参数,这在面对元强化学习的多任务场景时是不合理的。针对这一问题,提出了自适应调节策略熵(Automating Policy Entropy,APE)算法。该算法首先通过限制策略的熵,将原本的目标函数优化问题转换为受限优化问题,然后将受限优化问题中的对偶变量作为温度参数,通过拉格朗日对偶法求解得到其更新公式。根据得到的更新公式,温度参数将在每一轮元训练结束之后进行自适应调节。实验数据表明,所提算法在Ant-Fwd-Back和Walker-2D上的平均得分提高了200,元训练效率提升了82%;在Humanoid-Direc-2D上的策略收敛所需的训练步数为23万,收敛速度提升了127%。实验结果表明,所提算法具有更高的元训练效率和更好的稳定性。
基于深度信号处理和堆叠残差GRU的刀具磨损智能预测模型
胡德凤, 张晨曦, 汪世涛, 赵钦佩, 李江峰
计算机科学. 2021, 48 (6): 175-183.  doi:10.11896/jsjkx.210100101
摘要 ( 613 )   PDF(2491KB) ( 1335 )   
参考文献 | 相关文章 | 多维度评价
刀具磨损的智能监测是影响现代机械加工业智能化发展进程的重要因素。在机械加工过程中,大多数机床通过使用传感器采集信号,从而建立刀具磨损与传感器信号之间的关系,在不中断加工过程的情况下中实现刀具的磨损预测,根据是否达到磨损阈值来判断是否自动换刀或报警以实现在线智能监控。能否从传感器信号中提取有效的特征信息,并且建立一个快速响应且精确的预测模型是一个亟待解决的问题。因此,针对上述问题,提出了一种基于深度信号处理和堆叠残差GRU的刀具磨损预测模型。在信号处理方面设计了BiGRU-Self Attention(BGSA)模块,利用双向门控循环单元和内部注意力机制来获取动态时序特征,反映出不同特征的影响程度,以提高建模效率。同时,提出堆叠残差GRU(Stacked-ResGRU)模型实现对刀具实时磨损值的预测,通过残差结构优化了网络结构,加快了模型的收敛速度。通过使用公开的数据集,对铣削过程中刀具的磨损状态预测进行实验研究,实验结果验证了该方法的可行性与有效性。通过对实验结果的对比分析可知,所提模型能够有效地表征刀具磨损程度,并大大减小了预测误差,取得了良好的预测效果。
基于改进RNN和VAR的船舶设备故障预测方法
曾友渝, 谢强
计算机科学. 2021, 48 (6): 184-189.  doi:10.11896/jsjkx.200700117
摘要 ( 531 )   PDF(3103KB) ( 902 )   
参考文献 | 相关文章 | 多维度评价
针对现有的多变量时间序列预测方法不能适用于船舶多设备故障预测的问题,提出一种基于改进的循环神经网络和向量自回归的船舶设备故障预测方法。该方法既能够学习多个变量之间的相互依赖关系和时间序列的长期依赖关系,又有助于减轻传统神经网络对预测时间序列的输入尺度不敏感性。首先,从船舶历史数据库中提取出正常状态数据和故障状态数据,将其多变量时间序列转化为监督学习问题的输入;然后,通过注意力机制捕获船舶多变量之间复杂的相关性;接着,将注意力机制的输出同时作为循环神经网络和向量自回归的输入,分别捕获船舶时间信号的非线性关系和线性关系;最后,将循环神经网络组件和向量自回归组件的输出进行处理后作为最终预测的结果。实验结果表明,提出的预测方法在船舶设备故障预测中训练过程的稳定性高,测试结果的均方根误差低于1.2,从而能更精确地预测船舶设备属性的趋势并避免故障的发生。
基于整车EMC标准测试和机器学习的反向诊断方法
雷剑梅, 曾令秋, 牟洁, 陈立东, 王淙, 柴勇
计算机科学. 2021, 48 (6): 190-195.  doi:10.11896/jsjkx.200700204
摘要 ( 306 )   PDF(2394KB) ( 728 )   
参考文献 | 相关文章 | 多维度评价
智能汽车的快速发展促使电磁兼容(Electromagnetic Compatibility,EMC)测试技术得以完善,同时也给车辆EMC设计带来了新的挑战,而面向测试数据的故障排查有利于车辆EMC的设计。随着电子系统复杂性的提升,车载系统设计人员面临着越来越多的电磁兼容故障可能性,因此需要更为有效的EMC故障诊断方法。然而,由于EMC测试数据集具有样本小、非线性、高维等特点,致使EMC故障诊断难度较大。鉴于此,结合EMC测试工程师多年的整改经验,文中提出了一种关于电磁兼容测试数据的特征提取算法,并利用从测试数据中提取出的有价值的特征数据,搭建了支持向量机二分类模型,实现了EMC故障分类,并展示了相应的应用效果。为了验证所提方法的有效性,采用朴素贝叶斯分类模型进行对比,实验结果表明,所提方法能够满足智能汽车EMC故障诊断的需求。
结合多粒度信息的文本匹配融合模型
吕乐宾, 刘群, 彭露, 邓维斌, 王崇宇
计算机科学. 2021, 48 (6): 196-201.  doi:10.11896/jsjkx.200700100
摘要 ( 352 )   PDF(1830KB) ( 1381 )   
参考文献 | 相关文章 | 多维度评价
常规的文本匹配模型大致分为基于表示的文本匹配模型和基于交互的文本匹配模型。由于基于表示的文本匹配模型容易失去语义焦点,而基于交互的文本匹配模型会忽视全局信息,文中提出了结合多粒度信息的文本匹配融合模型。该模型通过交互注意力和表示注意力将两种文本匹配模型进行了融合,然后利用卷积神经网络提取了文本中存在的多个不同级别的粒度信息,使得模型既能抓住局部的重要信息又能获取全局的语义信息。在3组不同的文本匹配任务上的实验结果表明,所提出的模型在NDCG@5评价指标上分别优于其他最优模型5.3%,0.4%,1.5%。通过提取文本中的多个粒度信息并结合交互注意力和表示注意力,提出的模型能够有效地关注不同级别的文本信息,解决了传统模型在文本匹配过程中易失去语义焦点和忽视全局信息的问题。
基于全局和局部判别对抗自编码器的异常检测方法
邢红杰, 郝忠
计算机科学. 2021, 48 (6): 202-209.  doi:10.11896/jsjkx.200400083
摘要 ( 527 )   PDF(2516KB) ( 961 )   
参考文献 | 相关文章 | 多维度评价
生成式对抗神经网络(Generative Adversarial Nets,GAN)和对抗自编码器(Adversarial Autoencoder,AAE)被成功地应用于图像生成中。此外,对抗网络能够无监督地对样本中所包含的数据特征进行学习。然而,将传统的对抗网络应用于异常检测时取得的分类效果较差,有两个方面的原因:一是GAN属于生成式模型,但异常检测模型往往被归入判别式模型的范畴;二是现有的AAE以自编码器的中间向量作为判别输入,对数据的重构效果不够理想。基于此,提出了一种基于双判别器的AAE,并将其应用于解决异常检测问题。所提方法中的双判别器具有不同的判别能力,即局部判别能力和全局判别能力。在MNIST,Fashion-MNIST和CIFAR-10数据集上的实验结果表明,所提方法能够有效避免训练过程中出现模式崩溃的问题。此外,与相关方法进行对比,所提方法取得了更优的检测性能。
基于相对危险度的儿童先心病风险因素分析算法
徐慧慧, 晏华
计算机科学. 2021, 48 (6): 210-214.  doi:10.11896/jsjkx.200500082
摘要 ( 393 )   PDF(1656KB) ( 612 )   
参考文献 | 相关文章 | 多维度评价
对疾病相关风险项的分析是数据挖掘理论在医疗领域应用的一个重要内容,可以帮助医生分析疾病成因,从而有效地开展防治工作。医学领域的疾病数据有其自身的特征,例如其高度不平衡性的特点往往使得大量珍贵的信息蕴藏于支持度小的属性项中,直接采用经典的基于支持度的关联规则挖掘算法易造成重要信息的丢失。因此,文中结合医疗领域的知识,基于医学领域常用的统计标准——相对危险度,提出了一种挖掘疾病高风险项集的算法(Mining Algorithm for high Relative Risk Itemsets,MARRI),以及与之相匹配的两种规则剪枝方法,即作用叠加剪枝和样本数剪枝,并在儿童先心病数据集上对算法进行验证。实验结果表明,该算法具有挖掘低支持度项集信息的能力,挖掘出的疾病关联因素更有价值。
基于动态近邻套索算子的金字塔演化策略
张蔷, 黄樟灿, 谈庆, 李华峰, 湛航
计算机科学. 2021, 48 (6): 215-221.  doi:10.11896/jsjkx.200400115
摘要 ( 296 )   PDF(2747KB) ( 709 )   
参考文献 | 相关文章 | 多维度评价
优化问题是工程领域常见的问题之一,大多数工程问题的本质是函数优化问题。金字塔演化策略(Pyramid Evolution Strategy,PES)在求解函数优化问题时虽然能够很好地建立种群“开采”与“探索”以及“竞争”与“协作”之间的平衡,但是仍存在收敛速度慢、求解精度低、容易陷入局部最优等问题。针对上述问题,提出了基于动态近邻套索算子的金字塔演化策略(DNLPES)。DNLPES算法根据演化代数自适应控制目标个体群的选择范围参数,同时在目标个体群中通过欧氏距离来度量个体之间的差异性;利用个体之间的差异信息引导个体间的协作,通过持续产生新个体并剔除适应度值较差的个体来完成种群进化;通过充分利用种群个体之间的差异性信息并增强个体之间的协作来进一步提高算法的求解精度。将DNLPES算法与7种算法在9个测试函数上进行对比实验,实验结果表明,DNLPES算法在求解精度上具有一定的竞争力,DNLPES算法相比标准PES算法在求解精度与收敛速度上均具有明显优势。
基于共现的汉语词的分布表示学习与改进
曹学飞, 牛倩, 王瑞波, 王钰, 李济洪
计算机科学. 2021, 48 (6): 222-226.  doi:10.11896/jsjkx.200900140
摘要 ( 395 )   PDF(1298KB) ( 985 )   
参考文献 | 相关文章 | 多维度评价
词与其上下文的共现矩阵是词的分布表示学习的关键。在构造共现矩阵时,可采用不同方法来度量词与其上下文之间的关联。文中首先介绍了3种词与其上下文的关联度量方法并构造了相应的共现矩阵,使用同一个优化求解框架学习得到词的分布表示,在中文词语类比任务和语义相似性任务上的评价结果显示,GloVe方法的结果最好;然后进一步对GloVe方法进行了改进,通过引入一个超参数校正词与其上下文的共现次数,以使校正后的共现次数近似服从Zip’f分布,并给出了求解该超参数估计值的方法。基于改进后的方法学习得到的词的分布表示在词语类比任务上的准确率提高了0.67%,且在McNemar检验下是显著的;在词语相似性任务上的性能提高了5.6%。此外,将改进后的方法得到的词的分布表示应用到语义角色识别任务中,作为词特征的初始向量得到的F1值相比使用改进前的词的分布得到的F1值也提高了0.15%,且经3×2交叉验证的Bayes检验其提升也较为显著。
基于双角度并行剪枝的VGG16优化方法
李杉, 许新征
计算机科学. 2021, 48 (6): 227-233.  doi:10.11896/jsjkx.200800016
摘要 ( 433 )   PDF(1754KB) ( 893 )   
参考文献 | 相关文章 | 多维度评价
近年来,对卷积神经网络的轻量化工作更多的是根据滤波器的范数值来进行裁剪,范数值越小,裁剪之后对网络的影响就越小。这种思路充分利用了滤波器的数值特性,但也忽略了滤波器的结构特性。基于上述观点,文中尝试将凝聚层次聚类算法AHCF(Agglomerative Hierarchical Clustering Method for Filter)应用到VGG16上,并利用此算法的结果对滤波器进行冗余性分析和数值分析;然后,提出了双角度并行剪枝方法,从滤波器的数值角度和结构角度对滤波器同时进行裁剪。所提方法裁剪了VGG16网络的冗余滤波器,降低了网络的参数数量,在提高网络分类精度的同时,基本保留了原有网络的学习速率。在CIFAR10数据集上,所提方法的分类精度相比原始网络提高了0.71%;在MNIST上,所提方法基本和原始网络保持相近的分类精度。
三元概念的启发式构建及其在社会化推荐中的应用
刘忠慧, 赵琦, 邹璐, 闵帆
计算机科学. 2021, 48 (6): 234-240.  doi:10.11896/jsjkx.200500136
摘要 ( 257 )   PDF(1719KB) ( 732 )   
参考文献 | 相关文章 | 多维度评价
形式概念分析作为知识发现的方法,在理论分析和实际应用中已经取得很多成果。随着三维数据的涌现,许多学者开始了对三元形式概念分析的研究。但是,目前该领域的研究和应用较少,尤其还没有被应用到推荐系统。文中介绍了三元概念的构建及其社会化推荐应用。首先设计启发式信息,构造覆盖所有用户的三元概念集合,启发式信息旨在生成外延和内涵均有一定规模的强概念;然后根据拟推荐项目的属性来筛选用户合适的社会关系,并结合项目在概念中的流行度实现推荐预测。文中分别在真实数据集和抽样数据集中进行了3个实验。实验1对比了启发式方法和oc运算构造的三元概念数量及其运行时间,其中oc运算构造的概念数量少、耗时长且对推荐的提升效果不明显;实验2对比了推荐效果的精确度、召回率和F1值,揭示了增加条件可以有效提升推荐效果;实验3的结果表明,基于三元概念的推荐算法的推荐效果优于KNN及GRHC。
基于知识表示的联合问答模型
刘小龙, 韩芳, 王直杰
计算机科学. 2021, 48 (6): 241-245.  doi:10.11896/jsjkx.200600011
摘要 ( 327 )   PDF(1516KB) ( 817 )   
参考文献 | 相关文章 | 多维度评价
基于知识库的问答系统旨在通过解析用户的自然语言问句直接在知识库中提取出答案。目前,大多数知识库问答模型都遵循实体检测和关系识别这两个步骤,但是此类方法忽略了知识库本身所蕴含的结构信息以及这两个步骤之间的联系。文中提出了一种基于知识表示的联合问答模型。首先应用知识表示模型将知识库中的实体与关系映射到低维的向量空间,然后通过神经网络将问句也嵌入相同的向量空间,同时检测出问句中的实体,并在此向量空间内度量知识库三元组与问句的语义相似度,从而实现将知识库嵌入和多任务学习引入知识库问答。实验结果表明,所提模型可以极大地提高训练速度,在实体检测和关系识别任务上的准确率达到了主流水平,证明了知识库嵌入及多任务学习可以提升知识库问答任务的性能。
计算机网络
基于随机森林的高性能互连网络阻塞故障检测
徐佳庆, 胡小月, 唐付桥, 王强, 何杰
计算机科学. 2021, 48 (6): 246-252.  doi:10.11896/jsjkx.201200142
摘要 ( 498 )   PDF(2404KB) ( 763 )   
参考文献 | 相关文章 | 多维度评价
高性能互连网络是高性能计算机系统中各节点高速协同并行计算的关键。在高性能互连网络的运维过程中,由链路质量恶化引发的网络端口阻塞故障定位困难,一旦发生网络端口阻塞,轻则会导致网络中的丢包率和端对端延迟升高,重则会造成整个网络的瘫痪,严重影响整个系统的可靠性。随着人工智能时代的到来,智能运维已经在网络运维中发挥了重要作用,但是基于高性能互连网络的智能运维研究相对较少。文中基于运维人员在自研高速互连网络运维中积累的大量数据和丰富经验,提出使用有监督的随机森林方法进行网络阻塞检测,实验结果表明,该方法在保持平均95%的召回率的前提下,平均准确率为93.7%,能够有效地解决网络阻塞的检测问题。
BCube在2-限制连通度下的容错路由算法
易怡, 樊建席, 王岩, 刘钊, 董辉
计算机科学. 2021, 48 (6): 253-260.  doi:10.11896/jsjkx.200900203
摘要 ( 532 )   PDF(1895KB) ( 733 )   
参考文献 | 相关文章 | 多维度评价
BCube是具有良好性能的数据中心网络。相比传统的树形数据中心网络,BCube在扩展和容错性能方面都表现出很大的优势。目前,对于BCube的研究可以归结为对其逻辑图BCn,k(广义超立方体的一种特例)的研究,其中交换机被视为透明设备。在实际应用中,随着网络规模的不断增加,顶点发生故障已经成为一种常态。因此,研究网络的容错路由很有意义。目前,有不少关于BCn,k容错路由的研究,但其2-限制连通度下的容错路由目前还没有被研究。在提出容错路由算法之前,首先证明了BCn,k的2-限制连通度为3(k+1)(n-1)-2n,其中k≥3n≥3。然后在此基础上提出了一个时间复杂度为O(κ(BCn,k)3)的容错路由算法,其中κ(BCn,k)=(k+1)(n-1)BCn,k的连通度。该算法可以在故障顶点个数小于3(k+1)(n-1)-2n且每个无故障顶点至少有两个无故障邻居时找到任意两个不同的无故障顶点之间的一条无故障路径。
带宽和时延受限的流媒体服务器集群负载均衡机制
郑增乾, 王锟, 赵涛, 蒋维, 孟利民
计算机科学. 2021, 48 (6): 261-267.  doi:10.11896/jsjkx.200400131
摘要 ( 287 )   PDF(2135KB) ( 667 )   
参考文献 | 相关文章 | 多维度评价
流媒体服务器集群的整体负载能力很大程度上受其服务时延和带宽负载均衡程度的影响。因此如何提高服务实时性和均衡带宽负载是提升流媒体服务器集群服务能力的关键。为此,提出了一种带宽和时延受限的流媒体服务器集群负载均衡机制。该机制通过将服务器带宽和任务带宽的离散化、区间化,构建服务器与任务状态集,再利用遗传算法离线计算并存储各个状态下的最佳分配方案,使得在有效地将不同带宽需求的任务分配到各个服务器上优化集群负载的同时,加快在线任务分配方案的计算速度,提高时效性。仿真结果显示,该机制能够在拥有与轮询算法、最小连接数算法相似的计算时延的基础上,有效均衡带宽负载,降低失败任务数,从而提升整体服务质量和能力。
基于分簇的拓扑自适应的无人机蜂群OLSR路由协议
孙一凡, 米志超, 王海, 赵宁
计算机科学. 2021, 48 (6): 268-275.  doi:10.11896/jsjkx.200500130
摘要 ( 471 )   PDF(2626KB) ( 1034 )   
参考文献 | 相关文章 | 多维度评价
针对无人机群网络中的路由问题,优化链路状态路由协议采用固定周期的方式通告Hello和拓扑更新(TC)消息,用于维护网络拓扑信息。但是在网络结构频繁变化的情况下,这种周期性的通告不能对网络拓扑变化及时作出响应,网络性能会大幅衰减。文中提出一种新的基于簇群的OLSR路由协议(CB-OLSR),由簇内路由和簇间路由组成,分别采用簇内两跳短距离传输和高性能簇头间远程传输。簇成员不运行完整的路由协议,仅仅完成邻居节点检测,传递Hello消息即可。该协议根据网络拓扑变化情况动态调整Hello等控制消息的广播周期,及时更新网络状况,以提高网络性能,同时对簇内短直连路径进行优化。内部簇成员以及两域相邻簇成员间,如果源节点和目标节点是两跳以内的邻居,则忽略层次结构,使用“旁路捷径”直接转发消息,以减轻簇头的负载,延长簇头寿命。EXata仿真平台上的仿真实验表明,CB-OLSR在数据丢包率和吞吐量等方面明显优于OLSR,更适用于无人机蜂群网络。
面向Docker容器的动态负载算法
刘邦邦, 易国洪, 黄祖源
计算机科学. 2021, 48 (6): 276-281.  doi:10.11896/jsjkx.200500152
摘要 ( 534 )   PDF(1749KB) ( 1111 )   
参考文献 | 相关文章 | 多维度评价
为了提高Docker容器服务器集群的抗并发性和缩短平均响应时间,文中设计了一种动态负载容器服务器的算法DLOAD(Dynamic Loading Algorithm)。该算法在WRR负载算法的基础上引用了实时权值的概念,弥补了WRR算法在权值给定方面的不足,优化了Docker容器服务器的负载算法。DLOAD算法将记录服务器的资源信息,将容器连接数占比、CPU利用率、内存利用率、网络IO占比、磁盘IO占比和平均响应时间作为算法参数,计算出Docker容器服务器的实时权值,并将实时权值记录到负载服务器的权值表中。负载服务器查询权值表后调用WRR算法,推荐最优的Docker容器服务器ID进行负载。通过仿真实验,从Docker容器服务器的平均响应时间和吞吐量这两个方面对改进前后的算法进行分析和对比,得出改进后的DLOAD算法能够更加高效地缩短服务器的平均响应时间和改善抗并发性,有效提升了容器服务器的性能。
复杂网络上的非线性负载容量模型
王学光, 张爱新, 窦炳琳
计算机科学. 2021, 48 (6): 282-287.  doi:10.11896/jsjkx.200700040
摘要 ( 361 )   PDF(2307KB) ( 1171 )   
参考文献 | 相关文章 | 多维度评价
对网络的形成机制、几何性质、演化规律以及网络结构分析、行为预测和控制的研究产生了复杂网络学科,其中关于复杂网络级联失效过程的研究一直受到研究人员的关注。文中提出一种更符合实际网络的两变量非线性负载容量模型来解决复杂网络的级联失效问题。通过在4个不同的网络上进行仿真,验证了所提模型的有效性,发现该模型能够更好地抵御级联失效。实验还发现,所提模型在获得较高鲁棒性的情况下具有更好的性能,且投资成本较小。
基于矩阵论的一致性控制算法收敛速度分析
黄鑫权, 刘爱军, 梁小虎, 王桁
计算机科学. 2021, 48 (6): 288-295.  doi:10.11896/jsjkx.201000137
摘要 ( 548 )   PDF(2195KB) ( 839 )   
参考文献 | 相关文章 | 多维度评价
空中自组网(Flying Ad-Hoc Network,FANET)是支撑无人机集群系统(Unmanned Aerial Vehicle Swarm,UAV swarm)的关键技术,它由数量庞大且具有无线通信能力的小型无人机构成。FANET中的信标帧业务在实现集群一致性控制应用的过程中扮演着重要角色。然而,实际应用中FANET无线链路的不可靠性将会导致信标帧出现丢包现象,进而影响一致性控制算法的收敛速度(或收敛时间),即集群所有状态值趋于一致的快慢程度。从理论上分析一致性控制算法收敛性能与信标帧丢包率之间的解析关系,对一致性控制算法在未来FANET中的应用具有举足轻重的意义。针对上述研究背景,文中提出了一种基于随机有向图模型和矩阵论的收敛性能分析模型。该模型将每个周期内FANET中的信息流抽象为随机有向图,并采用指示矩阵来表示该随机有向图的拉普拉斯矩阵,有效地用矩阵多项式对一致性收敛过程进行建模。随后,基于矩阵运算和矩阵谱半径的相关知识,该模型给出了最终期望收敛值的解析表达式。利用该最终期望收敛值,所提模型定义了新的收敛速度量化方法。与现有收敛速度分析工作不同,文中通过评估所有节点的初始状态值收敛到期望收敛值的快慢来对收敛速度进行量化,而不是根据收敛到每个周期网络的平均状态值来进行量化。基于矩阵运算和矩阵谱半径相关知识,所提模型给出了该收敛速度与信标帧丢包率之间的耦合关系,并根据该耦合关系推导出了收敛时间的表达式。仿真结果表明,所提收敛性能分析模型能够准确地描述实际FANET中收敛速度随时间的变化情况。此外,该模型能够准确描述实际FANET中每条链路的平均丢包率、状态值初始分布以及无人机节点个数的变化趋势对收敛时间的影响。同时,相比现有收敛性能分析模型,所提模型得到的收敛性能曲线更接近实际FANET中的收敛性能曲线。
基于多通道稀疏LSTM的蜂窝流量预测研究
张争万, 吴迪, 张春炯
计算机科学. 2021, 48 (6): 296-300.  doi:10.11896/jsjkx.210400134
摘要 ( 457 )   PDF(2530KB) ( 848 )   
参考文献 | 相关文章 | 多维度评价
下一代蜂窝网络在网络管理和服务供应场景中发挥着重要的作用,对移动网络流量的预测分析正变得越来越重要。文中针对城市蜂窝流量的预测,设计了一个基于多通道稀疏长期短期记忆网络(Long Short-Term Memory,LSTM)的流量预测模型。相对于多层感知器网络或其他神经网络结构,LSTM非常适合处理时间序列数据问题。所设计的多通道方式能够有效捕获多源网络流量信息,其稀疏方式使其自适应地对不同的流量时间节点赋予不同的权重,提高了深度神经网络模型捕捉重要特征的能力。在意大利米兰城市蜂窝流量数据上进行了实验,评估了所提方法对单步和多步预测的性能。实验结果展示出所提方法比基准方法更精准。此外,实验还报告了蜂窝流量中不同持续时间采样设置对LSTM网络模型的可存储长度及预测精度的影响。
信息安全
群智感知中的地理位置本地化差分隐私机制:现状与机遇
王乐业
计算机科学. 2021, 48 (6): 301-305.  doi:10.11896/jsjkx.201200223
摘要 ( 541 )   PDF(1838KB) ( 1216 )   
参考文献 | 相关文章 | 多维度评价
群智感知中,如何保护用户的地理位置隐私是核心问题之一。传统地理位置隐私保护方法通常需要对攻击者的先验知识进行假设,才能保证相应的保护效果。近期,一种新型的地理位置隐私保护机制,即“本地化差分隐私”,被引入群智感知中,对用户的位置隐私进行保护。与传统方法相比,它能够在无需可信第三方的情况下,从理论上提供与攻击者先验知识无关的隐私保护效果。 通过分析现有群智感知研究中与地理位置本地化差分隐私机制相关的工作,提出将地理位置本地化差分隐私机制融入不同群智感知应用的通用流程,并总结了流程中各个技术难点的可能解决方案。同时,指出了群智感知中地理位置本地化差分隐私机制相关研究的未来机遇,期望吸引更多的科研人员关注和投入这一研究方向。
假消息认知机理研究综述
吴广智, 郭斌, 丁亚三, 成家慧, 於志文
计算机科学. 2021, 48 (6): 306-314.  doi:10.11896/jsjkx.201200194
摘要 ( 455 )   PDF(1426KB) ( 1525 )   
参考文献 | 相关文章 | 多维度评价
社交媒体时代的到来在加速信息流动的同时也为假消息的迅速传播提供了温床。假消息可能会对群众的认知产生严重的干扰,致使群众做出错误的决策,从而扰乱社会秩序,干扰政治选举,对社会造成许多负面影响。现有研究缺乏对假消息认知机理的总结归纳,为了探索人在阅读假消息时的心理与神经生理基础,文中对假消息的来源、传播和社会影响进行了更深入的研究,从而为纠正假消息提供指导。文中定义了假消息认知机理,总结了两种研究假消息认知机理的方法:认知实验方法和数据分析方法。认知实验方法分为内部心理状态、外部社会环境、纠正假消息、跨领域认知机理4部分。数据分析方法分为政治类假消息认知机理和非政治类假消息认知机理两部分。最后对未来研究方向提出3点思考,分别是辟谣策略、深度假消息认知机理挖掘和疫情类假消息认知机理研究。
基于R-SIS和R-LWE构建的IBE加密方案
钱心缘, 吴文渊
计算机科学. 2021, 48 (6): 315-323.  doi:10.11896/jsjkx.200700215
摘要 ( 923 )   PDF(1569KB) ( 1057 )   
参考文献 | 相关文章 | 多维度评价
格上基于身份的加密机制(Identity-Based Encryption,IBE)能够有效抵抗量子攻击,并且该机制将每个人的身份信息作为公钥,能够简化公钥基础设施(Public Key Infrastructure,PKI)对海量用户的公钥管理,这种加密机制是对传统PKI的改进,能够解决PKI在物联网环境下暴露的众多问题。然而,目前国内外学者提出的基于格的IBE方案大多比较笨重,并且实现的方案很少。针对上述问题,提出了一种基于R-SIS以及R-LWE困难问题的IND-sID-CPA安全的IBE低膨胀率方案。首先,提出了分块复用技术,通过重用占存储空间较大的辅助解密密文块,极大地降低了密文膨胀率并提高了加密效率。然后,利用了Kyber提出的压缩算法并引入明文扩张参数,对以上两个参数指标进行进一步优化。通过严格的理论推导分析了所提方案的安全性、正确性和计算复杂度,利用数值实验给出了该方案在3种场景下的较优参数取值。最后,通过C++程序实现新方案,对比了所提方案与BFRS18方案在3种场景下的性能。实验结果表明,该方案在保证正确性和安全性的同时,有效提高了原方案的加解密效率,降低了密文膨胀率。
改进的否定选择算法及其在入侵检测中的应用
贾琳, 杨超, 宋玲玲, 程镇, 李琲珺
计算机科学. 2021, 48 (6): 324-331.  doi:10.11896/jsjkx.200400033
摘要 ( 620 )   PDF(2958KB) ( 880 )   
参考文献 | 相关文章 | 多维度评价
否定选择算法(Negative Selection Algorithm,NSA)作为人工免疫系统的典型算法被广泛应用于入侵检测中。针对传统否定选择算法在处理入侵检测问题时出现的准确率低、误报率高以及检测器集合冗余度高等问题,提出了一种改进的否定选择算法并将其应用到入侵检测中。其主要思想是:首先通过密度峰值聚类算法对非自体抗原进行聚类,生成一类已知检测器,该检测器可检测已知入侵行为;然后定义异常点并将其优先作为候选检测器中心,计算和生成未知检测器,该检测器可检测未知入侵行为,以此降低检测器生成的随机性。在实验阶段,选择准确率(Accuracy,AC)和误报率(False Alarm,FA)作为评价指标。分别在KDDCUP99和CSE-CIC-IDS2018数据集上进行了仿真实验,实验结果表明,所提算法在这两种数据集上均有较低的误报率和较高的准确率,这验证了其具有较好的检测效果。
基于主动学习的社交网络恶意用户检测方法
张人之, 朱焱
计算机科学. 2021, 48 (6): 332-337.  doi:10.11896/jsjkx.200700151
摘要 ( 368 )   PDF(1969KB) ( 859 )   
参考文献 | 相关文章 | 多维度评价
社交网络恶意用户检测作为分类任务,需要标注训练样本。但社交网络规模通常较大,标注全部样本的花费巨大。为了能在标注预算有限的情况下找出更值得标注的样本,同时充分利用未标注样本,以此提高对恶意用户的检测表现,提出了一种基于图神经网络GraphSAGE和主动学习的检测方法。该方法分为检测模块和主动学习模块两部分。受Transformer的启发,检测模块改进了GraphSAGE,扁平化其聚合节点各阶次邻居信息的过程,使高阶邻居能直接聚合到中心节点,减少了高阶邻居的信息损失;然后通过集成学习,从不同角度利用提取得到的表征,完成检测任务。主动学习模块根据集成分类的结果衡量未标注样本的价值,在样本标注阶段交替使用检测模块和主动学习模块,指导为样本标注的过程,从而更有助于模型分类的样本标注。实验阶段使用AUROC和AUPR作为评价指标,在真实的大规模社交网络数据集上验证了改进的检测模块的有效性,并分析了改进有效的原因;然后将所提方法与现有的两种同类主动学习方法进行比较,实验结果表明在标注相同数量的训练样本的情况下,所提方法挑选标注的训练样本有更好的分类表现。
基于遗传优化PNN神经网络的网络安全态势评估
王金恒, 单志龙, 谭汉松, 王煜林
计算机科学. 2021, 48 (6): 338-342.  doi:10.11896/jsjkx.201200239
摘要 ( 681 )   PDF(1851KB) ( 774 )   
参考文献 | 相关文章 | 多维度评价
为提高网络安全态势评估的准确率,提出了一种基于遗传优化概率神经网络的网络安全态势评估。首先,在网络安全态势评估建模过程中,根据网络安全态势特点和常见评估等级建立了概率神经网络的网络安全态势评估模型,以便充分挖掘概率神经网络在网络安全态势评估细粒度方面的优势。然后,为了防止因网络安全态势参数细粒度评估而造成收敛速度过慢的情况发生,对概率神经网络的修正因子进行遗传算法优化,并再次进行概率神经网络训练,从而得到稳定的概率网络安全态势评估模型。经过实验证明,相比传统的概率神经网络算法,基于遗传算法优化概率神经网络的网络安全态势评估准确度更高,平均准确率达到90%以上,且训练速度更快。
基于WiFi-CSI的入侵检测方法
王颖颖, 常俊, 武浩, 周详, 彭予
计算机科学. 2021, 48 (6): 343-348.  doi:10.11896/jsjkx.200700006
摘要 ( 687 )   PDF(2139KB) ( 927 )   
参考文献 | 相关文章 | 多维度评价
目前,Wi-Fi已被广泛应用于公共和私人领域,基于无线技术的无设备人体入侵检测在实现资产安全、应急响应和个性化服务等室内服务中有着广泛的应用前景。针对现有方法存在误报和漏报严重、海量信息难以分析、部署麻烦等问题,文中提出了一种基于Wi-Fi 信号的入侵检测方法。首先利用Wi-Fi设备上细粒度的信道状态信息(Channel State Information,CSI)捕捉由人体移动引起的微小变化;其次利用多重信号分类算法(Multiple Signal Classification,MUSIC)采样协方差矩阵特征分解得到的噪声子空间以估计目标到达角度(Angle of Arrival,AOA);最后通过计算人体移动导致的不同路径相位差变化来判断是否有人入侵。与传统方法的区别在于,所提方法将谱峰搜索和相位差相结合,二者优势互补,克服了环境和噪声干扰,解决了多径效应对结果的影响。文中选取两种典型的室内环境——会议室和暗室来测试该方法的有效性。实验结果显示,所提方法在两种室内环境中的平均假阴性(False Negative,FN)和假阳性(False Positive,FP)分别为1.83%和1.4%。此外,文中还评估了所提方法在不同运动模式下的检测性能,平均假阴性和假阳性分别为2.26%和1.46%。与其他方法的对比结果验证了该方法的有效性和稳定性。该方法具有很强的鲁棒性和实用价值,为今后入侵检测技术的发展提供了参考方案。