1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2021年第3期, 刊出日期:2021-03-15
  
目录
目录
计算机科学. 2021, 48 (3): 0-0. 
摘要 ( 197 )   PDF(241KB) ( 480 )    Suppl. Info.
相关文章 | 多维度评价
前言
多媒体技术进展专题前言
计算机科学. 2021, 48 (3): 0-00. 
摘要 ( 171 )   PDF(344KB) ( 472 )    Suppl. Info.
相关文章 | 多维度评价
多媒体技术进展*
端到端优化的图像压缩技术进展
刘东, 王叶斐, 林建平, 马海川, 杨闰宇
计算机科学. 2021, 48 (3): 1-8.  doi:10.11896/jsjkx.201100134
摘要 ( 529 )   PDF(2746KB) ( 1515 )   
参考文献 | 相关文章 | 多维度评价
图像压缩是数据压缩技术在数字图像上的应用,其目的是减少图像数据中的冗余,从而用更加高效的格式存储和传输数据。传统的图像压缩方法中,图像压缩分为预测、变换、量化、熵编码等步骤,每一步均采用人工设计的算法分别进行优化。近年来,基于深度神经网络的端到端图像压缩方法在图像压缩中取得了丰硕的成果,相比传统方法,端到端图像压缩可以进行联合优化,能够取得比传统方法更高的压缩效率。文中首先对端到端图像压缩的方法和网络结构进行了介绍;接着对端到端图像压缩中的关键技术进行了阐述,包括量化技术、概率建模和熵编码技术以及编码端码率分配技术;然后介绍了端到端图像压缩的扩展应用研究,包括可伸缩编码、可变码率压缩、面向视觉感知和机器感知的压缩;最后通过实验对端到端图像压缩方法目前可达到的压缩效率与传统方法进行了对比,展示了其压缩性能。实验结果表明,目前最新的端到端图像压缩方法的压缩效率远高于JPEG,JPEG2000,HEVC intra等传统图像编码方法,相比目前最先进的编码标准VVC intra,在同样的MS-SSIM上节省了高达48.40%的编码码率。
基于深度学习的图像去模糊方法研究进展
潘金山
计算机科学. 2021, 48 (3): 9-13.  doi:10.11896/jsjkx.201200043
摘要 ( 524 )   PDF(1258KB) ( 1760 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着便携、轻巧的数码成像设备的日益普及,人们获取图像的手段日益方便与灵活,数字图像在视频监控、医疗诊断、太空探测等领域起到了重要的作用。然而,在现有的成像过程中存在诸多问题,如相机的感光单元质量差、摄影者专业水平低、拍摄环境恶劣等,往往导致最终得到的图像含有明显的模糊以及噪声。如何使计算机自动地从模糊图像中把清晰的图像恢复出来,从而为其他的图像处理问题以及后续的计算机智能化分析提供高质量的图像,成为了亟待解决的问题。图像去模糊是典型的病态问题,解决该问题的常用方法主要包括基于统计先验建模和数据驱动的方法。然而,传统的统计先验建模的方法对清晰图像特征的刻画能力有限。而数据驱动的方法尤其是以深度学习为代表的方法依靠其强大的特征表示能力,为解决图像去模糊提供了一种新的、有效的方式。文中基于深度学习的图像去模糊方法,概述了目前图像去模糊方法的研究现状,分析了当前方法所面临的问题,并展望了图像去模糊方法的研究趋势。
图像修复研究进展综述
赵露露, 沈玲, 洪日昌
计算机科学. 2021, 48 (3): 14-26.  doi:10.11896/jsjkx.210100048
摘要 ( 711 )   PDF(2724KB) ( 1912 )   
参考文献 | 相关文章 | 多维度评价
图像修复是计算机视觉领域中极具挑战性的研究课题。近年来,深度学习技术的发展推动了图像修复性能的显著提升,使得图像修复这一传统课题再次引起了学者们的广泛关注。文章致力于综述图像修复研究的关键技术。由于深度学习技术在解决“大面积缺失图像修复”问题时具有重要作用并带来了深远影响,文中在简要介绍传统图像修复方法的基础上,重点介绍了基于深度学习的修复模型,主要包括模型分类、优缺点对比、适用范围和在常用数据集上的性能对比等,最后对图像修复潜在的研究方向和发展动态进行了分析和展望。
多媒体模型对抗攻防综述
陈凯, 魏志鹏, 陈静静, 姜育刚
计算机科学. 2021, 48 (3): 27-39.  doi:10.11896/jsjkx.210100079
摘要 ( 168 )   PDF(1638KB) ( 605 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着以深度学习为代表的人工智能技术的快速发展和广泛应用,人工智能正深刻地改变着社会生活的各方面。然而,人工智能模型也容易受到来自精心构造的“对抗样本”的攻击。通过在干净的图像或视频样本上添加微小的人类难以察觉的扰动,就能够生成可以欺骗模型的样本,进而使多媒体模型在推理过程中做出错误决策,为多媒体模型的实际应用部署带来严重的安全威胁。鉴于此,针对多媒体模型的对抗样本生成与防御方法引起了国内外学术界、工业界的广泛关注,并出现了大量的研究成果。文中对多媒体模型对抗攻防领域的进展进行了深入调研,首先介绍了对抗样本生成与防御的基本原理和相关背景知识,然后从图像和视频两个角度回顾了对抗攻防技术在多媒体视觉信息领域的发展历程与最新成果,最后总结了多媒体视觉信息对抗攻防技术目前面临的挑战和有待进一步探索的方向。
视觉目标跟踪十年研究进展
张开华, 樊佳庆, 刘青山
计算机科学. 2021, 48 (3): 40-49.  doi:10.11896/jsjkx.201100186
摘要 ( 358 )   PDF(2602KB) ( 799 )   
参考文献 | 相关文章 | 多维度评价
视觉目标跟踪指在一个视频序列中,给定第一帧目标区域,在后续帧中自动匹配到该目标区域的任务。通常来说,由于场景遮挡、光照变化、物体本身形变等复杂因素,目标与场景的表观会发生剧烈的变化,这使得跟踪任务本身面临极大的挑战。在过去的十年中,随着深度学习在计算机视觉领域的广泛应用,目标跟踪领域也迅速发展,研究人员提出了一系列优秀算法。鉴于该领域处于快速发展的阶段,文中对视觉目标跟踪研究进行了综述,内容主要包括跟踪的基本框架改进、目标表示改进、空间上下文改进、时序上下文改进、数据集和评价指标改进等;另外,还综合分析了这些改进方法各自的优缺点,并提出了可能的未来的研究趋势。
视频人脸识别进展综述
白子轶, 毛懿荣, 王瑞平
计算机科学. 2021, 48 (3): 50-59.  doi:10.11896/jsjkx.210100210
摘要 ( 306 )   PDF(2916KB) ( 856 )   
参考文献 | 相关文章 | 多维度评价
人脸识别是生物特征识别领域的一项关键技术,长期以来得到研究者的广泛关注。视频人脸识别任务特指从一段视频中提取出人脸的关键信息,从而完成身份识别。相较于基于图像的人脸识别任务来说,视频数据中的人脸变化模式更为多样且视频帧之间存在较大差异,如何从冗长而复杂的视频中抽取到人脸的关键特征成为当前的研究重点。以视频人脸识别技术为研究对象,首先介绍了该技术的研究价值和存在的挑战;接着对当前研究工作的发展脉络进行了系统的梳理,依据建模方式将传统基于图像集合建模的方法分为线性子空间建模、仿射子空间建模、非线性流形建模、统计建模四大类,同时对深度学习背景下基于图像融合的方法进行了介绍;另外对现有视频人脸识别数据集进行分类整理并简要介绍了常用的评价指标;最后分别采用灰度特征和深度特征在YTC数据集及IJB-A数据集上对代表性工作进行评测。实验结果表明:神经网络可以从大规模数据中提取到鲁棒的视频帧特征,从而带来识别性能的大幅提升,而有效的视频数据建模能够挖掘出人脸潜在的变化模式,从视频序列包含的大量样本中找到更具判别力的关键信息,排除噪声样本的干扰,因此基于视频的人脸识别具有广泛的通用性和实用价值。
手语识别、翻译与生成综述
郭丹, 唐申庚, 洪日昌, 汪萌
计算机科学. 2021, 48 (3): 60-70.  doi:10.11896/jsjkx.210100227
摘要 ( 494 )   PDF(2250KB) ( 1101 )   
参考文献 | 相关文章 | 多维度评价
手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连续手语翻译和手语视频生成。手语识别与翻译旨在将手语视频转换成文本词汇或语句,而手语生成是根据口语或文本语句合成手语视频。换言之,手语识别翻译与手语生成可视为互逆过程。文中综述了手语研究的最新进展,介绍了研究的背景现状和面临的挑战;回顾了手语识别、翻译和生成任务的典型方法和前沿研究;并结合当前方法中存在的问题,对手语研究的未来发展方向进行了展望。
基于视觉和语言的跨媒体问答与推理研究综述
武阿明, 姜品, 韩亚洪
计算机科学. 2021, 48 (3): 71-78.  doi:10.11896/jsjkx.201100176
摘要 ( 248 )   PDF(1726KB) ( 623 )   
参考文献 | 相关文章 | 多维度评价
基于视觉和语言的跨媒体问答与推理是人工智能领域的研究热点之一,其目的是基于给定的视觉内容和相关问题,模型能够返回正确的答案。随着深度学习的飞速发展及其在计算机视觉和自然语言处理领域的广泛应用,基于视觉和语言的跨媒体问答与推理也取得了较快的发展。文中首先系统地梳理了当前基于视觉和语言的跨媒体问答与推理的相关工作,具体介绍了基于图像的视觉问答与推理、基于视频的视觉问答与推理以及基于视觉常识推理模型与算法的研究进展,并将基于图像的视觉问答与推理细分为基于多模态融合、基于注意力机制和基于推理3类,将基于视觉常识推理细分为基于推理和基于预训练2类;然后总结了目前常用的问答与推理数据集,以及代表性的问答与推理模型在这些数据集上的实验结果;最后展望了基于视觉和语言的跨媒体问答与推理的未来发展方向。
跨媒体分析与推理技术研究综述
王树徽, 闫旭, 黄庆明
计算机科学. 2021, 48 (3): 79-86.  doi:10.11896/jsjkx.210200086
摘要 ( 224 )   PDF(2405KB) ( 1112 )   
参考文献 | 相关文章 | 多维度评价
当前,以网络数据为代表的跨媒体数据呈现爆炸式增长的趋势,呈现出了跨模态、跨数据源的复杂关联及动态演化特性,跨媒体分析与推理技术针对多模态信息理解、交互、内容管理等需求,通过构建跨模态、跨平台的语义贯通与统一表征机制,进一步实现分析和推理以及对复杂认知目标的不断逼近,建立语义层级的逻辑推理机制,最终实现跨媒体类人智能推理。文中对跨媒体分析推理技术的研究背景和发展历史进行概述,归纳总结视觉-语言关联等任务的关键技术,并对研究应用进行举例。基于已有结论,分析目前跨媒体分析领域所面临的关键问题,最后探讨未来的发展趋势。
视觉问答与对话综述
牛玉磊, 张含望
计算机科学. 2021, 48 (3): 87-96.  doi:10.11896/jsjkx.201200174
摘要 ( 513 )   PDF(1426KB) ( 700 )   
参考文献 | 相关文章 | 多维度评价
视觉问答与对话是人工智能领域的重要研究任务,是计算机视觉与自然语言处理交叉领域的代表性问题之一。视觉问答与对话任务要求机器根据指定的视觉图像内容,对单轮或多轮的自然语言问题进行作答。视觉问答与对话对机器的感知能力、认知能力和推理能力均提出了较高的要求,在跨模态人机交互应用中具有实用前景。文中对近年来视觉问答与对话的研究进展进行了综述,对数据集和算法进行了归纳,对研究挑战和问题进行了总结,最后对视觉问答与对话的未来发展趋势进行了讨论。
多媒体社会事件分析综述
钱胜胜, 张天柱, 徐常胜
计算机科学. 2021, 48 (3): 97-112.  doi:10.11896/jsjkx.210200023
摘要 ( 189 )   PDF(3323KB) ( 444 )   
参考文献 | 相关文章 | 多维度评价
由于网络技术的飞速发展,自媒体、微博、论坛等基于互联网的多种交流渠道日渐完善,人们能够方便地在线生成和共享丰富的社会多媒体内容。社会事件数据具有跨平台、多模态、大规模、噪声大等特点,基于多媒体社会事件的分析研究非常具有挑战性。因此,如何对社会媒体数据进行处理,研究社会事件分析方法、设计有效的社会事件分析模型成为社会事件分析研究的关键问题。文中对近年来多媒体社会事件分析的相关研究展开了综述,重点回顾了多媒体社会事件表示方法及其在虚假新闻检测、多媒体热点事件检测跟踪及演化分析、社交媒体危机事件响应等领域的应用,并对不同应用涉及的数据集进行了详细介绍。最后对多媒体社会事件分析方面未来可能的研究课题进行了展望。
数据库&大数据&数据科学
面向协同过滤推荐的新型混合评分函数
肖诗涛, 邵蓥侠, 宋卫平, 崔斌
计算机科学. 2021, 48 (3): 113-118.  doi:10.11896/jsjkx.200900067
摘要 ( 163 )   PDF(2279KB) ( 407 )   
参考文献 | 相关文章 | 多维度评价
协同过滤技术在现代推荐系统中得到了广泛的应用,其基本思想是相似的用户会喜欢相似的物品。评分函数(Score Function,SF)是协同过滤推荐模型的一个关键技术,用于评估用户对物品的喜好程度。然而,目前常用的评分函数存在如下缺陷,即内积评分函数难以有效捕捉用户与用户以及物品与物品的相似度,而欧几里德距离度量函数由于几何空间限制降低了模型的表达能力。文中提出了一种融合内积相似度和欧几里德距离度量的新颖的混合评分函数,并从理论上分析了此混合评分函数的性质,证明它能有效弥补现有评分函数的不足。此外,新的混合评分函数是一项通用技术,适用于诸多现有的推荐模型(如SVD++,MF,NGCF,CML等),能够提高模型的推荐质量。最后,在6个公开数据集上进行了大量实验,验证了新混合评分函数的优越性能。
基于Web的数据可视化图表渲染优化方法
鄂海红, 张田宇, 宋美娜
计算机科学. 2021, 48 (3): 119-123.  doi:10.11896/jsjkx.200600038
摘要 ( 159 )   PDF(1943KB) ( 551 )   
参考文献 | 相关文章 | 多维度评价
在数据可视化场景中,Web页面作为数据可视化图表的承载主体,其性能的好坏直接影响可视化图表的加载速度和渲染效果,而目前基于Web技术的优化手段不能很好地缓解图表获取大规模复杂数据并进行渲染重绘所造成的网络数据传输压力。针对上述问题,提出了一种基于Web的数据可视化图表渲染方法。首先,将缓存机制与增量更新算法相融合,并从图表样式及交互配置信息和图表绑定数据两个方面对HTTP请求响应体进行深度优化。然后,通过减小HTTP请求响应体的大小来降低网络数据传输量,缩短数据资源的下载时间,进而提升图表加载速度,缩短页面渲染时长。最后,针对该方法进行充分的对比实验,实验结果表明,单个图表HTTP的总响应时间由75 ms缩短至28 ms,Web页面展示多个图表的总渲染时长由1 546 ms缩短至1 337 ms,从而验证了该方法的有效性。
基于光滑表示的半监督分类算法
王省, 康昭
计算机科学. 2021, 48 (3): 124-129.  doi:10.11896/jsjkx.200700078
摘要 ( 174 )   PDF(2389KB) ( 337 )   
参考文献 | 相关文章 | 多维度评价
近年来,基于图的半监督分类是机器学习与数据挖掘领域的研究热点之一。该类方法一般通过构造图来挖掘数据中隐含的信息,并利用图的结构信息来对无标签样本进行分类。因此,半监督分类的效果严重依赖于图的质量。文中提出了一种基于光滑表示的半监督分类算法。具体来说,此方法通过应用一个低通滤波器来实现数据的平滑,然后将光滑数据用于半监督分类。此外,所提方法将常见的图构造和标签传播集成到一个统一的优化框架中,使它们互相促进,从而避免低质量图导致的次优解。对人脸和物品数据集进行大量实验,结果表明,所提SRSSC算法在大部分情况下都优于其他算法,从而证明了光滑表示的重要性。
NVRC:一种面向NVM的写限制日志方案
范鹏浩, 黄国锐, 金培权
计算机科学. 2021, 48 (3): 130-135.  doi:10.11896/jsjkx.200900071
摘要 ( 90 )   PDF(1557KB) ( 284 )   
参考文献 | 相关文章 | 多维度评价
非易失性内存(Non-Volatile Memory,NVM)具有支持按字节寻址、持久性、存储密度高、读写延迟低等特点,因此成为解决DRAM(Dynamic Random Access Memory)容量有限问题的首选技术。随着数据库系统中NVM的引入,传统的日志技术需要考虑如何适应NVM特性。首先总结了已有的面向NVM的日志技术研究,进而提出了一种尽可能限制NVM写操作的数据库日志方案NVRC(Non-Volatile Record-updating with Cacheline)。文中提出了结合异地更新和原地更新的日志管理方案。具体而言,NVRC在异地更新的“影子记录”的基础上,引入了“缓存行原地更新”策略,并通过代价分析选择合理的日志更新策略,从而减少对NVM的写操作。采用DRAM模拟NVM的方式在YCSB测试负载上进行了实验,并对比了NVRC与传统的WAL(Write Ahead Log)以及NVM感知的PCMLx(PCMLoggingx)方法。结果表明,NVRC的NVM写次数在修改均匀的情况下比WAL和PCMLx分别减少了54%和17%,同时更新性能分别提升了59%和10%。
带权图的多重分形度量
刘胜久, 李天瑞, 谢鹏, 刘佳
计算机科学. 2021, 48 (3): 136-143.  doi:10.11896/jsjkx.200700159
摘要 ( 103 )   PDF(1425KB) ( 269 )   
参考文献 | 相关文章 | 多维度评价
分形维数及多重分形是分形理论的重要研究内容。复杂网络的多重分形已经得到了较为深入的研究,但对复杂网络多重分形的度量目前并没有可行的方法。带权图是复杂网络研究的重要对象,其中的节点权重及边权重可以为正实数、负实数、纯虚数及复数等多种不同的类型。除节点权重及边权重均为正实数的情形外,其他类型的带权图都具有多重分形特性,且均具有无穷多个复数形式的网络维数。通过对带权图多重分形的研究,文中给出了15种具有多重分形特性的带权图多重分形维数的模所构成的集合,并采用集合的势对带权图的多重分形特性进行度量。研究表明,15种带权图多重分形维数的模所构成的集合均是可数集,其中有2种集合是2重集合,另外13种集合是通常意义上的集合,而且所有的集合均是等势的,其势均为0
基于演化博弈的数据收益权分配机制设计
商希雪, 韩海庭, 朱郑州
计算机科学. 2021, 48 (3): 144-150.  doi:10.11896/jsjkx.201100056
摘要 ( 146 )   PDF(2195KB) ( 370 )   
参考文献 | 相关文章 | 多维度评价
针对数据要素市场化过程中面临的数据难以完全交割、数据产权公平划分困难、个人与企业博弈中企业占优等问题,文中首先提出了数据收益权概念,以摆脱传统产权概念的束缚,进而使数据交易制度更好地适应数据市场的一般特点;然后引用经济学的演化博弈分析,将数据收益的直接分配问题转化为理性的个人和企业相互试错,发掘不同条件下的趋近于收敛的群体优势策略,实现了分配的公平性和“卡尔多-希克斯效率”;最后引入法学中权利权衡的比例原则,使司法审判可计算、可编程、可调控。算法分析和仿真实验证明,在现实条件下,该博弈框架能良好地实现市场均衡,并发现不同Wij条件下均衡的收敛特征和收敛速度,为司法实践提供了重要的量化分析工具,是计算法学的重要实践。
基于自然最近邻的密度峰值聚类算法
汤鑫瑶, 张正军, 储杰, 严涛
计算机科学. 2021, 48 (3): 151-157.  doi:10.11896/jsjkx.200100112
摘要 ( 239 )   PDF(2581KB) ( 350 )   
参考文献 | 相关文章 | 多维度评价
针对密度峰值聚类算法(Density Peaks Clustering,DPC)需要人为指定截断距离dc,以及局部密度定义简单和一步分配策略导致算法在复杂数据集上表现不佳的问题,提出了一种基于自然最近邻的密度峰值聚类算法(Density Peaks Clustering based on Natural Nearest Neighbor,NNN-DPC)。该算法无需指定任何参数,是一种非参数的聚类方法。该算法首先根据自然最近邻的定义,给出新的局部密度计算方法来描述数据的分布,揭示内在的联系;然后设计了两步分配策略来进行样本点的划分。最后定义了簇间相似度并提出了新的簇合并规则进行簇的合并,从而得到最终聚类结果。实验结果表明,在无需参数的情况下,NNN-DPC算法在各类数据集上都有优秀的泛化能力,对于流形数据或簇间密度差异大的数据能更加准确地识别聚类数目和分配样本点。与DPC、FKNN-DPC(Fuzzy Weighted K-nearest Density Peak Clustering)以及其他3种经典聚类算法的性能指标相比,NNN-DPC算法更具优势。
基于改进AdaBoost算法的复杂网络链路预测
龚追飞, 魏传佳
计算机科学. 2021, 48 (3): 158-162.  doi:10.11896/jsjkx.200600075
摘要 ( 136 )   PDF(1798KB) ( 309 )   
参考文献 | 相关文章 | 多维度评价
链路预测是复杂网络的重要研究方向,当前的链路预测算法因可利用的网络信息有限,导致预测算法的精确度受限。为了提高预测算法的性能,采用改进的AdaBoost算法进行链路预测。首先根据复杂网络样本建立邻接矩阵,完成样本的矩阵化处理;然后采用AdaBoost算法进行分类训练,通过权重投票获取预测结果;最后,考虑到复杂网络弱分类器预测正负误差分布的不均衡问题,设置权重调整因子η及其调整范围[η12],并根据η值动态调整AdaBoost算法的多个弱分类器分类结果的权重,从而获得准确的链路预测结果。实验结果证明,相比其他常用网络链路预测算法及传统AdaBoost算法,改进的AdaBoost算法的预测准确率优势明显,且在节点数量较多时,其预测时间性能和其他算法的差距较小。
基于等价关系的最小乐观概念格生成算法
温馨, 闫心怡, 陈泽华
计算机科学. 2021, 48 (3): 163-167.  doi:10.11896/jsjkx.200100046
摘要 ( 88 )   PDF(1950KB) ( 198 )   
参考文献 | 相关文章 | 多维度评价
决策信息系统的规则提取是数据挖掘的研究内容之一,概念格理论与粒计算理论是该领域研究的主要数学工具。文中通过探究这两大理论间的关系,利用等价关系定义了最小乐观概念格及其结构,最小乐观概念区别于传统经典概念,但是具有格的结构。在此基础上,提出了一种决策信息系统的规则提取算法,该算法引入了粒度思想,通过求取每一粒层中的最小乐观概念,并根据最小乐观概念的外延与决策属性等价类间的蕴含关系进行决策规则提取,通过设置算法的终止条件来加快其收敛速度,以达到针对决策信息系统知识约简的目的。最小乐观概念的定义比经典概念的定义更宽泛,其生成过程也更简单。最后,通过理论证明、实例验证以及数值实验对比验证了该方法的正确性与优越性。
基于多上下文信息的协同过滤推荐算法
郝志峰, 廖祥财, 温雯, 蔡瑞初
计算机科学. 2021, 48 (3): 168-173.  doi:10.11896/jsjkx.200700101
摘要 ( 167 )   PDF(1413KB) ( 426 )   
参考文献 | 相关文章 | 多维度评价
随着电子商务和互联网的发展,数据信息呈爆炸式增长,协同过滤算法作为一种简单而高效的推荐算法,能在一定程度上有效地解决信息爆炸问题。但是传统协同过滤算法仅通过单一评分来挖掘相似用户,推荐效果并不占优势。为了提高个性化推荐的质量,如何充分利用用户(物品)的文本、图片、标签等上下文信息以使数据价值最大化是当前推荐系统亟待解决的问题。对此,提出了一种融合多种类型上下文信息的协同过滤算法。以用户商品交互信息为二部图,根据不同类型上下文的特点构建不同的相似度网络,设计目标函数在多种上下文信息网络的约束下联合矩阵分解,并学得用户商品的表示学习。在多个数据集上进行了充分实验,结果表明,融合多种类型上下文信息的协同过滤算法不仅能有效提高推荐的准确度,而且能在一定程度上解决数据稀疏性问题。
基于关系图谱的科技数据分析算法
张寒烁, 杨冬菊
计算机科学. 2021, 48 (3): 174-179.  doi:10.11896/jsjkx.191200154
摘要 ( 135 )   PDF(2137KB) ( 344 )   
参考文献 | 相关文章 | 多维度评价
随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据。对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务。由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中引入了关系图谱进行数据处理。首先,提出了一种基于词频的实体搜索与定位算法来提取实体和关系,并构建关系图谱;其次,对关系图谱进行分析,提出了一种基于改进FP-growth的图数据频繁项挖掘算法;然后,设计了基于图数据的数据筛选流程,进行数据的筛选、分析,并定义评分矩阵,对待筛选数据情况进行评价,最终给出分析意见,且数据筛选的评价标准可以进行自定义;最后,结合构建的关系图谱,将算法进行了实际应用,并将其封装为服务。实验结果表明,提出的基于改进FP-growth的频繁项挖掘算法相比传统FP-growth算法在时间上有10%~12%的提升,数据筛选过程的准确率达到97%左右。
人工智能
无模型强化学习研究综述
秦智慧, 李宁, 刘晓彤, 刘秀磊, 佟强, 刘旭红
计算机科学. 2021, 48 (3): 180-187.  doi:10.11896/jsjkx.200700217
摘要 ( 289 )   PDF(1789KB) ( 1215 )   
参考文献 | 相关文章 | 多维度评价
强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算法分为模型化强化学习(Model-based Reinforcement Lear-ning)和无模型强化学习(Model-free Reinforcement Learning)。模型化强化学习需要根据真实环境的状态转移数据来预定义环境动态模型,随后在通过环境动态模型进行策略学习的过程中无须再与环境进行交互。在无模型强化学习中,智能体通过与环境进行实时交互来学习最优策略,该方法在实际任务中具有更好的通用性,因此应用范围更广。文中对无模型强化学习的最新研究进展与发展动态进行了综述。首先介绍了强化学习、模型化强化学习和无模型强化学习的基础理论;然后基于价值函数和策略函数归纳总结了无模型强化学习的经典算法及各自的优缺点;最后概述了无模型强化学习在游戏AI、化学材料设计、自然语言处理和机器人控制领域的最新研究现状,并对无模型强化学习的未来发展趋势进行了展望。
基于LSTM-Attention的RFID移动对象位置预测
刘嘉琛, 秦小麟, 朱润泽
计算机科学. 2021, 48 (3): 188-195.  doi:10.11896/jsjkx.200600134
摘要 ( 166 )   PDF(2019KB) ( 448 )   
参考文献 | 相关文章 | 多维度评价
随着射频识别(RFID)技术的不断发展,其相比全球定位系统(GPS)具有高精度、数据信息量大的优势,将其应用于智能交通以预测移动对象位置受到广泛关注。然而,由于其定位基站分布离散,并且不同基站对位置预测的影响权重不同,以及长期的历史信息会来带维数灾难等,移动对象的位置预测面临着严峻的挑战。针对这些挑战,在分析现有预测算法的不足的基础上,提出了一种长短期记忆网络(LSTM)和注意力(Attention)机制相结合的机器学习模型(LSTM-Attention)。该算法将one-hot编码后的输入向量通过神经网络进行降维处理后,利用注意力机制来发掘不同的定位基站对位置预测的权重影响,最后进行位置预测。在南京交管局提供的RFID数据集上进行的对比实验表明,与现有算法相比,所提算法在预测准确性上有明显的提升。
实时低功耗飞行器神经网络
张英, 陶磊岩, 曹健, 王世会, 赵茜, 张兴
计算机科学. 2021, 48 (3): 196-200.  doi:10.11896/jsjkx.191200142
摘要 ( 84 )   PDF(1695KB) ( 240 )   
参考文献 | 相关文章 | 多维度评价
为了满足飞行器实时飞行过程中对大量异构输入数据的信息处理需求,文中提出了一种神经网络,其包括卷积定点滑动核、池化压缩量化核以及全连接压缩融合核,将飞行器异构传感器多路并行数据作为系统的输入,将辨识结果作为系统的输出。卷积滑动窗口核通过排除冗余数据的滑动窗快速实现数据特征的提取;池化压缩量化核使用压缩量化技术来提高系统的执行效率;全连接压缩融合核经删减量化后压缩融合并输出。该设计满足了飞行器对高可靠性、低功耗的在线智能集成需求。使用所提压缩量化方法,准确率最高可达98.54%,压缩率为77.8%,运行速度提升了40倍。
基于KNN与矩阵变换的图节点嵌入归纳式学习算法
贺苗苗, 郭卫斌
计算机科学. 2021, 48 (3): 201-205.  doi:10.11896/jsjkx.191200156
摘要 ( 135 )   PDF(1431KB) ( 311 )   
参考文献 | 相关文章 | 多维度评价
图节点的低维嵌入在各种预测任务中是非常有用的,如蛋白质功能预测、内容推荐等。然而,多数方法不能自然推广到不可见节点。图采样聚合算法(Graph Sample and Aggregate,Graphsage)虽然可以提高不可见节点生成嵌入的速度,但容易引入噪声数据,且生成的节点嵌入的表示能力不高。为此,文中提出了一种基于KNN与矩阵变换的图节点嵌入归纳式学习算法。首先,通过KNN选取K个邻节点;然后,根据聚合函数生成聚合信息;最后,利用矩阵变换与全连接层对聚合信息和节点信息进行计算,得到新的节点嵌入。为了有效权衡计算时间与性能,文中提出一种新的聚合函数,对邻节点特征运用最大池化作为聚合信息输出,以更多地保留邻节点信息,降低计算代价。在reddit和PPI 两个数据集上的实验表明,所提算法在micro-f1和macro-f1两个评价指标上分别获得了4.995%与10.515%的提升。因此,该算法可以大幅减少噪声数据,提高节点嵌入的表示能力,快速有效地为不可见节点及不可见图生成节点嵌入。
基于聚类与特征融合的蛋白质亚细胞定位预测
王艺皓, 丁洪伟, 李波, 保利勇, 张颖婕
计算机科学. 2021, 48 (3): 206-213.  doi:10.11896/jsjkx.200200081
摘要 ( 105 )   PDF(2093KB) ( 339 )   
参考文献 | 相关文章 | 多维度评价
蛋白质亚细胞的定位预测不仅是研究蛋白质结构和功能的重要基础,还对了解某些疾病的发病机理、药物设计与发现具有重要意义。然而,如何利用机器学习精准预测蛋白质亚细胞的位置一直是一项具有挑战性的科学难题。针对这一问题,提出了一种基于聚类与特征融合的蛋白质亚细胞定位方法。首先将自相关系数法和熵密度法引入蛋白质特征表达模型的构建,并在传统的PseAAC(Pseudo-amino Acid Composition)的基础上提出了一种改进型PseAAC方法。为了更好地表达蛋白质序列信息,文中首先将自相关系数法、熵密度法和改进型PseAAC进行融合,构造了一种全新的蛋白质序列表征模型;然后利用主成分分析法对融合后的特征向量进行降维,将结果输入到LibD3C集成分类器,对蛋白质亚细胞进行分类预测,并采用留一法在Gram-positive和Gram-negative数据集上进行交叉检验;最后将取得的实验结果与其他现有算法进行比较。实验结果表明,所提方法在Gram-positive和Gram-negative数据集上分别取得了99.24%和95.33%的预测准确率,说明所提方法具有科学性和有效性。
基于加权样本和共识率的标记传播算法
储杰, 张正军, 汤鑫瑶, 黄振生
计算机科学. 2021, 48 (3): 214-219.  doi:10.11896/jsjkx.191200103
摘要 ( 71 )   PDF(1696KB) ( 229 )   
参考文献 | 相关文章 | 多维度评价
标记传播是使用最广泛的半监督分类方法之一。基于共识率的标记传播算法(Consensus Rate-based Label Propagation,CRLP)通过汇总多个聚类方法以合并数据各种属性得到的共识率来构造图。然而,CRLP算法与大多数基于图的半监督分类方法一样,在图中将每个标记样本视为同等重要,它们主要通过优化图的结构来提高算法的性能。事实上,样本不一定是均匀分布的,不同的样本在算法中的重要性也是不同的,并且CRLP算法容易受聚类数目和聚类方法的影响,对低维数据的适应性不足。针对这些问题,文中提出了一种基于加权样本和共识率的标记传播算法(Label Propagation Algorithm Based on Weighted Samples and Consensus-Rate,WSCRLP)。WSCRLP算法首先对数据集进行多次聚类,以探索样本的结构,并结合共识率和样本的局部信息构造图;然后为不同分布的标记样本分配不同的权重;最后基于构造的图和加权样本进行半监督分类。在真实数据集上的实验表明,WSCRLP算法对标记样本进行加权和构造图的方法可以显著提高分类准确率,在84%的实验中都优于对比方法。相比CRLP算法,WSCRLP算法不仅具有更好的性能,而且对输入参数具有鲁棒性。
面向铁路文本分类的字符级特征提取方法
鲁博仁, 胡世哲, 娄铮铮, 叶阳东
计算机科学. 2021, 48 (3): 220-226.  doi:10.11896/jsjkx.200200061
摘要 ( 156 )   PDF(2659KB) ( 340 )   
参考文献 | 相关文章 | 多维度评价
铁路文本分类对于我国铁路事业的发展具有重要的实用意义。现有的中文文本特征提取方法依赖于事先对文本的分词处理,然而面向铁路文本数据进行分词的准确率不高,导致铁路文本的特征提取存在语义理解不充分、特征获取不全面等局限性。针对以上问题,提出了一种字符级特征提取方法CLW2V(Character Level-Word2Vec),有效地解决了铁路文本中专业词汇丰富且复杂度高所导致的问题。与基于词汇特征的TF-IDF和Word2Vec方法相比,基于字符特征的CLW2V方法能够提取更为精细的文本特征,解决了传统方法依赖事先分词而导致的特征提取效果不佳的问题。在铁路安监发牌数据集上进行的实验验证表明,面向铁路文本分类的CLW2V特征提取方法优于传统的依赖分词的TF-IDF和Word2Vec方法。
基于过程监督的序列多任务法律判决预测方法
张春云, 曲浩, 崔超然, 孙皓亮, 尹义龙
计算机科学. 2021, 48 (3): 227-232.  doi:10.11896/jsjkx.200700056
摘要 ( 102 )   PDF(1740KB) ( 336 )   
参考文献 | 相关文章 | 多维度评价
法律判决预测是人工智能技术在法律领域的应用,因此对法律判决预测方法的研究对于实现智慧司法具有重要的理论价值和实际意义。传统的法律判决预测方法大都是只进行单一任务的预测或仅基于参数共享的多任务预测,并未考虑各子任务之间的序列依存关系,因此预测性能难以得到进一步的提升。文中提出了一个端到端的基于过程监督的序列多任务法律判决预测模型,在建模各子任务之间的依存关系时,通过引入过程监督来确保依赖信息的准确性,从而提升序列子任务的预测性能。将所提模型应用到CAIL2018数据集上,取得了较好的分类效果,平均分类准确率比现有的state-of-the-art方法的准确率提升了2%。
基于上下文相关字向量的中文命名实体识别
张栋, 陈文亮
计算机科学. 2021, 48 (3): 233-238.  doi:10.11896/jsjkx.191200074
摘要 ( 136 )   PDF(1502KB) ( 447 )   
参考文献 | 相关文章 | 多维度评价
命名实体识别(NER)旨在识别出文本中的专有名词,并对其进行分类。由于用于监督学习的训练数据通常由人工标注,耗时耗力,因此很难得到大规模的标注数据。为解决中文命名实体识别任务中因缺乏大规模标注语料而造成的数据稀缺问题,以及传统字向量不能解决的一字多义问题,文中使用在大规模无监督数据上预训练的基于上下文相关的字向量,即利用语言模型生成上下文相关字向量以改进中文NER模型的性能。同时,为解决命名实体识别中的未登录词问题,文中提出了基于字语言模型的中文NER系统。把语言模型学习到的字向量作为NER模型的输入,使得同一中文汉字在不同语境中有不同的表示。文中在6个中文NER数据集上进行了实验。实验结果表明,基于上下文相关的字向量可以很好地提升NER模型的性能,其平均性能F1值提升了4.95%。对实验结果进行进一步分析发现,新系统在OOV实体识别上也可以取得很好的效果,同时对一些特殊类型的中文实体识别也有不错的表现。
多约束条件下生产排程智能优化技术
周秋艳, 肖满生, 张龙信, 张晓丽, 杨文理
计算机科学. 2021, 48 (3): 239-245.  doi:10.11896/jsjkx.200300105
摘要 ( 56 )   PDF(2691KB) ( 603 )   
参考文献 | 相关文章 | 多维度评价
针对当前企业智能化生产中,多条工艺路线共享工序以及工单在生产过程中具有多个约束条件(如工期、优先级、产量等)的问题,提出了一种以“等待时间最短”为主的生产排程智能优化算法。综合考虑工单优先级、工期长短和紧急任务插单等因素,通过一种递归算法来计算工单等待时间,以最小化工单完成时间、最大化资源利用率为优化目标,建立了多约束条件下紧急工单处理的快速响应机制。在服装加工企业中的实际应用表明,相比手工排程及其他传统算法,文中提出的优化排程算法不仅缩短了生产周期,力求各工序的负荷率最大化,使企业的生产效率提高了20%及以上,同时还改善了排程系统的稳定性。
计算机网络
可重构数据中心网络研究综述
张登科, 王兴伟, 何强, 曾荣飞, 易波
计算机科学. 2021, 48 (3): 246-258.  doi:10.11896/jsjkx.201100038
摘要 ( 171 )   PDF(4332KB) ( 384 )   
参考文献 | 相关文章 | 多维度评价
超大规模数据中心成为数字社会的关键基础设施。用户端应用的激增使得数据中心网络(Data Center Networks,DCNs)的东西向流量呈指数级增长,同时端应用的多样化也导致了严重的流量倾斜问题。此外,后摩尔时代的到来和Dennard缩放的失效使得数据中心网络设备容量的增速趋缓。数据中心网络面临用户激增、流量倾斜和CMOS性能墙等多重压力。为解决上述问题,可重构数据中心网络(Reconfigurable Data Center Networks,RDCNs)应运而生。文中首先介绍RDCNs的5个研究驱动力,重点概述了两类物理层使能技术;其次,详细阐述RDCNs研究分类和链路重构、层重构以及拓扑重构这三大设计空间关键技术的研究现状;然后,简述RDCNs理论的研究进展;最后,展望未来研究方向并总结全文。
云边协同综述
陈玉平, 刘波, 林伟伟, 程慧雯
计算机科学. 2021, 48 (3): 259-268.  doi:10.11896/jsjkx.201000109
摘要 ( 379 )   PDF(1593KB) ( 2150 )   
参考文献 | 相关文章 | 多维度评价
在物联网、大流量等场景下,传统的云计算具有强大的资源服务能力的优点和远距离传输的缺点,而新兴的边缘计算具有低传输时延的优点和资源受限的缺点,因此,结合了云计算与边缘计算优点的云边协同引起了研究者的广泛关注。在全面调查和分析云边协同相关文献的基础上,文中重点分析和讨论了资源协同、数据协同、智能协同、业务编排协同、应用管理协同和服务协同等协同技术的实现原理和研究思路与进展。然后分别从云端和边缘端深入分析了各种协同技术在协同中所起的作用以及具体的使用方法,并从时延、能耗以及其他性能指标方面对结果进行了对比分析。最后指出了云边协同目前存在的挑战和未来的发展方向。本综述有望为云边协同的研究提供有益的参考。
NOMA系统异构网络中联合用户关联和功率控制协同优化
程云飞, 田红心, 刘祖军
计算机科学. 2021, 48 (3): 269-274.  doi:10.11896/jsjkx.191100213
摘要 ( 72 )   PDF(2278KB) ( 201 )   
参考文献 | 相关文章 | 多维度评价
针对非正交多址接入(Non-Orthogonal Multiple Access,NOMA)系统的两层异构网络,提出了基于效用函数最大化模型的用户关联与功率控制协同优化问题。在该问题中将系统总能效作为效用函数,在一定的用户服务质量要求(QoS)和最大功率限制约束下,提出一种联合用户关联和功率控制的算法。该算法首先将原问题转换为带参数的多项式形式的问题,在外层循环利用二分法求得最佳的能效因子,然后在内层循环分别利用分布式用户关联算法和功率控制算法得到最佳的用户关联矩阵和最佳传输功率,最终实现系统总能效最大化。仿真结果表明,所提算法在能效方面比单独的固定功率分配方案和固定用户关联方案性能更优。
面向异构通信卫星的地球站组网规划方法
严佳洁, 祖家琛, 胡谷雨, 邵东生, 王帅辉
计算机科学. 2021, 48 (3): 275-280.  doi:10.11896/jsjkx.200600067
摘要 ( 94 )   PDF(2190KB) ( 365 )   
参考文献 | 相关文章 | 多维度评价
经过多年的建设发展,卫星通信已经形成了多系列卫星并存、相互支撑、相互补充的通信系统。然而,由于各卫星系统建设时间跨度大,通信技术手段存在差异,如何高效利用异构的卫星通信资源成为了一个实际难题。为此,文中首次根据卫星与地球站的可互通条件构建了系统模型,并将其归结为线性约束下离散变量的非线性优化问题,优化目标是异构卫星波束间的负载均衡,并在此基础上设计了一种两阶段的启发式组网规划方法。最后,根据地球同步卫星网络特性设置了合理的仿真参数,利用Matlab平台进行仿真实验。仿真结果表明,所提方法在面对不同规模的地球站组网时,在平均负载和负载均衡性上均优于一般的枚举搜索和遗传优化算法,可以在短时间内对大规模的信道单元进行组网规划。
减少核心网拥塞的边缘计算资源分配和卸载决策
李振江, 张幸林
计算机科学. 2021, 48 (3): 281-288.  doi:10.11896/jsjkx.200700025
摘要 ( 132 )   PDF(2785KB) ( 444 )   
参考文献 | 相关文章 | 多维度评价
随着移动互联网和物联网的发展,越来越多的智能终端设备投入到实际使用当中,大量计算密集型和时间敏感型应用被广泛应用,如 AR/VR 、智能家居、车联网等。因此,网络中的数据流量激增,使得核心网络面临的压力逐渐增大,对网络时延的控制也越来越难,此时云边协同的计算范式作为一种解决方案被提出。针对云边之间的核心网流量控制问题,文中提出了关于减少云边通信流量的资源分配和卸载决策算法。首先使用设计的基于分割时间槽的资源分配算法来提高边缘处理的流量,然后使用遗传算法搜索最优卸载决策。实验结果表明,与基线方案相比,所提算法能够更好地提高边缘的资源利用率,减少云边通信流量,从而减少潜在的核心网拥塞。
车载社交网中基于传递概率的路由算法
张皓晨, 蔡英, 夏红科
计算机科学. 2021, 48 (3): 289-294.  doi:10.11896/jsjkx.200200097
摘要 ( 72 )   PDF(2385KB) ( 216 )   
参考文献 | 相关文章 | 多维度评价
在车载社交网(Vehicular Social Network,VSN)中,车辆移动速度快且行驶方向难以预测,导致网络拓扑结构不断变化,通信链路时常中断,因此在进行消息传输时丢失率和传输延迟都居高不下。为了解决上述问题,针对VSN提出了一种基于传递概率的路由算法(ProSim),利用节点间的机会式相遇来进行消息的传输,根据车辆间的社交关系设计VSN路由算法以弥补通信链路中断带来的高丢失率和高延迟;选取了车辆节点的相遇概率和社会相似度这两种社交关系,对其进行量化并计算传递概率。使用真实的道路数据进行仿真,实验结果表明,ProSim与直接传输算法(Direct Delivery,DD)、Epidemic算法以及PRoPHET算法这3种经典路由算法相比,可以在控制传输开销和传输延迟的前提下,有效提高消息的传输率。
信息安全
软件定义网络安全问题研究综述
董仕
计算机科学. 2021, 48 (3): 295-306.  doi:10.11896/jsjkx.200300119
摘要 ( 178 )   PDF(1944KB) ( 676 )   
参考文献 | 相关文章 | 多维度评价
软件定义网络是一种新型的网络体系结构,其通过OpenFlow技术来实现网络控制面与数据面的分离,从而达到对网络流量的灵活控制,目前已成为下一代互联网的研究热点。随着SDN的发展及广泛应用,其安全问题已成为亟待解决的重要研究内容。近年来,国内外学者在SDN安全研究领域取得了一定的成果,文中针对SDN的3层架构分别对各层所面临的安全问题及其解决方案进行了系统总结。首先给出了SDN的定义和3层框架;接着依次总结了数据层、控制层和应用层的安全问题以及相应的解决方案;然后分析并讨论了传统网络安全与SDN安全的异同;最后对软件定义网络安全问题未来研究可能面临的挑战进行了展望。
基于MLWE的双向可否认加密方案
郑嘉彤, 吴文渊
计算机科学. 2021, 48 (3): 307-312.  doi:10.11896/jsjkx.200100024
摘要 ( 114 )   PDF(1415KB) ( 290 )   
参考文献 | 相关文章 | 多维度评价
传统的加密方案没有考虑到敌手窃听密文后胁迫发送方或接收方交代加密时使用的公钥、随机数、明文或解密密钥的情况,因此可否认加密的概念在1997年被提出,以解决胁迫问题所带来的信息泄露。目前国内外学者仅提出了几种可否认加密方案,但是普遍存在加密效率过低和膨胀率过高的问题,因此并不实用。文中通过构造“模糊集”的方式来构造一种可抵抗量子攻击的实用双向可否认加密方案。该方案基于多项式环上的模容错学习(Module Learning With Errors,MLWE)困难问题来构造两个敌手无法进行区分的密文分布,并通过卡方统计实验验证了两个密文分布的不可区分性,其安全性可规约到格上的最短独立向量问题(Shortest Independent Vectors Problem,SIVP)。文中对方案的正确性、安全性、可否认性、膨胀率和复杂度等进行了分析,并且通过C++实现的实验结果与理论分析相一致。实验结果表明,该可否认加密方案的误码率约为1×10-23,密文膨胀率为5.0,加密速度约为670 KB/s,因此该方案在电子选举和电子竞标等场景具有实用价值。
基于斯塔克尔伯格博弈的在线社交网络扭曲信息干预算法
袁得嵛, 陈世聪, 高见, 王小娟
计算机科学. 2021, 48 (3): 313-319.  doi:10.11896/jsjkx.200400079
摘要 ( 134 )   PDF(1901KB) ( 322 )   
参考文献 | 相关文章 | 多维度评价
在新冠肺炎疫情期间,社交媒体以前所未有的速度向全世界传播消息。然而,扭曲信息隐藏在海量社交数据中,对国家安全、社会稳定提出了前所未有的挑战。目前的干预措施大多是建立在对关键节点和关键链路进行控制的基础之上,即删帖和封号,往往效果不佳且容易产生副作用。基于扭曲信息的定义和分析,打破传统思维的限定,在信息蔓延过程中通过发布辟谣信息来干扰扭曲信息的演化过程。借助斯塔克尔伯格博弈理论,文中通过设置奖励来鼓励更多的社交网络用户参与信息对冲过程,从而阻止扭曲信息的爆发效应。基于所提出的斯塔克尔伯格博弈模型,分析了斯塔克尔伯格博弈均衡解的存在性和唯一性,并从理论上推导出斯塔克尔伯格博弈的闭式均衡解,提出了基于最优策略的扭曲信息干预算法。实际网络中的仿真实验表明,相比传统的基于网络结构的免疫策略以及其他基于博弈论的干预算法,所提算法最高可将扭曲信息的传播范围分别降低41%和9%,因此能够有效抑制扭曲信息的传播。
基于约束推导式的增强型二进制漏洞挖掘
郑建云, 庞建民, 周鑫, 王军
计算机科学. 2021, 48 (3): 320-326.  doi:10.11896/jsjkx.200700047
摘要 ( 103 )   PDF(2672KB) ( 298 )   
参考文献 | 相关文章 | 多维度评价
近年来,使用软件相似性方法挖掘软件中的同源漏洞已经被证明确实有效,但现有的方法在准确率方面还存在一定不足。在原有的软件相似性方法的基础上,文中提出了一种基于约束推导式的增强型相似性方法。该方法引入代码规范化和标准化处理技术以减少编译环境引起的噪声,使得同源程序在不同编译条件下的反编译代码表示尽量趋于相同;使用程序后向切片技术提取漏洞函数和漏洞补丁函数的约束推导式,通过两者约束推导式的相似性比较,过滤掉易被误判为漏洞函数的补丁函数,以减少漏洞挖掘结果中的误报。基于所提方法,实现了新的漏洞挖掘系统VulFind。实验结果表明,该系统可以提升软件相似性分析的准确率,使得漏洞挖掘结果的准确率得到有效提升。
基于Borderline-SMOTE和双Attention的入侵检测方法
刘全明, 李尹楠, 郭婷, 李岩纬
计算机科学. 2021, 48 (3): 327-332.  doi:10.11896/jsjkx.200600025
摘要 ( 137 )   PDF(1927KB) ( 308 )   
参考文献 | 相关文章 | 多维度评价
随着互联网的发展,网络环境愈加复杂,由此导致的网络安全问题不断出现,因此网络安全的防护成为一项重要研究课题。针对真实网络环境中采集到的流量数据非平衡以及传统机器学习方法提取特征表示不准确等问题,文中提出一种基于Borderline-SMOTE和双Attention的入侵检测方法。首先对入侵数据进行Borderline-SMOTE过采样处理,解决了数据非平衡问题,并且利用卷积网络在图像特征提取方面的优势,将一维流量数据转化为灰度图像;然后通过双注意力网络分别从通道维度和空间维度对低维特征进行维度更新,得到更精准的特征表示;最后利用Softmax分类器对流量数据进行分类预测。所提方法的仿真实验均已在NSL-KDD数据集上得到验证,其准确率达到99.24%,相比其他常用方法准确率更高。