1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2022年第6期, 刊出日期:2022-06-15
  
目录
第49卷第6期目录
计算机科学. 2022, 49 (6): 0-0. 
摘要 ( 207 )   PDF(5385KB) ( 694 )   
相关文章 | 多维度评价
6G 赋能智慧物联网技术与应用*
6G赋能智慧物联网技术与应用专题序言
许威, 李春国, 康嘉文, 杨照辉, 熊泽辉, 刘文
计算机科学. 2022, 49 (6): 1-2.  doi:10.11896/jsjkx.qy20220601
摘要 ( 921 )   PDF(1110KB) ( 783 )   
相关文章 | 多维度评价
空中智能反射面辅助边缘计算中基于PPO的任务卸载方案
谢万城, 李斌, 代玥玥
计算机科学. 2022, 49 (6): 3-11.  doi:10.11896/jsjkx.220100249
摘要 ( 1219 )   PDF(2653KB) ( 1052 )   
参考文献 | 相关文章 | 多维度评价
针对6G时代“智慧物联网”边缘计算系统中障碍物阻挡对任务卸载性能的影响,提出了一种无人机搭载智能反射面(Reconfigurable Intelligent Surfaces,RIS)辅助的计算任务部分卸载方案。首先,在满足用户传输功率、无人机高度、任务卸载比例限制的条件下,通过联合优化时隙分配、任务卸载比例、无人机高度、RIS相移和用户传输功率,建立用户总能耗最小化问题;其次,将该非凸优化问题分解为4个子问题,使用深度强化学习中的近端策略优化(Proximal Policy Optimization,PPO)方法确定时隙分配策略;最后,将每个训练时间步作为一次求解,基于交替迭代方法和连续凸逼近方法得到问题的优化解。仿真结果表明,基于PPO的算法训练速度较快其用户总能耗比采用全部卸载方案的能耗减少了约23%,比采用无人机高度固定方案的能耗减少了约5.3%。
超密集物联网络中多任务多步计算卸载算法研究
周天清, 岳亚莉
计算机科学. 2022, 49 (6): 12-18.  doi:10.11896/jsjkx.211200147
摘要 ( 1177 )   PDF(2370KB) ( 871 )   
参考文献 | 相关文章 | 多维度评价
随着物联网(Internet of Things,IoT)的迅速发展,各种物联网移动设备(IoT Mobile Device,IMD)需要处理越来越多的计算密集型和延迟敏感型任务,这给移动边缘计算网络带来了新的挑战。为了应对这些挑战,装备移动边缘计算(Mobile Edge Computing,MEC)的超密集物联网应运而生。在该网络中,IMD可将计算密集型任务卸载至边缘计算服务器上进行处理,从而节省自己的计算资源并降低能耗。然而,这样会造成额外的传输时间,进而导致更高的延迟。为了均衡能耗与时延,针对多用户多任务的超密集物联网络,提出了一个最小化能耗和时延的均衡问题,以联合优化用户(IMD)关联、计算卸载和资源分配。为了进一步平衡网络负载,充分利用计算资源,在问题建模时采用多步计算卸载。最后,利用智能算法——自适应粒子群算法(Particle Swarm Optimization,PSO) 对所提问题进行求解。相比传统粒子群算法,自适应粒子群算法能降低20%~65%的总开销。
RIS辅助双向物联网通信系统性能分析
董丹丹, 宋康
计算机科学. 2022, 49 (6): 19-24.  doi:10.11896/jsjkx.220100064
摘要 ( 927 )   PDF(2608KB) ( 883 )   
参考文献 | 相关文章 | 多维度评价
可重构智能表面(Reconfigurable Intelligent Surface,RIS)可以智能地调整无线传播环境来显著提升通信性能,相比传统的中继系统具有成本低、功耗低、易部署等特点,被视为6G的潜在关键技术之一。由于RIS可以动态地改变无线电波的相位特征,通过合理地调整相移可以实现网络的可伸缩性,灵活服务于网络中海量的物联网节点。为了进一步提升RIS辅助物联网传输系统的性能,提出了一个由RIS辅助物联网通信的双向传输系统,通过引入全双工技术和自干扰消除技术,有效提高了系统容量和传输效率。推导了所提系统的中断概率、平均误码率和平均信道容量的解析表达式,得到了系统性能与系统中RIS反射单元的数量等系统参数之间的函数关系。蒙特卡洛仿真验证了推导的准确性和所提方案的性能优势。
基于5G毫米波通信的高速公路车联网任务卸载算法研究
邱旭, 卞浩卜, 吴铭骁, 朱晓荣
计算机科学. 2022, 49 (6): 25-31.  doi:10.11896/jsjkx.211100198
摘要 ( 834 )   PDF(2417KB) ( 626 )   
参考文献 | 相关文章 | 多维度评价
随着车联网的快速发展,不断涌现的新型车载任务对通信、计算能力提出了更高的要求。5G毫米波基站的大量部署为高速公路车辆用户提供了更加高速可靠的服务。同时,移动边缘计算技术将具有计算和存储能力的MEC(Mobile Edge Computing)服务器部署在用户终端周围,为车载任务提供计算服务的同时降低了传输时延。文中针对高速公路场景下车辆任务的卸载决策及通信资源分配问题,将计算及通信资源联合优化问题建模为0-1混合整数线性规划问题。首先,将原优化问题解耦为资源块分配子问题及卸载决策子问题;其次,使用注水算法及粒子群算法分别对子问题进行求解;最后,基于启发式算法对子问题进行迭代求解,以获得最优的资源块分配方案及卸载决策向量。仿真结果表明,该算法可在满足所有车载任务需求的同时最小化系统平均时延。
面向6G可信可靠智能的区块链分片与激励机制
王思明, 谭北海, 余荣
计算机科学. 2022, 49 (6): 32-38.  doi:10.11896/jsjkx.220400004
摘要 ( 979 )   PDF(2887KB) ( 590 )   
参考文献 | 相关文章 | 多维度评价
第六代 (6G) 无线通信网络将成为内生智能、泛在连接以及全场景互联互通的基座,是实现可信可靠智能的重要基础。区块链技术被认为是提升6G网络性能的去中心化赋能技术。未来区块链的共识节点将由海量边缘设备组成,并通过无线网络连接。然而,自利的边缘设备参与区块链共识过程仍面临着信息不完全对称、资源限制和异构无线通信环境的挑战。为此,提出了面向6G可信可靠智能的区块链分片与激励机制。为了最大化区块链分片的收益和可靠性,提出了基于实用拜占庭机制的区块链分片架构,同时设计了一个基于契约理论的激励机制。首先,通过分析基于实用拜占庭的片内共识机制及其区块在无线网络中的广播特性,构建了维护区块链分片网络的计算和通信的能耗模型;然后,为了提高系统可靠性和抵御恶意攻击的能力,提出了基于主观逻辑的信誉机制;最后,分别在信息完全对称和不完全对称的条件下求出了最优契约组合。该契约组合最大化区块链服务请求者的区块收益,同时满足预算可行性、个体理性和激励相容性。仿真结果表明,基于契约理论的激励机制能更可靠地激励边缘节点参与区块链共识过程,并从经济学角度有效地维护区块链的运行。
面向铁路集装箱的高可靠低时延无线资源分配算法
胥昊, 曹桂均, 闫璐, 李科, 王振宏
计算机科学. 2022, 49 (6): 39-43.  doi:10.11896/jsjkx.211200143
摘要 ( 867 )   PDF(1905KB) ( 565 )   
参考文献 | 相关文章 | 多维度评价
智能集装箱系统通过信息的实时采集和传输,提高了集装箱的运转效率。为了保证集装箱终端的超可靠低时延通信,文中提出以短包的形式传输信息,研究多小区铁路集装箱终端上行传输系统的和速率最大化问题,提出了一个频谱资源分配策略,多个小区间共用频谱资源,小区内的终端通过竞争获取频谱。首先,采用博弈论模型构建这种竞争关系,并证明了纳什均衡解的存在,其最好的纳什均衡解就是系统和速率最大化的全局最优解;然后,设计了一种分布式迭代算法,该算法只需要局部信息交互,并在理论上证明了当平滑系数足够小时,算法能以任意高的概率收敛到最好的纳什均衡点;最后,对所提算法进行了仿真验证。仿真结果表明,所提算法的收敛速度较快,且优于BRD算法和No-regret算法。
Clustering-based Demand Response for Intelligent Energy Management in 6G-enabled Smart Grids
Ran WANG, Jiang-tian NIE, Yang ZHANG, Kun ZHU
计算机科学. 2022, 49 (6): 44-54.  doi:10.11896/jsjkx.220400002
摘要 ( 922 )   PDF(3070KB) ( 694 )   
参考文献 | 相关文章 | 多维度评价
As a typical industrial Internet of things (IIOT) service,demand response(DR) is becoming a promising enabler for intelligent energy management in 6G-enabled smart grid systems,to achieve quick response for supply-demand mismatches.How-ever,existing literatures try to adjust customers’ load profiles optimally,instead of electricity overhead,energy consumption patterns of residential appliances,customer satisfaction levels,and energy consumption habits.In this paper,a novel DR method is investigated by mixing the aforementioned factors,where the residential customer cluster is proposed to enhance the performance.Clustering approaches are leveraged to study the electricity consumption habits of various customers by extracting their features and characteristics from historical data.Based on the extracted information,the residential appliances can be scheduled effectively and flexibly.Moreover,we propose and study an efficient optimization framework to obtain the optimal scheduling solution by using clustering and deep learning methods.Extensive simulation experiments are conducted with real-world traces.Numerical results show that the proposed DR method and optimization framework outperform other baseline schemes in terms of the system overhead and peak-to-average ratio (PAR).The impact of various factors on the system utility is further analyzed,which provides useful insights on improving the efficiency of the DR strategy.With the achievement of efficient and intelligent energy management,the proposed method also promotes the realization of China’s carbon peaking and carbon neutrality goals.
智能电网中基于优先级的预约式电动汽车充电管理研究
张捷, 唐强, 刘朔晗, 曹越, 赵维, 刘韬, 谢士明
计算机科学. 2022, 49 (6): 55-65.  doi:10.11896/jsjkx.220200013
摘要 ( 882 )   PDF(3375KB) ( 621 )   
参考文献 | 相关文章 | 多维度评价
电动汽车因排放的温室气体极少,在力图实现绿色交通的今天具有巨大应用潜力。然而,其充电时间长及充电拥挤等问题,极大地影响了电动汽车用户的出行体验。为优化电动汽车充电服务,充电站选择方案(于何处充电)及充电调度策略(于何时充电)成为了解决城市电动汽车充电问题的关键。面向以未来6G为承载的交通物联网应用,提出了一项考虑充电优先级(Charging Priority,CP)的抢占式充电调度策略。该策略以经典排队论为基础,允许充电优先级(由充电需求和剩余停车时长计算)较高的电动汽车以抢占的方式充电,最大限度优化充电时序。在CP充电调度策略的基础上,该方案进一步结合预约信息对充电站选择方案进行优化,为电动汽车选择充电行程时长(含一次充电行为)最短的充电站。其中,该方案要求电动汽车上传其充电预约信息以准确预测充电站的服务拥塞状态,从而高效地调配充电资源。方案的结果验证基于赫尔辛基城市交通场景,对充电网络进行了仿真模拟。结果表明,所提优化充电管理方案(CP充电调度策略及基于预约的充电站选择方案)能有效缩短电动汽车的平均充电行程时长,并在有限停车时长内为更多电动汽车提供完整的充电服务。
面向6G的全景视频片划分优化编码算法
杨桃雨, 徐媛媛, 谭增洁
计算机科学. 2022, 49 (6): 66-72.  doi:10.11896/jsjkx.220400034
摘要 ( 701 )   PDF(2872KB) ( 676 )   
参考文献 | 相关文章 | 多维度评价
第6代无线通信的兴起为虚拟现实全景视频的发展提供了更广阔的前景。基于片的全景视频编码方案能够在相同网络带宽条件下提升全景视频的观看体验,片划分大小会影响视频传输的性能,与较小的片相比,采用较大的片能够降低编码冗余,但需传送更大区域来覆盖相同视口,这会造成更多的像素开销。目前已有片划分工作主要是针对矩形视口而设计的,而实际中,球型视频到二维平面的投影会对视口不同区域进行不同程度的拉伸,用矩形片覆盖不规则视口区域时像素开销计算更为复杂。针对这一挑战,文中提出了一种适用于用户真实视口的片划分算法。首先,分析了投影格式对视口区域造成的拉伸失真,并对在不同片划分下不规则视口区域的额外像素开销进行了推导;然后,通过权衡不同划片粒度编码单元的像素开销与编码效率的关系,提出了一种全景视频序列最优片划分编码方案;最后,通过与片划分穷举搜索法进行对比,验证了所提算法在较少的计算复杂度下能取得与穷举搜索法相当的传输效率。
高性能计算
基于国产众核架构的非结构网格分区块重构预处理算法研究
叶跃进, 李芳, 陈德训, 郭恒, 陈鑫
计算机科学. 2022, 49 (6): 73-80.  doi:10.11896/jsjkx.210900045
摘要 ( 406 )   PDF(3168KB) ( 598 )   
参考文献 | 相关文章 | 多维度评价
如何高效地解决非结构网格离散访存问题一直是科学与工程计算并行算法和应用领域关注的核心热点问题之一。基于国产申威异构众核架构而设计的分布式区块重连的优化算法,在解决应用课题中的非结构稀疏问题时能始终保持高效的计算性能。通过深入分析众核架构片上的通信机制来设计高效的消息分组策略,以提高从核片上阵列带宽的利用率,同时结合无栅栏数据分发算法充分发挥国产异构众核体系架构网络的性能。通过建立性能模型与实验测试分析可知,该算法在不同访存特征下平均内存带宽能达到理论值的70%以上,与主核串行算法相比具有平均10倍和最高45倍的加速性能。同时通过对多个不同领域的应用进行测试分析也证明了该算法的普适性。
面向粒子输运程序加速的体系结构设计
傅思清, 黎铁军, 张建民
计算机科学. 2022, 49 (6): 81-88.  doi:10.11896/jsjkx.210600179
摘要 ( 356 )   PDF(2310KB) ( 598 )   
参考文献 | 相关文章 | 多维度评价
粒子输运的随机模拟方法通常用于求解大量运动状态中粒子的特征量。粒子输运问题广泛出现在医学、天体物理和核物理领域,当前粒子输运随机模拟求解方法的主要挑战是计算机能够支撑的模拟样本数、模拟时间尺度与研究人员研究实际问题的需求之间的差距。处理器性能的发展随着工艺尺寸进步的停滞进入了新的历史阶段,复杂的片上结构的集成已经不符合现今的要求。面向粒子输运程序,文中开展了一系列体系结构设计工作,通过分析和利用程序的并行性和访存特点,设计了精简内核和可重配置缓存来加速程序。通过模拟器验证,文中提出的体系结构相比传统乱序架构获得了4.45倍性能功耗比优势以及2.78倍性能面积比优势,这为进一步研究大规模众核粒子输运加速器奠定了基础。
多线程数据竞争检测技术研究综述
赵静文, 付岩, 吴艳霞, 陈俊文, 冯云, 董继斌, 刘嘉琪
计算机科学. 2022, 49 (6): 89-98.  doi:10.11896/jsjkx.210700187
摘要 ( 514 )   PDF(1770KB) ( 816 )   
参考文献 | 相关文章 | 多维度评价
随着多核处理器在现代计算机设备中的流行,在软件中使用多线程程序的频率也随之增加。但多线程程序的不确定性会导致程序在运行过程中出现数据竞争、原子性违背、顺序违背和死锁等并发问题。研究发现,在所有并发缺陷中,数据竞争所占的比例最大,而且大多数原子性违背和顺序违背也是由数据竞争引起的。为解决这一问题,学者们先后提出了相关的检测技术,文中对近年来该领域的研究技术进行了总结。首先,介绍了数据竞争的相关概念和产生原因,以及数据竞争检测的主要思想;然后根据程序是否执行将现有的数据竞争检测技术分为静态分析、动态分析和混合检测技术三大类,归纳分析了每类技术的特点并进行了详细的比较;随后,从程序员角度阐明了现有检测技术存在的问题;最后,根据发展现状,对该领域的未来发展方向进行了分析与探讨。
面向国产异构众核架构的CFD非结构网格计算并行优化方法
陈鑫, 李芳, 丁海昕, 孙唯哲, 刘鑫, 陈德训, 叶跃进, 何香
计算机科学. 2022, 49 (6): 99-107.  doi:10.11896/jsjkx.210400157
摘要 ( 498 )   PDF(3943KB) ( 1072 )   
参考文献 | 相关文章 | 多维度评价
神威太湖之光在2016-2018年度全球超算top500榜单中排名第一,峰值性能为125.4 PFlops,其计算能力主要归功于国产SW26010众核处理器。由于CFD非结构网格计算存在拓扑关系复杂、离散访存问题严重、存在强相关的线化方程求解等问题,导致CFD非结构网格计算一直是国产众核超级计算机移植与优化的难题。为充分发挥国产异构众核架构的计算效能,首先,提出了一种数据重构模型,提高了数据的局部性和可并行性,使得数据结构更加适应众核架构的特点;然后,针对非结构网格数据存放的无序性导致的离散访存问题,提出了一种基于信息关系预存的离散访存优化方法,将离散访存转化为连续访存;最后,对于存在强相关的线化方程求解问题,引入了从核阵列流水线并行的思想,实现了众核并行。优化后CFD非结构网格计算的整体性能相比原始版本提升了4.19倍,相比通用CPU提升了1.2倍,并扩展到62.4万计算核心的并行规模,能保持64.5%的并行效率。
基于GPU的并行DILU预处理技术
汪晋, 刘江
计算机科学. 2022, 49 (6): 108-118.  doi:10.11896/jsjkx.210300259
摘要 ( 582 )   PDF(2690KB) ( 732 )   
参考文献 | 相关文章 | 多维度评价
在科学计算和工程领域,大型稀疏线性方程组的求解非常常见,目前已经有许多迭代方法和预处理技术被用于求解这类方程。DILU预处理技术类似于ILU,是开源计算流体力学软件OpenFOAM中重要的预处理技术,但未在OpenFOAM以外的领域引起关注,目前也没有完整的GPU实现。比较了DILU和ILU预处理技术对稳定双共轭梯度法(BiCGStab)加速的效果,以及它们在构造预处理子上的开销,结果表明,DILU在加速效果上不逊于ILU且在稳定性上优于ILU。在GPU并行实现方面,DILU可以使用分层并行和无全局同步并行两种并行策略,详细讨论了DILU预处理技术在这两种策略下的实现方法,给出了相关的算法和参考代码,然后比较了在两种并行策略下DILU预处理技术的性能。数值实验结果表明,在实践中两种并行策略各有优劣,可以根据实际表现进行选择。另外比较了GPU和CPU执行的DILU预处理技术,GPU在性能上具有明显优势,在线性方程组求解上存在性能瓶颈的程序可以移植到GPU平台以提升性能。
数据库&大数据&数据科学
用户行为驱动的时序影响力最大化问题研究
魏鹏, 马玉亮, 袁野, 吴安彪
计算机科学. 2022, 49 (6): 119-126.  doi:10.11896/jsjkx.210700145
摘要 ( 353 )   PDF(2516KB) ( 508 )   
参考文献 | 相关文章 | 多维度评价
影响力最大化IM问题旨在查找社交网络中的一组用户,通过这些用户,使信息在网络中传播的范围最大化。现有研究主要关注静态网络中的IM问题,然而在现实生活中,社交网络是不断演化的,基于静态网络的传播模型(如独立级联模型、线性阈值模型)无法适用于演化网络中的信息传播过程。同时,现有研究忽略了用户行为对信息传播的影响。因此,针对该问题,提出了一种用户行为驱动的独立级联BDIC传播模型,该模型主要根据用户行为对信息的传播过程进行建模,可有效刻画演化社交网络中的信息传播过程。在该模型的基础上,提出了用户行为驱动的影响力最大化算法,主要包括3个步骤:首先,建模消息传播过程,计算演化社交网络中的信息传播概率;然后,提出一种用户行为驱动的反向影响力采样方法,有效查询单个时间点下的种子用户;最后,设计一种不同时间节点(时间序列)下的种子节点查询方法,有效反映演化社交网络中种子节点动态变化的特性。为了评估所提算法的有效性,设计了种子节点与受影响节点的相似度对比方法。通过大量真实数据集上的实验,验证了信息传播概率算法的高效性和扩展性,证明了相比普通的独立级联模型,BDIC模型能更好地建模演化社交网络中的信息传播过程。
基于DECORATE集成学习与置信度评估的Tri-training算法
王宇飞, 陈文
计算机科学. 2022, 49 (6): 127-133.  doi:10.11896/jsjkx.211100043
摘要 ( 419 )   PDF(2041KB) ( 601 )   
参考文献 | 相关文章 | 多维度评价
Tri-training是一种基于分歧的半监督学习算法,同时利用了半监督学习和集成学习机制。Tri-training能有效地利用少量有标记样本和大量无标记样本,通过分类器间的相互协同和迭代来提升模型性能。但是在已标记样本量不足的情况下,Tri-training生成的初始分类器训练不足,并且在分类器间协同标记的过程中可能产生误标记的噪声数据。针对上述问题,提出了一种结合DECORATE集成学习、多样性度量与置信度评估的协同学习算法。该算法基于DECORATE集成学习方法,通过添加差异化的人工样本和标记来训练多种偏好的基分类器,以提升分类泛化能力。该算法还基于JS散度对分类器进行多样性度量和筛选,以最大化基分类器多样性,同时在迭代过程中基于标签传播算法对伪标记样本进行置信度评估,以减少噪声数据。在UCI数据集上进行了分类实验,结果表明,相比Tri-training算法及其改进算法,所提算法具有更高的分类准确率和F1分数。
自适应权重的级联增强节点的宽度学习算法
蔡欣雨, 冯翔, 虞慧群
计算机科学. 2022, 49 (6): 134-141.  doi:10.11896/jsjkx.210500119
摘要 ( 566 )   PDF(3271KB) ( 704 )   
参考文献 | 相关文章 | 多维度评价
进入智能化时代,需要在大数据平台上进行持续自主学习和优化,而持续自主学习的第一步就是进行数据增强。文中提出基于级联增强节点的宽度学习方法,为大数据平台上的持续自主学习提供了新的数据增强方法,也为后续在学习架构基础上的演化优化提供了可能。以时序预测问题为依托,但由于经典宽度学习是典型的前馈神经网络,并不适合建模动态时间序列,因此在传统的宽度学习系统中引入反馈结构,将增强节点层顺序连接,使得增强节点具有记忆性,能够保留部分历史信息。在进行特征提取时,采用了相空间重构来提取数据更本质的特征;同时,引入了权重因子,在训练时依据每个样本对模型的贡献度,为其独立分配不同的权重,从而消除噪声和离群点对学习过程的干扰,提高算法的预测准确率以及鲁棒性。实验结果表明所提算法是有效的。
增强列表信息和用户兴趣的个性化新闻推荐算法
蒲岍岍, 雷航, 李贞昊, 李晓瑜
计算机科学. 2022, 49 (6): 142-148.  doi:10.11896/jsjkx.210400173
摘要 ( 339 )   PDF(2449KB) ( 584 )   
参考文献 | 相关文章 | 多维度评价
随着数据信息的不断扩增,点对点推荐模型作为深度学习中常用的推荐算法,能一定程度上解决信息过载的问题。但其仅通过单个用户与单个新闻预测得分,未利用新闻列表之间的交互信息。为了提升个性化推荐的质量,如何充分利用用户的历史信息、新闻的文本语义信息和列表信息等,以精准全面地表征用户和新闻是当前新闻推荐系统亟待解决的问题。对此,提出了一种增强列表信息和用户兴趣的新闻个性化推荐算法。利用用户历史点击新闻序列与新闻数据训练点对点模型进行特征构造,实现用户兴趣的个性化信息抽取,通过注意力网络处理用户与整个新闻列表特征来增强列表信息,实现直接对全局列表的推荐排序。实验结果表明,此种增强列表信息和用户兴趣的个性化推荐算法能够建模全局列表信息,与前沿的新闻推荐算法相比效果有显著提升。
基于遗憾探索的竞争网络强化学习智能推荐方法研究
洪志理, 赖俊, 曹雷, 陈希亮, 徐志雄
计算机科学. 2022, 49 (6): 149-157.  doi:10.11896/jsjkx.210600226
摘要 ( 285 )   PDF(3034KB) ( 613 )   
参考文献 | 相关文章 | 多维度评价
近年来,深度强化学习在推荐系统中的应用受到了越来越多的关注。在已有研究的基础上提出了一种新的推荐模型RP-Dueling,该模型在深度强化学习Dueling-DQN的基础上加入了遗憾探索机制,使算法根据训练程度自适应地动态调整“探索-利用”占比。该算法实现了在拥有大规模状态空间的推荐系统中捕捉用户动态兴趣和对动作空间的充分探索。在多个数据集上进行测试,所提算法在MAE和RMSE两个评价指标上的最优平均结果分别达到了0.16和0.43,比目前的最优研究结果分别降低了0.48和0.56,实验结果表明所提模型优于目前已有的传统推荐模型和基于深度强化学习的推荐模型。
基于注意力机制和门控网络相结合的混合推荐系统
郭亮, 杨兴耀, 于炯, 韩晨, 黄仲浩
计算机科学. 2022, 49 (6): 158-164.  doi:10.11896/jsjkx.210500013
摘要 ( 749 )   PDF(2657KB) ( 891 )   
参考文献 | 相关文章 | 多维度评价
将用户评论和用户评分相结合来提升推荐系统的性能是推荐系统当前主流的研究方向,但是当用户评论数据稀疏时,现有的大多数推荐系统的性能会出现一定幅度的下降。针对这一问题,文中提出了一种结合注意力机制和门控网络形成的混合推荐系统(Attention Mechanism and Gating Network-based Recommendation System,AMGNRS)。该模型利用志趣相投的用户所产生的辅助评论来缓解用户评论的稀疏性问题,首先将多种混合注意力机制相结合来提高提取用户评论及评分的特征的效率,然后通过门控网络自适应地融合提取的特征并选出与用户偏好最相关的特征,最后利用神经因子分解机的高阶线性相互作用来推导评分预测。将所提模型与当前表现优异的模型在3个真实数据集上进行了对比实验,结果表明,所提模型显著地缓解了数据的稀疏性问题,验证了其有效性。
融合用户偏好的图神经网络推荐模型
熊中敏, 舒贵文, 郭怀宇
计算机科学. 2022, 49 (6): 165-171.  doi:10.11896/jsjkx.210400276
摘要 ( 654 )   PDF(2137KB) ( 837 )   
参考文献 | 相关文章 | 多维度评价
针对知识图谱驱动的图神经网络推荐算法无法同时学习用户和项目表示的问题,提出了融合用户偏好的图神经网络推荐模型,该模型分别从用户视角和实体视角学习用户和项目表示。首先,用户视角根据用户历史交互记录在知识图谱中传播用户偏好,增强用户表示;其次,实体视角通过图卷积网络聚集候选实体邻居信息以丰富实体的表示,同时设计一个混合层,分别从宽度和深度两个方面捕获高阶连通性和混合分层信息来增强项目表示,再将增强的用户表示向量和项目表示向量输入预测函数中,用于预测交互概率;最后,使用固定个数采样方法和阶段性训练策略优化模型的性能。在MovieLens-1M数据集上进行点击率预测实验,结果表明,所提模型的AUC与基准方法RippleNet和KGCN相比分别提升了1.7%和2.3%。
随机多尺度序决策系统的最优尺度选择
方连花, 林玉梅, 吴伟志
计算机科学. 2022, 49 (6): 172-179.  doi:10.11896/jsjkx.220200067
摘要 ( 277 )   PDF(1586KB) ( 419 )   
参考文献 | 相关文章 | 多维度评价
针对由随机实验得到的多尺度序信息系统的知识获取问题,首先,引入随机多尺度序信息系统和基于优势-等价关系的随机多尺度序决策系统的概念;然后,在随机多尺度序信息系统中给出在不同尺度下基于优势关系的信息粒的表示、以及集合关于由条件属性集生成的优势关系的下近似与上近似的定义,并得到在不同尺度下信息粒、集合的下近似与上近似的变化关系;最后,分别在随机多尺度序信息系统和基于优势-等价关系的随机多尺度序决策系统中定义了几类最优尺度的概念,并用证据理论中的信任函数与似然函数刻画了最优尺度的数值特征。
计算机图形学&多媒体
基于解耦-检索-生成的图像风格化描述生成模型
陈章辉, 熊贇
计算机科学. 2022, 49 (6): 180-186.  doi:10.11896/jsjkx.211100129
摘要 ( 425 )   PDF(2360KB) ( 705 )   
参考文献 | 相关文章 | 多维度评价
图像描述旨在为输入的图像生成描述文本以准确描述图像内容,而图像的风格化描述在此基础上引入了对语言风格的考虑,恰当表达出特定的语言风格,使得模型生成的描述文本更具多样性。为了更好地在生成的描述文本中融入风格元素,提出了基于解耦-检索-生成的图像风格化描述生成模型。该模型首先将风格化语料中的句子拆分成内容词汇和风格词汇,并构建了一个内容-风格词汇的记忆模块;然后根据图像的事实描述从记忆模块中检索出与之相匹配的风格词汇;最后将图像的事实描述和检索出的风格词汇输入语言模型中生成风格描述。在真实数据集上的实验结果表明,相比已有方法,所提模型在各项评价指标上都有着更好的性能表现,可以在描述图像内容的同时表达出特定的风格。
基于时频域生成对抗网络的语音增强算法
尹文兵, 高戈, 曾邦, 王霄, 陈怡
计算机科学. 2022, 49 (6): 187-192.  doi:10.11896/jsjkx.210500114
摘要 ( 478 )   PDF(2613KB) ( 719 )   
参考文献 | 相关文章 | 多维度评价
传统基于生成对抗网络的语音增强算法(Speech Enhancement Algorithm Based on Generative Adversarial Networks,SEGAN)在时域上对语音进行增强处理,完全忽略了语音样本在频域上的分布情况。在低信噪比条件下,语音信号会淹没在噪声中,带噪语音的时域分布信息很难捕获,因此,SEGAN的增强性能会急剧下降,其增强语音的语音质量和语音可懂度很低。针对该问题,提出了基于时频域生成对抗网络的语音增强算法(Time-Frequency Domain SEGAN,TFSEGAN)。TFSEGAN采用了时频域双判别器的模型结构和时频域L1损失函数,时域判别器的输入为语音样本的时域特征,频域判别器的输入为语音样本的频域特征。在训练过程中,时域判别器将语音样本的时域分布信息作为判别标准,而频域判别器将语音样本的频域分布信息作为判别标准。在两个判别器的作用下,TFSEGAN的生成器能够同时学习语音样本在时域和频域中的分布规律和信息。实验证明,在低信噪比条件下,与SEGAN相比,TFSEGAN的语音质量与可懂度分别提升了约17.45%和11.75%。
基于特征注意力融合网络的遥感变化检测研究
蓝凌翔, 池明旻
计算机科学. 2022, 49 (6): 193-198.  doi:10.11896/jsjkx.210500058
摘要 ( 448 )   PDF(2372KB) ( 654 )   
参考文献 | 相关文章 | 多维度评价
变化检测是遥感的重要任务之一,通常被认为是像元级的分类问题。近年来,深度神经网络由于对双时相图像具有强大的层次表示能力,在变化检测中得到了广泛应用。文中基于编码器-融合-解码器框架,提出了一种基于特征注意力融合的变化检测网络(FFAN),其将编码器生成的特征与经由注意力机制增强后的双时相差异特征进行融合,以更好地捕获双时相变化信息。特别地,通过由注意力机制增强的双时相特征,可以显著增强深层网络中间层中变化信息的传播,该特征显式地建模双时相输入的相互依赖性并自适应地重新校准FFAN中的变化激活。在开源数据集上进行的实验表明,与现有方法相比,所提FFAN具有更优异的检测性能。
基于卷积神经网络的Retinex低照度图像增强
赵征鹏, 李俊钢, 普园媛
计算机科学. 2022, 49 (6): 199-209.  doi:10.11896/jsjkx.210400092
摘要 ( 748 )   PDF(7271KB) ( 703 )   
参考文献 | 相关文章 | 多维度评价
利用传统Retinex模型进行低照度图像分解和增强时,需要人工不断地进行参数调试以达到最优解,这会降低整个过程的效率。此外,现有的基于Retinex理论的低照度图像增强方法在进行图像增强时未能很好地兼顾反射分量和光照分量,会存在低照度图反射分量噪点多、光照分量亮度低且细节不够突出的问题。基于此,提出了一种数据驱动的深层网络来学习低照度图像的分解和增强,通过端到端的网络训练来进行模型参数的学习。该网络先将低照度图分解为反射分量和光照分量,针对反射分量噪点多的问题,采用改进的去噪卷积神经网络(New Denoising Convolutional Neural Network,NDnCNN)模型进行去噪;针对光照分量亮度低、细节不够突出的问题,引入卷积块注意力模型(Convolutional Block Attention Model,CBAM)进行细节增强并指导网络进行光照分量的修正;最后用去噪后的反射分量和修正后的光照分量进行图像重建。经测试,增强后的低照度图亮度提升,细节突出,信息丰富,图像失真小且真实自然。
基于样本分布损失的图像多标签分类研究
朱旭东, 熊贇
计算机科学. 2022, 49 (6): 210-216.  doi:10.11896/jsjkx.210300267
摘要 ( 560 )   PDF(2289KB) ( 736 )   
参考文献 | 相关文章 | 多维度评价
与一般图像分类场景下的数据分布情况不同,在图像多标签分类问题的场景下,不同标签类别之间存在样本数量分布不均衡,少量头部类别通常占据大多数样本数量的情况。而由于多个标签间同时标记的相关性,再加上多标签下困难样本的分布还与数据分布和类别分布相关,使得单标签问题中解决数据不平衡的重采样等方法在多标签场景下无法有效适用。文中提出了一种基于图像多标签场景下样本分布损失和深度学习的分类方法。首先对多标签数据不均衡分布设置类别相关重采用损失,并通过动态学习方式防止分布过度异化,然后设计非对称样本学习损失,设置对正负样本和困难样本的不同学习能力,同时通过软化样本学习权重减少信息丢失。相关数据集的实验显示,所提算法在解决多标签数据分布不均衡场景下的样本学习问题时取得了很好的效果。
基于特征感知的数字壁画复原方法
徐辉, 康金梦, 张加万
计算机科学. 2022, 49 (6): 217-223.  doi:10.11896/jsjkx.210500105
摘要 ( 451 )   PDF(3787KB) ( 705 )   
参考文献 | 相关文章 | 多维度评价
敦煌壁画存在多种病害造成的不规则破损区域,运用数字修复的方式对其进行恢复,既不会对原始壁画造成损坏,又可以获得较好的修补效果。由于壁画修补问题中缺失的区域较大,不能用局部非语义的修补方法来实现。针对敦煌壁画缺损区域的修复问题,设计了基于生成对抗网络的图像修补方法,使用语义上合理的内容来渲染缺失区域的像素,实现非接触性壁画场景重建,从而提升壁画虚拟修复准确度。该算法在生成对抗神经网络的基础上引入感知损失函数,在生成模型中添加3层扩张卷积层来收集破损区域的图像特征,利用感知损失提升模型对高频纹理细节的修复能力,运用扩展卷积提取范围特征激励生成模型生成较高质量的图像结果。在敦煌壁画数据集上将所提方法与3种优秀方法进行了比较,修复结果显示所提算法在测试数据集上的PSNR评分提高了1.79%,SSIM评分提高了7.7%。所提修复模型提升了破损壁画的修复精度,使修复结果更加准确。
多分支RA胶囊网络及在图像分类中的应用
武霖, 孙静宇
计算机科学. 2022, 49 (6): 224-230.  doi:10.11896/jsjkx.210400087
摘要 ( 266 )   PDF(3123KB) ( 401 )   
参考文献 | 相关文章 | 多维度评价
胶囊网络是一种新型深度神经网络,采用向量表达图像特征信息,并通过引入动态路由算法解决了卷积神经网络的两个主要问题:1)无法对图像的部分与整体关系进行学习和表达;2)池化操作导致图像特征信息严重丢失。然而,CapsNet需要学习图像的所有特征,当图像背景较复杂时,其存在提取图像特征信息不足、训练参数量大和训练效率低等问题。为此,首先设计了一种轻量级的图像特征提取器RA模块,用于更快、更完整地提取图像特征信息;其次,设计了两种不同深度的轻量化分支来提升网络的训练效率;最后,设计了新的压缩函数hc-squash来确保网络能够获取更多有用信息,并提出了多分支RA胶囊网络。通过在MNIST,Fashion-MNIST,affNIST和CIFAR-10这4个图像分类数据集中的应用,证实了多分支RA胶囊网络在多项性能指标上优于CapsNet和MLCN,并针对所提网络设计了改进方案,以优化分类性能。
基于金字塔演化策略的彩色图像多阈值分割
徐汝利, 黄樟灿, 谢秦秦, 李华峰, 湛航
计算机科学. 2022, 49 (6): 231-237.  doi:10.11896/jsjkx.210300096
摘要 ( 261 )   PDF(3444KB) ( 434 )   
参考文献 | 相关文章 | 多维度评价
传统智能优化算法对彩色图像进行分割未能考虑种群间的竞争与协作关系,从而造成局部最优问题,影响了分割效果。为了提高分割效果,提出了一种改进金字塔演化策略(Improved Pyramid Evolution Strategy,IPES)。首先设计了一种适合彩色图像多阈值分割问题的自适应搜索算子,扩大各层级搜索空间,提高了算法的寻优能力;然后利用种群间的竞争与协作关系以解决局部最优问题,进而提高求解精度和分割效果;最后以最大类间方差(Otsu)为优化目标,利用现有的标准测试图像对算法性能进行测试,并将IPES算法与其他8种算法的性能进行比较。实验结果表明,经IPES算法分割后的图像峰值信噪比值在28~35 dB之间,比改进树种算法和传统的粒子群算法以及差分进化算法至少提高了10 dB;结构相似性值在89%~97%之间,至少提高了3个百分点,分割后的图片质量更好,结构相似性更高。因此,该算法在求解彩色图像多阈值分割问题时具有良好的性能。
三维城市场景中的小物体检测
陈佳舟, 赵熠波, 徐阳辉, 马骥, 金灵枫, 秦绪佳
计算机科学. 2022, 49 (6): 238-244.  doi:10.11896/jsjkx.210400174
摘要 ( 490 )   PDF(3491KB) ( 616 )   
参考文献 | 相关文章 | 多维度评价
三维目标检测是三维城市场景语义分析的关键环节,但是现有的目标检测方法主要关注诸如建筑、道路等较大的物体,对路灯、井盖等小物体的检测误差较大。为此,提出了一种多视图的三维城市场景小物体检测方法,在倾斜摄影的基础上结合精准三维定位方法,提高了三维城市场景中小物体检测的精度。首先在无人机原片上利用深度学习方法检测城市小物体,然后将这些图像检测结果反投影到三维城市模型上,并通过聚类得到最终的三维检测结果。实验结果表明,所提方法能够在倾斜摄影测量得到的大规模三维城市模型上自动检测井盖、窗户等城市小物体,不受视线遮挡的影响,相对于正射图上的物体检测具有较高的准确性和稳定性。
基于无标签知识蒸馏的人脸识别模型的压缩算法
程祥鸣, 邓春华
计算机科学. 2022, 49 (6): 245-253.  doi:10.11896/jsjkx.210400023
摘要 ( 390 )   PDF(3390KB) ( 696 )   
参考文献 | 相关文章 | 多维度评价
将人脸识别技术移植到移动设备上时,往往需要经过模型压缩等加速算法的处理。知识蒸馏是一种实际应用较广且易于训练的模型压缩方法,现有的知识蒸馏算法需要大量带标签的人脸数据,可能会涉及身份隐私泄露等安全问题。同时,大规模采集有标签人脸数据的成本较大,而海量可采集或生成的无标签人脸数据却无法利用。为解决上述问题,通过分析知识蒸馏在人脸识别任务中的特性,提出了一种无标签知识蒸馏的间接监督训练方法。该方法可以利用海量无标签的人脸数据,避免了隐私泄露等安全隐患问题。然而,无标签人脸数据集的数据分布无法预知,存在数据分布不均衡的问题,阻碍了间接监督算法的性能提升。文中进一步提出了一种人脸内容置换的数据增强方法,通过置换人脸部分内容来平衡人脸数据分布,同时增强了人脸数据的多样性。实验结果表明,人脸识别模型被大幅度压缩时,所提算法的性能达到了先进水平,并在LFW数据集上超越了大型网络。
基于时空图卷积和注意力模型的航拍暴力行为识别
邵延华, 李文峰, 张晓强, 楚红雨, 饶云波, 陈璐
计算机科学. 2022, 49 (6): 254-261.  doi:10.11896/jsjkx.210400272
摘要 ( 573 )   PDF(3756KB) ( 776 )   
参考文献 | 相关文章 | 多维度评价
公共区域暴力行为频繁发生,视频监控对维护公共安全具有重要意义。相比固定摄像头,无人机具有监控灵活性,然而航拍成像中无人机快速运动以及姿态、高度的变化,使得目标出现运动模糊、尺度变化大的问题,针对该问题,设计了一种融合注意力机制的时空图卷积网络AST-GCN(Attention Spatial-Temporal Graph Convolutional Networks),用于实现航拍视频暴力行为识别。该方法主要分为两步:利用关键帧检测网络完成初定位以及AST-GCN网络通过序列特征完成行为识别确认。首先,针对视频暴力行为定位,设计关键帧级联检测网络,实现基于人体姿态估计的暴力行为关键帧检测,初步判断暴力行为的发生时间。其次,在视频序列中提取关键帧前后的多帧人体骨架信息,对骨架数据进行归一化、筛选和补全,以提高对不同场景及部分关节点缺失的鲁棒性,并根据提取的骨架信息构建骨架时序-空间信息表达矩阵。最后,时空图卷积对多帧人体骨架信息进行分析识别,融合注意力模块,提升特征表达能力,完成暴力行为识别。在自建航拍暴力行为数据集上进行验证,实验结果表明,融合注意力机制的时空图卷积AST-GCN能实现航拍场景暴力行为识别,识别准确率达86.6%。提出的航拍暴力行为识别方法对于航拍视频监控和行为理解等应用具有重要的工程价值和科学意义。
基于接缝一致性准则的结构纹理图像快速合成算法
靳利贞, 李庆忠
计算机科学. 2022, 49 (6): 262-268.  doi:10.11896/jsjkx.210400039
摘要 ( 279 )   PDF(7081KB) ( 545 )   
参考文献 | 相关文章 | 多维度评价
基于块的结构纹理图像合成算法存在诸多问题,如结构不连续、边界扭曲、接缝不齐以及合成速度慢等,对此提出了一种新的基于双接缝一致性准则的纹理图像非重叠拼接快速合成算法,该算法有效提高了结构纹理图像的合成质量与速度。首先基于更符合人眼视觉特性的HSI颜色空间建立了同时考虑色调、饱和度、亮度和边缘特征的接缝线一致性判别准则;然后提出并实现了基于双接缝线一致性准则的子块搜索策略和非重叠拼接算法。实验结果表明,与传统算法相比,所提算法能够显著提高结构纹理图像的合成质量和速度。
多算法融合的骨骼重建信息动作分类方法
赵小虎, 叶圣, 李晓
计算机科学. 2022, 49 (6): 269-275.  doi:10.11896/jsjkx.210500070
摘要 ( 274 )   PDF(4024KB) ( 593 )   
参考文献 | 相关文章 | 多维度评价
针对行为监测在现实场景下实测效果较差的情况,提出了一种新型的提取人体运动特征的方法,该方法不仅考虑了骨骼点信息,也融合了图像的环境属性信息。考虑到现有的大量实验都是在提取人体骨骼特征的基础上融合多种复杂算法进行实验分类,并未考虑到仅仅使用提取骨骼特征进行算法评估的不合理性。因此提出了一种基于骨骼特征的图像信息重建方法,并结合骨骼特征的图卷积网络和注意力机制等算法以及图像识别方法以达到人体行为识别的目的。首先使用Openpose提取骨骼点信息;然后使用图卷积和注意力进行一次分类,在一次分类的基础上通过加入骨骼点扩张系数来分割图形,从而达到对分割的图形进行分类二次精确分类的目的;最后在HMDB51数据集上进行评估,结果表明所提方法的准确度相比对比方法平均提高了5.6%,在实际测试中其有较强的优势。这表明所提方法不仅更精确,同时也更具有实际应用价值。
人工智能
机器学习在金融资产定价中的应用研究综述
许杰, 祝玉坤, 邢春晓
计算机科学. 2022, 49 (6): 276-286.  doi:10.11896/jsjkx.210900127
摘要 ( 737 )   PDF(2098KB) ( 2589 )   
参考文献 | 相关文章 | 多维度评价
金融资产配置的关键问题是资产的价格,资产定价是现代金融学的核心内容,揭示资产定价规律一直是金融研究热点之一。文中回顾了机器学习在资产定价领域使用的方法与研究进展,将机器学习资产定价的方法分类为基于特征处理的机器学习方法与端到端处理的深度学习方法;围绕当前机器学习资产定价遇到的主要问题,比较了不同算法在原理和应用场景方面的区别;指出了两类机器学习方法的适用性与局限性;讨论了机器学习资产定价未来可能的研究趋势。
即时策略博弈在线对抗规划方法综述
罗俊仁, 张万鹏, 陆丽娜, 陈璟
计算机科学. 2022, 49 (6): 287-296.  doi:10.11896/jsjkx.210600168
摘要 ( 502 )   PDF(2858KB) ( 775 )   
参考文献 | 相关文章 | 多维度评价
即时策略博弈在线规划是多智能体学习领域的挑战性问题,在博弈对抗过程中,面对不确定性威胁环境和非平稳性对手,智能体需要在有限时间内根据博弈对抗态势推理对方的行动,在巨大的状态空间和动作空间中快速做出己方行动规划,组织对抗规划。即时策略博弈平台是研究在线对抗规划问题的理想测试床。文中首先借助一个典型的即时策略博弈模型引出即时策略博弈对抗问题,并将其分类成3个层次和2种操作控制方法,从5个子方向梳理了即时策略博弈面临的5个挑战;其次从战术对抗、策略对抗和混合对抗3个角度对当前在线对抗规划方法进行了全面的综述分析;最后从对手及玩家建模、人机协同在线临机规划、基于学习的规划方法3个方面点明了未来需要研究的重点问题。
一种基于切比雪夫距离的隐式偏好多目标进化算法
孙刚, 伍江江, 陈浩, 李军, 徐仕远
计算机科学. 2022, 49 (6): 297-304.  doi:10.11896/jsjkx.210500095
摘要 ( 590 )   PDF(3075KB) ( 1068 )   
参考文献 | 相关文章 | 多维度评价
偏好多目标进化算法作为多目标优化方法的重要分支,被广泛应用于科学研究和工程实践,具有重要的研究意义。为了求得多目标优化问题中的极点解及在各优化目标上性能最折衷的膝点解,提出了用切比雪夫距离来定义膝点的方法并给出了几何解释,基于此构建了一种求解极点解和膝点解的多目标进化算法HP-NSGA-II。该算法通过区域动态更新策略使得目标区域随迭代过程动态更新,最终收敛于目标区域;通过区域间平衡性保持策略确保各区域间个体数量的平衡性,使得个体较为均匀地分布在各区域内部。基于广泛采用的测试函数开展了充分的实验验证,结果表明,HP-NSGA-II算法在二维测试问题及三维测试问题上具有较好的收敛性、区域间平衡性以及区域可控性,可以准确求得测试问题的极点解及膝点解。
融入新能源领域术语知识的机器翻译方法
董振恒, 任维平, 游新冬, 吕学强
计算机科学. 2022, 49 (6): 305-312.  doi:10.11896/jsjkx.210500117
摘要 ( 344 )   PDF(3256KB) ( 627 )   
参考文献 | 相关文章 | 多维度评价
在领域机器翻译中,领域术语能否被正确翻译对翻译质量起着决定性作用,有效地将领域术语融入到神经机器翻译模型中,提升领域术语的翻译质量具有实际意义。文中提出了一种将新能源领域术语信息作为先验知识融入神经机器翻译中的方法,以新能源领域双语术语知识库构建的术语字典为媒介,提出并比较了两种不同的知识融入方式:1)术语替换,即在源语言端使用目标端术语替换源端术语;2)术语添加,即在源语言端将源端术语与目标端术语拼接,并在源语言端与目标语言端均使用作为特殊外部知识的标识符来标识目标端术语的开头与结尾。以新能源领域中英文双语对齐语料以及构建的中英文对齐术语库为数据基础进行了实验,结果表明,在测试集上,所提方法的BLEU值比基线实验分别高出6.38与6.55,证明了所提方法能有效地将领域术语知识融入到翻译模型中,提升了领域术语的翻译质量。
融合BERT词嵌入表示和主题信息增强的自动摘要模型
郭雨欣, 陈秀宏
计算机科学. 2022, 49 (6): 313-318.  doi:10.11896/jsjkx.210400101
摘要 ( 462 )   PDF(1784KB) ( 677 )   
参考文献 | 相关文章 | 多维度评价
自动文本摘要能够帮助人们快速筛选、辨别信息,掌握新闻关键内容,缓解信息过载问题。主流的生成式自动文摘模型主要基于编码器-解码器架构。针对解码器端在预测目标词时未充分考虑文本主题信息,并且传统的Word2Vec静态词向量无法解决一词多义问题的现状,提出了一种融合BERT词嵌入表示和主题信息增强的中文短新闻自动摘要模型。编码器端联合无监督算法获取文本主题信息并将其融入注意力机制中,提升了模型的解码效果;解码器端将BERT预训练语言模型抽取出的BERT句向量作为补充特征,以获取更多的语义信息,同时引入指针机制来解决词表外的单词问题,并利用覆盖机制有效抑制重复。在训练过程中,为了避免暴露偏差问题,针对不可微指标ROUGE采用强化学习方法来优化模型。在两个中文短新闻摘要数据集上的多组对比实验结果表明,该模型在ROUGE评价指标上有显著的提升,能有效融合文本主题信息,生成语句流畅、简明扼要的摘要。
基于BERT-GRU-ATT模型的中文实体关系分类
赵丹丹, 黄德根, 孟佳娜, 董宇, 张攀
计算机科学. 2022, 49 (6): 319-325.  doi:10.11896/jsjkx.210600123
摘要 ( 773 )   PDF(1897KB) ( 1100 )   
参考文献 | 相关文章 | 多维度评价
实体关系分类作为自然语言处理的基础任务,对知识图谱、智能问答、语义网构建等任务都起到了非常关键的作用。文中构建了BERT-GRU-ATT模型,以进行中文实体关系分类。为消除中文分词歧义对实体关系分类的影响,引入预训练模型BERT作为嵌入层,以较好地获得汉字的上下文信息;再通过双向门控循环单元捕获实体在句子中的长距离依赖,通过自注意力机制加强对关系分类贡献明显的字的权重,从而获得较好的实体关系分类结果。为了丰富中文实体关系分类语料,将SemEval2010_Task8英文实体关系评测语料翻译为中文1),该模型在此翻译语料上取得了75.46%的F1值,说明了所提模型的有效性。此外,所提模型在SemEval2010-task8英文数据集上F1值达到了80.55%,证明该模型对英文语料具有一定的泛化能力。
基于注意力门控图神经网络的文本分类
邓朝阳, 仲国强, 王栋
计算机科学. 2022, 49 (6): 326-334.  doi:10.11896/jsjkx.210400218
摘要 ( 560 )   PDF(2248KB) ( 571 )   
参考文献 | 相关文章 | 多维度评价
针对现有的文本分类工作在生成文本表示时通常忽略单词之间语义交互的问题,提出了一种新的基于注意力门控图神经网络的文本分类模型,有效地利用单词的语义特征并在充分语义交互的基础上提高了文本分类的准确率。首先,将每个输入文本转换为独立图结构数据并提取单词节点的语义特征;其次,利用注意力门控图神经网络对单词节点的语义特征进行交互和更新;然后,使用基于注意力机制的文本池化模块提取语义特征具有判别性的单词节点,以构建文本图表示;最后,基于文本图表示实现有效的文本分类。实验结果表明,所提方法在文本数据集Ohsumed,R8,R52和MR上的准确率分别达到了70.83%,98.18%,94.72%与80.03%,优于现有的方法。
基于随机加权三重Q学习的异策略最大熵强化学习算法
范静宇, 刘全
计算机科学. 2022, 49 (6): 335-341.  doi:10.11896/jsjkx.210300081
摘要 ( 233 )   PDF(2414KB) ( 612 )   
参考文献 | 相关文章 | 多维度评价
强化学习是机器学习中一个重要的分支,随着深度学习的发展,深度强化学习逐渐发展为强化学习研究的重点。因应用广泛且实用性较强,面向连续控制问题的无模型异策略深度强化学习算法备受关注。同基于离散动作的Q学习一样,类行动者-评论家算法会受到动作值高估问题的影响。在类行动者-评论家算法的学习过程中,剪切双Q学习可以在一定程度上解决动作值高估的问题,但同时也引入了一定程度的低估问题。为了进一步解决类行动者-评论家算法中的高低估问题,提出了一种新的随机加权三重Q学习方法。该方法可以更好地解决类行动者-评论家算法中的高低估问题。此外,将这种新的方法与软行动者-评论家算法结合,提出了一种新的基于随机加权三重Q学习的软行动者-评论家算法,该算法在限制Q估计值在真实Q值附近的同时,通过随机加权方法增加Q估计值的随机性,从而有效解决了学习过程中对动作值的高低估问题。实验结果表明,相比SAC算法、DDPG算法、PPO算法与TD3算法等深度强化学习算法,SAC-RWTQ算法可以在gym仿真平台中的多个Mujoco任务上获得更好的表现。
信息安全
传播路径树核学习的微博谣言检测方法
徐建民, 孙朋, 吴树芳
计算机科学. 2022, 49 (6): 342-349.  doi:10.11896/jsjkx.210400096
摘要 ( 232 )   PDF(2920KB) ( 809 )   
参考文献 | 相关文章 | 多维度评价
微博等在线社交平台的迅猛发展,促进了各种谣言信息的广泛传播,进而给社会秩序带来了潜在的威胁。微博谣言检测能够有效遏制谣言的传播,对净化网络环境、维护社会安定具有重要意义。针对传统谣言检测模型仅考虑用户、内容、传播统计等特征,忽略了谣言传播过程中用户的影响力、情感反馈等特征随转发和评论关系变化而变化的结构问题,提出了一种基于微博信息传播树的路径树核谣言检测模型。所提模型将用户的影响力、情感反馈和内容等特征嵌入传播树的节点中,通过计算传播树中从根节点到叶子节点的路径相似度,得到微博信息传播树结构之间的相似度,进而使用基于传播路径树核的支持向量机实现对微博谣言的检测。实验结果显示,所提模型的准确率达到93.5%,其效果优于未考虑传播路径结构特征的谣言检测模型。
一种基于顺序和频率模式的系统调用轨迹异常检测框架
魏辉, 陈泽茂, 张立强
计算机科学. 2022, 49 (6): 350-355.  doi:10.11896/jsjkx.210500031
摘要 ( 234 )   PDF(1887KB) ( 484 )   
参考文献 | 相关文章 | 多维度评价
针对现有的基于系统调用的异常入侵检测方法使用单一轨迹模式无法准确反映进程行为的问题,基于系统调用轨迹的顺序和频率模式对进程行为进行建模,设计了一个数据驱动的异常检测框架。该框架可以同时检测系统调用轨迹的顺序异常和定量异常,借助组合窗口机制,通过满足离线训练和线上检测对提取轨迹信息的不同需求,可以实现离线细粒度学习和线上异常实时检测。在ADFA-LD入侵检测标准数据集上进行了针对未知异常检测性能的对比实验,结果表明,相比4类传统机器学习方法和4类深度学习方法,该框架的综合检测性能提高了10%左右。
基于海洋水声信道的密钥协商方案
梁珍珍, 徐明
计算机科学. 2022, 49 (6): 356-362.  doi:10.11896/jsjkx.210400097
摘要 ( 323 )   PDF(2594KB) ( 482 )   
参考文献 | 相关文章 | 多维度评价
针对海洋环境不确定性导致水声信道容易受到各种威胁和攻击的问题,提出了一种基于海洋水声信道的密钥协商方案。该方案首先对海洋环境的不确定性进行建模,构造计算噪声、多径、多普勒参数表达式,提出了基于Rényi熵的水声信道干扰因子概念;其次,基于Twisted Edwards椭圆曲线构造Hash函数,进行身份的认证与初始密钥的提取;然后,使用分段初始密钥的典型序列作为初始化种子,生成分段Toeplitz矩阵,并对Toeplitz矩阵与初始密钥的矩阵乘法采用分块运算生成标签,进行初始密钥的安全传输;最后,初始密钥经再次Hash,实现了保密增强并生成了最终的安全密钥。通过信息理论证明了所提方案的正确性、健壮性和保密性,并得出了敌手主动攻击成功概率的上界。仿真结果表明,当初始信息量为50 000 bit时,敌手主动攻击成功率的上界为4.3×10-23,密钥生成率为631 bit/s。与现有方案相比,所提方案在密钥生成率和误比特率方面具有明显的优势。