1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2023年第7期, 刊出日期:2023-07-15
  
封面下载
目录
第50卷第7期目录
计算机科学. 2023, 50 (7): 0-0. 
摘要 ( 178 )   PDF(294KB) ( 280 )   
相关文章 | 多维度评价
计算机软件
自主机器人的伴随观察模式及其软件实现框架
薛元洲, 杨硕, 毛新军
计算机科学. 2023, 50 (7): 1-9.  doi:10.11896/jsjkx.221200020
摘要 ( 330 )   PDF(1775KB) ( 2054 )   
参考文献 | 相关文章 | 多维度评价
自主机器人是一类运行于开放环境下、可自主决策和执行其自主行为的信息物理系统,它根据任务需求进行决策产生行为策略并调度执行。环境状态的动态变化性常常导致规划的行为策略不再适用于当前环境,使得行为执行的结果不符合预期,从而影响自主机器人的任务实现。上述问题对自主机器人软件的行为决策和软件构造均提出了更高的要求。一方面,自主机器人需在行为策略执行过程中加强对环境状态及其变化的观察,并基于观察的结果及时、灵活地调整行为决策,提升机器人的观察模式及行为决策算法的复杂度。另一方面,上述观察、决策、执行行为的复杂交互提升了软件构件抽象及数据交互的复杂性,如何抽象机器人的传感、决策、效应等软构件功能,并提供相适配的软件架构,成为自主机器人软件构造面临的重要挑战。针对上述挑战,首先提出自主机器人伴随行为的思想,显式定义观察与效应行为之间的伴随交互关系,根据行为执行不同阶段提出前提伴随观察模式和目标伴随观察模式,以提升自主机器人对环境变化的感知能力和决策调整能力。其次,开发了一款基于多智能体系统的自主机器人软件开发框架AutoRobot,该框架将机器人的传感器、效应器及规划器抽象为一组自主的软件智能体,智能体间通过自主决策和协同实现上述伴随观察模式。AutoRobot框架针对不同角色智能体设计和封装了一组可重用的软件组件,可有效支持自主机器人软件的复用和高效开发。最后,开展了仿真环境下的实验分析,通过与ROSPlan和DESPOT两种自主机器人任务规划和执行方法进行对比,验证了基于伴随观察模式的任务规划与执行的高效性和有效性。
针对缺陷根源定位的测试用例生成技术
杜昊, 王允超, 燕宸毓, 李星玮
计算机科学. 2023, 50 (7): 10-17.  doi:10.11896/jsjkx.220700128
摘要 ( 242 )   PDF(2014KB) ( 1925 )   
参考文献 | 相关文章 | 多维度评价
缺陷根源定位是软件调试的重要阶段,基于频谱的缺陷根源定位方法是软件自动化调试研究中的热点问题,但其定位效果很大程度上取决于测试用例的质量。不同类型软件的测试输入通用性差,随机生成的测试输入则存在过拟合或混杂项过多的问题,导致分析结果误差较大,致使目前该类技术的应用场景有限。针对测试用例生成问题,提出了基于崩溃路径的分阶段探索方法Dgenerate,并实现原型工具Dloc。首先利用二进制插桩手段在程序执行输入阶段于基本块中插桩路径信息,根据此信息将原始测试输入划分为普通型和引导型;然后利用动态能量调度算法探索崩溃相关路径生成高质量的测试用例;最后在原始程序中执行测试用例并追踪执行时信息,通过统计分析的方法有效地定位到程序缺陷根源的位置。文中选取了6个不同类型软件中的15个真实CVE漏洞进行实验,结果显示Dloc生成的测试用例与已有技术相比可以将定位效率平均提升75%,并且Dloc能够以87%的准确性在评分前五的位置中输出缺陷根源相关代码片段,验证了所提方法系统的可行性和实用性。
基于Web应用前端行为模型的测试用例生成
刘子文, 虞莉娟, 苏义鑫, 赵耀, 石柱
计算机科学. 2023, 50 (7): 18-26.  doi:10.11896/jsjkx.220900143
摘要 ( 269 )   PDF(2319KB) ( 1849 )   
参考文献 | 相关文章 | 多维度评价
基于Web应用前端模型的测试用例生成是Web应用测试的重要过程,但现有的大多数针对Web应用的模型都只关注Web页面及其事件,忽略了事件触发条件和后续动作。为了更准确地描述现代Web应用程序的动态行为,文中定义了一种新的Web应用前端行为模型(Front-end Behavior Model,FBM)。由于模型中迁移的触发条件可能存在内部变量,即迁移之间存在依赖关系,使得生成的测试用例不能按照输入序列执行,从而影响测试效果。为此,提出了一种优化分组遗传算法来实现可执行迁移路径FTP的自动生成,该算法考虑FTP生成问题的特点,对染色体初始化和适应度函数做出合理的设计,加入修补算子调整个体长度生成了满足迁移覆盖的FTP,并且通过引入自适应的遗传算子和模拟退火接收机制来减少迭代次数,从而加快求解速度。实验结果表明,该算法能够在更高的求解效率的基础上有效保证迁移路径的可行性以及覆盖率。
基于规则的高风险动态类型代码检测研究
陈芝菲, 郝洋, 陈林, 肖亮
计算机科学. 2023, 50 (7): 27-37.  doi:10.11896/jsjkx.221100244
摘要 ( 210 )   PDF(1846KB) ( 1804 )   
参考文献 | 相关文章 | 多维度评价
近年来,Python的应用呈爆炸式增长。虽然Python的动态类型特性为开发人员提供了强大的编程抽象能力,但同样也导致代码库中聚集了与类型相关的缺陷。为了减少软件代码中的类型缺陷,文中分析并检测了6种可能导致类型缺陷的高风险动态类型代码。首先,形式化地描述了每种类型的高风险动态类型代码的规则;然后,提出了一种基于规则的高风险动态类型代码检测技术;最后,对25个Python开源软件项目(总规模超过945kLOC)展开了实验评估。结果表明,高风险动态类型代码在开源软件项目中广泛存在,尤其是单个Python函数中可能存在多处变量类型不一致的代码,而基于规则的检测技术在Python软件项目中具有较高的准确率和较好的性能表现。针对高风险动态类型代码的检测技术及实验结论,将为动态类型特性的良性发展以及软件项目的质量保障提供有力的参考和支持。
数据库&大数据&数据科学
基于LDPC读延迟的刷新和副本结合策略优化方案
张耀方, 李培轩, 谢平
计算机科学. 2023, 50 (7): 38-45.  doi:10.11896/jsjkx.220900179
摘要 ( 133 )   PDF(2570KB) ( 270 )   
参考文献 | 相关文章 | 多维度评价
针对闪存存储器的密度增大和容量增加导致可靠性下降的问题,提出了一种基于LDPC读延迟的刷新和副本结合策略优化方案。通常,原始策略是在闪存存储器上加一个LDPC码模块,使用硬解码和软解码对数据进行纠错。而传统的刷新策略是在原始策略的基础上,在LDPC软解码未能纠错时,使用刷新策略对其进行纠错。本方案基于LDPC软解码7个量化级别的特性,并以此为判定条件,采用分析对比的方法确定刷新的条件是量化级别到达3,副本的条件是级别达到5,将两种方式合理地应用在LDPC软解码方式中。与前两种策略相比,所提方法缩短了闪存存储器的平均响应时间,在一定程度上提升了闪存存储器的读取性能。在模拟器disksim+ssd的扩展平台上进行仿真,实验结果表明,相比原始策略,该方案平均响应时间均值降低了10%;与传统的刷新策略相比,延长了闪存存储器的寿命。
基于对比学习的疾病诊断预测算法
王明霞, 熊贇
计算机科学. 2023, 50 (7): 46-52.  doi:10.11896/jsjkx.230200216
摘要 ( 320 )   PDF(2321KB) ( 420 )   
参考文献 | 相关文章 | 多维度评价
疾病诊断预测旨在利用电子健康数据建模疾病进展模式,预测患者未来的健康状况,其在辅助临床决策、医疗保健服务等领域得到广泛应用。为了进一步发掘就诊记录中有价值的信息,提出了一种基于对比学习的疾病诊断预测算法。对比学习通过衡量样本间相似度为模型提供自监督训练信号,提升模型的信息捕捉能力。所提算法通过对比训练挖掘相似患者之间的共性知识,增强模型学习患者表征的能力;为了捕获更加全面的共性信息,还进一步挖掘了目标患者相似群体的信息作为辅助信息刻画患者健康状态。在公开数据集上的实验结果表明,相比Retain,Dipole,LSAN和GRASP算法,所提算法在再入院预测任务的AUROC和AUPRC指标上分别提升2.9%和8.1%以上,在诊断预测任务的Recall@10和MAP@10指标上分别提升2.1%和1.8%以上。
双编码半监督异常检测模型
李辉, 李文根, 关佶红
计算机科学. 2023, 50 (7): 53-59.  doi:10.11896/jsjkx.220900027
摘要 ( 176 )   PDF(2190KB) ( 341 )   
参考文献 | 相关文章 | 多维度评价
异常检测是机器学习领域广泛研究的一个热点问题,对于工业生产、食品安全、疾病监测等都具有重要作用。当前最新的异常检测方法多基于少量可用的有标记样本和大量无标记样本联合训练半监督检测模型。然而,现有的半监督异常检测模型多采用深度学习框架,在低维数据集上由于缺少足够多的特征信息,难以学习到准确的数据边界,检测性能不佳。针对该问题,提出了双编码半监督异常检测模型(Dually Encoded Semi-supervised Anomaly Detection,DE-SAD),充分利用可获得的少部分有标记数据结合大量无标记数据进行半监督学习,通过双编码阶段约束模型学习更准确的正常数据隐含流形分布,有效拉大了正常数据和异常数据的差距。DE-SAD在来自不同领域的多个异常检测数据集上都表现出优越的异常检测性能,在低维数据上的检测性能尤为突出,其AUROC指标相比当前最优的异常检测方法最高提升了4.6%。
多因素特征融合的EBSN活动推荐方法
单晓欢, 宋瑞, 李海海, 宋宝燕
计算机科学. 2023, 50 (7): 60-65.  doi:10.11896/jsjkx.220900036
摘要 ( 296 )   PDF(2508KB) ( 265 )   
参考文献 | 相关文章 | 多维度评价
基于活动的社交网络(Event-based Social Network,EBSN)是一种新型的复杂异构社交网络,其中的个性化活动推荐具有一定的应用价值。近年来,随着EBSN的快速发展,传统方法利用数据挖掘技术有效解决了活动推荐的信息过载问题。然而,仅利用单特征属性或少量线性组合进行计算,且预定义固定权重将降低活动推荐的准确度,此外大多数方法忽略了用户反馈信息对后续推荐的影响。针对上述问题,提出了一种两阶段构成的多因素特征融合的活动推荐方法。查询预处理阶段,将EBSN中的活动、历史用户及其之间的关系抽象为有向异构图,并提取节点及边的特征信息进行辅助存储;利用该辅助数据过滤无效节点及边,进而获得相对较小的候选集;根据查询语境,将查询语义转化为查询图。在线查询阶段,融合潜在好友关系、基于活动的协同过滤以及用户对活动的兴趣这3方面特征进行活动推荐,并接收用户是否接受活动的反馈信息作为后续推荐的参考因素。在真实数据集和模拟数据集上进行了大量实验,结果表明所提方法相比对比算法在EBSN中活动推荐的精确度和用户的满意度方面更优。
基于变分持续贝叶斯元学习的推荐算法
朱文韬, 刘威, 梁上松, 朱怀杰, 印鉴
计算机科学. 2023, 50 (7): 66-71.  doi:10.11896/jsjkx.220900125
摘要 ( 209 )   PDF(2130KB) ( 319 )   
参考文献 | 相关文章 | 多维度评价
元学习方法近年被引入推荐系统以缓解冷启动问题。现有元学习算法只能提高算法处理一组静态分布的数据集(任务)的能力。当面对多个服从非平稳分布的数据集时,现有模型往往会出现负知识转移以及灾难性遗忘问题,导致算法推荐性能大幅下降。探索了基于变分持续贝叶斯元学习(Variational Continuous Bayesian Meta-Learning,VC-BML)的推荐算法。首先,算法假设元参数服从动态混合高斯模型,使其具有更大的参数空间,提高了模型适应不同任务的能力,缓解了负知识转移问题。然后,VC-BML的任务集群数量由中国餐馆过程(Chinese Restaurant Process,CRP)来灵活确定,使得模型在不同的混合分量中存储不同任务分布的知识,并在类似任务出现时调用这些知识,有助于缓解传统算法中的灾难性遗忘问题。为了估计模型参数的后验概率,算法采用了一种更稳健的结构化变分推理方法来近似后验值,以避免遗忘知识。最后,VC-BML在4个非平稳分布的数据集上的表现均优于基准算法。与基于点估计的基准算法相比,VC-BML提高了模型的稳健型,有助于缓解灾难性遗忘问题。
基于对偶流形重排序的无监督特征选择算法
梁云辉, 甘舰文, 陈艳, 周芃, 杜亮
计算机科学. 2023, 50 (7): 72-81.  doi:10.11896/jsjkx.221000143
摘要 ( 299 )   PDF(4183KB) ( 287 )   
参考文献 | 相关文章 | 多维度评价
在许多数据分析任务中,经常会遇到高维数据。特征选择技术旨在从原始高维数据中找到最具代表性的特征,但由于缺乏类标签信息,相比有监督场景,在无监督学习场景中选择合适的特征困难得多。传统的无监督特征选择方法通常依据某些准则对样本的特征进行评分,在这个过程中样本是被无差别看待的。然而这样做并不能完全捕捉数据的内在结构,不同样本的重要性应该是有差异的,并且样本权重与特征权重之间存在一种对偶关系,它们会互相影响。为此,提出了一种基于对偶流形重排序的无监督特征选择算法(Unsupervised Feature Selection Algorithm based on Dual Manifold Re-Ranking,DMRR),分别构建不同的相似性矩阵来刻画样本与样本、特征与特征、样本与特征的流形结构,并结合样本与特征的初始得分进行流形上的重排序。将DMRR与3种原始无监督特征选择算法以及2种无监督特征选择后处理算法进行比较,实验结果表明样本重要性信息、样本与特征之间的对偶关系有助于实现更优的特征选择。
基于压缩感知的相关性数据填补方法
任兵, 郭艳, 李宁, 刘存涛
计算机科学. 2023, 50 (7): 82-88.  doi:10.11896/jsjkx.220600209
摘要 ( 108 )   PDF(2237KB) ( 227 )   
参考文献 | 相关文章 | 多维度评价
数据缺失现象在数据的采集和传输过程中经常发生,而对数据集中缺失数据的不当填补,会对后续的数据挖掘工作产生不利的影响。为了更有效地对缺失数据集进行填补,针对相关性数据,提出了一种基于压缩感知的缺失数据填补方法。首先,将缺失数据填补问题转化为压缩感知框架下的稀疏向量恢复问题;其次,针对数据的相关性特点构造了专门的稀疏表示基,从而能够更好地实现数据的稀疏化;最后,提出了一种快速迭代加权阈值算法,在传统的快速迭代收缩阈值算法的基础上引入了一种新的加权因子及重启动策略,提高了算法的收敛性能和数据的重构精度。仿真结果表明,所提算法能够高效地填补缺失数据,与传统的快速迭代收缩阈值算法相比,重构成功率和重构速度都得到了提升。同时,在数据稀疏变换效果较差的情况下,所提算法仍然能够完成对缺失数据集的填补,具有更好的鲁棒性。
基于约束图正则的块稀疏对称非负矩阵分解
刘威, 邓秀勤, 刘冬冬, 刘玉兰
计算机科学. 2023, 50 (7): 89-97.  doi:10.11896/jsjkx.220500050
摘要 ( 199 )   PDF(3278KB) ( 248 )   
参考文献 | 相关文章 | 多维度评价
现有的基于对称非负矩阵因式分解(Symmetric Nonnegative matrix Factorization,SymNMF)算法大都仅依赖初始数据构造亲和矩阵,并且一定程度上忽视了样本有限的成对约束信息,无法有效区分不同类别的相似样本以及学习样本的几何特征。针对以上问题,提出了基于约束图正则的块稀疏对称非负矩阵分解(Block Sparse Symmetric Nonnegative Matrix Factorization Based on Constrained Graph Regularization,CGBS-SymNMF)。首先,通过先验信息构造约束图矩阵,用于指导类别指示矩阵区分高相似度的不同类别样本;然后,引入PCP-SDP(Pairwise Constraint Propagation by Semi-definite Programming)方法,利用成对约束学习一个新的样本图映射矩阵;最后,利用“勿连”约束构造不相似矩阵,用于引导一个块稀疏正则项,以增强模型抗噪能力。实验结果表明,所提算法具有更高的聚类精确度和稳定性。
探索站点时空移动模式:长短期交通预测框架
沈哲辉, 王开来, 孔祥杰
计算机科学. 2023, 50 (7): 98-106.  doi:10.11896/jsjkx.220900109
摘要 ( 242 )   PDF(2971KB) ( 254 )   
参考文献 | 相关文章 | 多维度评价
随着智慧城市系统的技术发展与城市时空数据的急剧增加,公共服务需求也日益受到重视。公共交通作为城市交通中至关重要的组成部分,同样面临着巨大的挑战,并且交通网络的时空预测任务往往是解决各种交通问题的核心一环。交通中的移动模式可以体现城市人群的出行行为及其规律,大多数交通预测任务研究中,移动模式的重要性经常被忽视。针对现有工作的问题,提出了一种多模式的交通预测框架(MPGNNFormer),使用基于图神经网络的深度聚类的方法提取站点的移动模式,并设计了一种基于Transformer的时空预测模型,在充分利用时间依赖关系和空间依赖关系的同时,提高了计算效率。在现实的公交车数据集上展开了一系列实验以进行评估和测试,包括移动模式的分析和预测结果对比,实验结果证明了所提方法在交通网络的长短期交通预测上的有效性。最后讨论了所提方法可扩展性。
计算机图形学&多媒体
面向自动驾驶的三维目标检测综述
霍威乐, 荆涛, 任爽
计算机科学. 2023, 50 (7): 107-118.  doi:10.11896/jsjkx.220700090
摘要 ( 327 )   PDF(2785KB) ( 385 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着自动驾驶行业的蓬勃发展,作为感知系统核心的三维目标检测技术受到越来越多的关注,已成为当前热门的研究方向。同时,深度学习的广泛应用,使得最近的三维目标检测技术有了很大的突破,大批优秀的算法涌现。文中系统地总结了面向自动驾驶领域的三维目标检测方法,并按传感器类型将现有的算法分为3类,即基于图像的三维目标检测、基于LiDAR的三维目标检测和基于多传感器的三维目标检测;其次,详细分析了3种方法的优缺点,并对基于LiDAR的三维目标检测算法进行了深入调研和细分;然后,介绍了自动驾驶领域常用的三维目标检测数据集,包括KITTI,nuScenes和Waymo Open Dataset,并对比了最新的三维目标检测算法在不同数据集上的性能表现;最后探讨了三维目标检测技术未来的发展方向。
构造曲率单调的组合二次h-Bézier曲线
李林, 解滨, 韩力文
计算机科学. 2023, 50 (7): 119-128.  doi:10.11896/jsjkx.220800024
摘要 ( 258 )   PDF(2949KB) ( 241 )   
参考文献 | 相关文章 | 多维度评价
h-Bézier曲线(h>0)又被称为Pólya曲线,它具有与经典Bézier曲线(h=0)一致的诸多优良性质。为此,文中研究了二次h-Bézier曲线具有单调曲率的充要条件及其构造算法。首先,讨论二次h-Bézier曲线曲率极值的存在性,得到曲线具有单调曲率的充要条件;通过引入曲率临界圆,给出判断二次h-Bézier曲线曲率单调性的几何方法,即检查二次h-Bézier曲线的中间控制点是否在曲率临界圆上或圆内;并由此得到构造具有单调曲率的二次h-Bézier曲线的两种算法,通过调节形状参数h可保证曲线具有单调递减或单调递增的曲率。其次,研究两条二次h-Bézier曲线的光滑拼接,基于对二次h-Bézier曲线性质的分析,选择第二条曲线在肩点处与第一条曲线的端点实现拼接,得到G2拼接的充要条件;讨论参数对拼接曲线形状的影响。最后,构造出同时满足G2拼接、曲率单调递减(或单调递增)的组合二次h-Bézier曲线。数值实例显示了组合二次h-Bézier曲线的造型优势和灵活性。
语义风格一致的任意图像风格迁移
颜明强, 余鹏飞, 李海燕, 李红松
计算机科学. 2023, 50 (7): 129-136.  doi:10.11896/jsjkx.220700008
摘要 ( 197 )   PDF(5451KB) ( 310 )   
参考文献 | 相关文章 | 多维度评价
图像风格迁移的目标是通过将目标图像风格迁移到给定的内容图像来合成输出图像。目前已有大量关于图像风格迁移的工作,但这些方法的风格化结果忽略了内容图像不同语义区域的流形分布,同时,大多数方法使用全局统计数据(如Gram矩阵或协方差矩阵)来实现风格特征到内容特征的匹配,不可避免地存在内容丢失、风格泄漏和伪影的问题,从而产生不一致的风格化结果。针对以上问题,提出了一个基于自注意力机制的渐进式流形特征映射模块(MFMM-AM),用于协调一致地匹配相关内容和风格流形之间的特征;然后通过在图像特征空间中应用精确直方图匹配(EHM)来实现风格和内容特征图的高阶分布匹配,减少了图像信息的丢失;最后,引入了两个对比性损失,利用大规模风格数据集的外部信息来学习人类感知的风格信息,使风格化图像的色彩分布和纹理图案更加合理。实验结果表明,与现有典型的任意图像风格迁移方法相比,所提网络极大地弥合了人类创作的艺术品和人工智能创作的艺术品之间的鸿沟,可以生成视觉上更加和谐和令人满意的艺术图像。
面向单一背景的改进RetinaNet目标检测方法研究
周波, 江佩峰, 段昶, 罗月童
计算机科学. 2023, 50 (7): 137-142.  doi:10.11896/jsjkx.220500066
摘要 ( 340 )   PDF(2455KB) ( 236 )   
参考文献 | 相关文章 | 多维度评价
基于深度学习的目标检测算法在工业缺陷检测领域得到了充分推广与应用,但少有适用于工业检测场景中单一背景的算法。文中以工业检测场景中具有大量简单重复背景为出发点,对RetinaNet算法进行了如下改进:1)引入难负样本挖掘策略,减小了大量简单重复负样本对对模型拟合正样本的影响;2)设计了自适应忽略样本选择策略,避免与正样本交并比高的样本混入负样本而混淆模型训练;3)简化了RetinaNet的分类子网络,降低了模型改进后的过拟合风险。在公开的PCB缺失孔数据集及自建的LED气泡数据集上,相比RetinaNet算法,改进后的方法在召回率上分别提升了14.1%和1.8%,在精确率上分别提升了3.6%和0.4%,表明改进后的方法能显著提升单一背景下的目标检测水平。
基于视频多帧融合的医学超声图像超分辨率重建方法
赵冉, 袁家斌, 范利利
计算机科学. 2023, 50 (7): 143-151.  doi:10.11896/jsjkx.220700232
摘要 ( 192 )   PDF(2320KB) ( 329 )   
参考文献 | 相关文章 | 多维度评价
医学超声成像是临床诊断中应用最广泛的成像方式之一。目前超声图像普遍存在分辨率和对比度较低的问题,并且成像过程易受噪声污染。图像超分辨率重建技术被广泛用于改善超声图像的质量。然而,已有的研究工作缺乏对超声视频帧之间互补信息的充分利用,因此效果并不理想。针对此问题,提出了一种基于视频多帧融合的医学超声图像超分辨率重建方法。首先,构建了一个基于卷积神经网络的无监督多帧融合模型,该模型通过对连续的多帧图像进行特征融合,得到具有丰富信息的融合特征图像;然后,建立一个基于无数据知识蒸馏的轻量级图像超分辨率重建模型,通过训练融合特征图像得到教师超分辨率网络,利用训练好的教师网络和生成对抗网络获取的训练数据得到轻量级学生超分网络,最终得到高质量的医学超声图像;最后,在大型超声数据集上进行实验,采用两种图像客观评价指标以及图像分类任务进行评估。结果表明,所提方法与8种已有的图像超分辨率重建方法相比,在提高超声图像分辨率的同时,获得了包含更多信息且具有更高对比度的超声图像。此外,所提方法得到的超分辨率图像在分类网络的识别准确率可达到97.30%,明显优于其他方法,可提高临床诊断效率与准确性。
基于相机朝向变化的增量式位姿图分段算法
范涵奇, 王劭靖
计算机科学. 2023, 50 (7): 152-159.  doi:10.11896/jsjkx.220400166
摘要 ( 110 )   PDF(3702KB) ( 262 )   
参考文献 | 相关文章 | 多维度评价
位姿图优化是估计相机轨迹过程中减少累积误差的重要方法,但随着相机的不断运动,位姿图的规模会不断增大导致优化速度下降,使得轨迹估计难以应用于AR/VR(Augmented Reality/Virtual Reality)等实时性要求较高的领域。针对此问题,文中提出了一种基于相机朝向变化的增量式位姿图分段算法。所提算法能够将位姿图在相机发生朝向变化较大的时刻进行分段,从而只对这些朝向变化较大的相机进行位姿图优化,以有效减小位姿图优化的规模,提高优化速度。针对其余未进行位姿图优化的每个相机,分别将其所在轨迹段的起始相机和终止相机作为参考相机,将根据不同参考相机估计出的不同位姿进行加权平均,从而求解出相机的最终位姿,既避免了非线性优化的大量计算,又降低了噪声的影响,达到了较高的精度。在EuRoC,TUM和KITTI数据集上进行了实验,结果表明,所提算法在减小位姿图优化规模的基础上保证了相机轨迹的精度。
基于反事实注意力学习的无监督域自适应行人再识别
代雪松, 李小红, 张晶晶, 齐美彬, 刘一敏
计算机科学. 2023, 50 (7): 160-166.  doi:10.11896/jsjkx.220600153
摘要 ( 359 )   PDF(2051KB) ( 348 )   
参考文献 | 相关文章 | 多维度评价
现有的无监督域自适应行人重新识别方法大多是将基于聚类的伪标签预测与特征微调相结合。由于域间存在差异,聚类过程中产生了不正确的伪标签,使伪标签存在一定的不可靠性,误导特征表示学习,从而影响域自适应模型的性能。基于此,首先设计一个新颖的基于反事实注意力学习的无监督域自适应网络,通过衡量注意力学习的质量对训练过程进行指导优化,促使模型关注更加精准的注意力特征,减少噪声伪标签的生成;其次提出了一种基于不确定性评估的噪声样本优化方法,通过测量基于平均教师方法的学生模型和教师模型输出特征之间的不一致性水平,将其作为目标域行人样本的不确定性分布,进而利用样本的不确定性对网络总体损失的各个部分进行合理加权,修正具有高不确定性的样本对模型总体损失的错误影响,进一步提升目标域的识别性能。实验数据表明,所提方法在源域DukeMTMC-reID/Market-1501和目标域Market-1501/DukeMTMC-reID上的实验结果都有显著提高,mAP和Rank-1分别达到了82.9%,93.6%和71.8%,84.4%。
人工智能
自动推理技术在求解组合数学难题中的研究进展
黄沛, 刘明昊, 马菲菲, 张健
计算机科学. 2023, 50 (7): 167-175.  doi:10.11896/jsjkx.221000251
摘要 ( 234 )   PDF(1908KB) ( 306 )   
参考文献 | 相关文章 | 多维度评价
自动推理是一种以符号演算的方式来自动模拟人类逻辑推理能力的技术,其总体目标是利用计算机构建一个将不同形式的推理机械化的系统。虽然该领域的理论框架尚未实现对人类全部推理能力的模拟,但该领域的发展已经可以帮助研究人员解决一些数学和逻辑领域的开放性问题,并提供了计算科学中的重要应用。文中简要回顾了利用自动推理技术处理组合数学开放性难题时的代表性方法,重点梳理了该领域的国内外最新进展,分析了各种方法的优势与不足,介绍了近年来出现的增强自动推理结果可信性的技术方法,并探讨了未来的研究方向和面临的挑战。
多约束条件下多无人机协同任务规划问题分析及求解方法综述
胡嘉薇, 贾泽群, 孙延涛, 刘强
计算机科学. 2023, 50 (7): 176-193.  doi:10.11896/jsjkx.220700066
摘要 ( 206 )   PDF(2983KB) ( 539 )   
参考文献 | 相关文章 | 多维度评价
多无人机协同任务规划是现阶段无人机集群智能化发展的关键技术,其中任务分配与航迹规划是无人机任务规划技术的核心部分。鉴于规划要素众多且相互耦合的研究现状,寻找降低问题耦合度和复杂度的求解策略至关重要。首先,文中从问题建模出发,建立了任务规划问题通用模型,总结归纳出常见约束条件和评价指标,并着重分析问题求解框架;其次,从集中式和分布式角度详细阐述了任务分配问题的常见模型与求解算法;再次,论述了单机路径规划和路径平滑方法,并针对多机时空协同约束归纳了多机间协同方法;此外,从约束耦合、子问题耦合、分层结构耦合角度整理归纳了求解过程中存在的复杂耦合因素,并重点探讨了解耦策略;最后,讨论了未来多无人机协同任务规划问题的发展趋势。
基于Kriging模型的改进型NSGA-III解决昂贵优化问题
耿焕同, 宋飞飞, 周征礼, 徐小涵
计算机科学. 2023, 50 (7): 194-206.  doi:10.11896/jsjkx.220600186
摘要 ( 276 )   PDF(3460KB) ( 307 )   
参考文献 | 相关文章 | 多维度评价
在许多实际的优化问题中,为了进行适应度评估,其物理实验或数值仿真代价高昂,这给大多数现有的多目标进化算法(EAs)带来了巨大挑战。因此,文中提出了一种基于克里金模型辅助的改进参考点引导进化的优化算法,用于解决昂贵的超多目标优化问题。具体而言,根据种群的空间分布特征,借助关联点的熵差信息筛选参考点引导进化,以达到探索与开发的平衡。所提出的代理辅助进化算法(SAEA)使用克里金法来逼近每个目标函数,而无需进行原始昂贵的函数评估从而降低了计算成本。模型管理中采用一种纯指标填充采样准则,借助收敛性、多样性指标确定适当采样策略并使用昂贵目标函数对采样解进行真实评估以提升种群收敛与算法优化的效率。对具有3个以上目标的80个DTLZ与WFG基准测试问题进行了对比研究,证明了此算法的有效性和可行性。
基于对比预测的自监督动态图表示学习方法
蒋林浦, 陈可佳
计算机科学. 2023, 50 (7): 207-212.  doi:10.11896/jsjkx.220500093
摘要 ( 347 )   PDF(1903KB) ( 303 )   
参考文献 | 相关文章 | 多维度评价
近年来,以图对比学习为代表的图自监督学习已成为图学习领域的热点研究问题,该类学习范式不依赖于节点的标签并具有良好的泛化能力。然而,大多数图自监督学习方法采用静态图结构设计学习任务,如对比图的结构学习节点级或者图级的表示等,而未考虑图随时间的动态变化信息。为此,文中提出了一种基于对比预测的自监督动态图表示学习方法(DGCP),利用对比损失引导嵌入空间捕获对预测未来图结构最有用的信息。首先,利用图神经网络对每个时间快照图编码,得到对应的节点表示矩阵;然后,使用自回归模型预测下一时间快照图中的节点表示;最后,利用对比损失和滑动窗口机制对模型进行端到端的训练。在真实图数据集上进行实验,结果表明,DGCP在链接预测任务上的表现优于基准方法。
基于时序知识图谱嵌入的短期地铁客流量预测
毛慧慧, 赵小乐, 杜圣东, 滕飞, 李天瑞
计算机科学. 2023, 50 (7): 213-220.  doi:10.11896/jsjkx.220600120
摘要 ( 229 )   PDF(2238KB) ( 401 )   
参考文献 | 相关文章 | 多维度评价
短期地铁客流量预测任务是城市智能地铁运营工作的重要组成部分,旨在预测未来短时间内地铁站点的客流量。针对现有方法未能充分利用站点的流入流出客流量信息的问题,提出了一种基于时序知识图谱嵌入(Temporal Knowledge Graph Embedding)结合残差网络(ResNet)和长短期记忆网络(LSTM)的短期地铁客流量预测方法,简称TKG-ResLSTM。首先,基于地铁客流量数据构建地铁客流量时序知识图谱,并使用时序知识图谱嵌入技术从中获取地铁站点的动态客流量模式。然后,将抽取出的动态客流量模式转换成动态相似矩阵,应用到基于深度学习的地铁客流量预测框架中完成地铁客流量预测任务。最后,利用北京地铁和A市地铁客流量数据集,分别在10 min,15 min和30 min的时间间隔下进行实验评估。结果表明TKG-ResLSTM能够有效地抽取出地铁站点的动态客流量模式,在不使用外部信息的情况下,相比ResLSTM,TKG-ResLSTM在北京地铁数据集10min时间间隔下的预测均方根误差降低了0.41。
基于信息熵-切分概率模型的新词发现方法
祝钰莹, 郭燕, 万亿兆, 田凯
计算机科学. 2023, 50 (7): 221-228.  doi:10.11896/jsjkx.220700074
摘要 ( 176 )   PDF(2211KB) ( 272 )   
参考文献 | 相关文章 | 多维度评价
新词发现是中文自然语言处理的基本任务,对于提升各种下游任务的性能至关重要。文中提出了一种基于信息熵-切分概率模型的新词发现方法,该方法首先基于信息熵从待处理文本中生成候选词集,然后对候选词集进行切分概率计算,从而筛选出真正的新词。针对有无待处理文本相关的标注语料,提出了两种不同的模型。在缺少待处理文本相关标注语料的情况下,使用通用的分词基准数据集训练了多标签Transformer-CRF模型;在具有专业标注语料的情况下,则引入了基于键值的记忆神经网络,以充分融合词语成词信息。实验结果表明,多标签Transformer-CRF模型在Top900词中法律相关词的MAP高达54.00%,较无监督方法生成的候选词集提升了2.15%;在对法律专业语料提取新词时,键值记忆神经网络的表现进一步超过了多标签Transformer-CRF模型,达到了3.43%的效果提升。
基于字频差算法与左切分词库构建的专利文献组件名称识别方法
孔嘉斌, 吕剑文, 刘江南, 杜文轩
计算机科学. 2023, 50 (7): 229-236.  doi:10.11896/jsjkx.220500068
摘要 ( 121 )   PDF(2580KB) ( 197 )   
参考文献 | 相关文章 | 多维度评价
机械专利文献蕴含着海量以组件名称为信息单元的领域知识信息,组件名称用词灵活多变,具有独特、复杂和生僻等特点,难以被计算机准确识别,成为专利知识挖掘的一大阻碍。为了提出组件名称的高效识别方法,剖析并提炼专利文本语句中的组件名称构词特征;从组件名称相关的外部用词入手,通过标识附图标记,识别其左侧的名称字符,自动从文本中检索候选名称,并构建组件候选名称集合;提出了字频差算法,过滤候选名称集合的冗余字符;提出了动态构建左切分词库算法,进一步剔除未能被过滤的冗余字符;通过交叉实验测试和分析识别过程中字频差先验阈值、词频阈值和字频差阈值的选取对识别效果的影响,形成一种面向机械领域中文专利的组件名称识别三段式综合方法。最后通过对实验结果的对比分析,验证了该方法的有效性与高效性。
上下文信息融合与噪声自适应的异常检测方法
衡红军, 周文华
计算机科学. 2023, 50 (7): 237-245.  doi:10.11896/jsjkx.220700078
摘要 ( 149 )   PDF(2235KB) ( 250 )   
参考文献 | 相关文章 | 多维度评价
信息物理系统(CPSs)中传感器和执行器等现场设备收集的数据中隐含复杂的上下文信息和未知分布噪声。为了提取并融合数据中的上下文信息以及减轻噪声带来的干扰,提出了上下文信息融合与噪声自适应的异常检测方法。该方法中设计了一种由自适应降噪编码器、上下文信息编码器和解码器构成的编解码网络建模CPSs状态空间模型。自适应降噪编码器在训练过程中通过拟合数据中噪声的分布模式生成自适应噪声,并利用该噪声对训练数据中的传感器数据加噪,以提升编解码网络的鲁棒性,减轻噪声带来的干扰,同时可迫使降噪自编码器学习到泛化性更强的系统的隐藏状态;上下文信息编码器利用LSTM和CNN提取数据窗口内的时序和空间上下文信息,并使用自注意力机制融合这两类上下文信息和系统隐藏状态,融合结果用于推断当前时刻系统隐藏状态,以提升此隐藏状态中的信息量;解码器利用以上系统隐藏状态可以更准确地解码出相应的传感器数据。编解码网络训练完成后,得到系统隐藏状态和传感器解码值,基于无迹卡尔曼滤波算法计算异常评分。在SWaT和PUMP两个实际CPSs数据集上的实验结果表明,所提方法的F1值均优于其他对比方法,验证了其有效性。
计算机网络
基于改进粒子群算法的云数据中心能耗优化任务调度策略
刘陈伟, 孙鉴, 雷冰冰, 徐涛, 吴隹伟
计算机科学. 2023, 50 (7): 246-253.  doi:10.11896/jsjkx.220900176
摘要 ( 128 )   PDF(2589KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
随着云计算的发展,能耗急剧上升,这进一步限制了云数据中心整体性能的提高,因此能耗问题引起了工业界和学术界的重视。同时,传统粒子群算法被广泛应用于数据中心任务调度问题的求解,但其收敛速度慢、精度低,容易忽略集群能耗问题。为此提出了一种基于反向学习的混沌映射自适应粒子群算法(OAPSO)。首先,采用反向学习的方法产生初始种群,使粒子更加均匀地分布于初始解空间,提高了初始种群的质量;其次,在粒子更新方式中引入非线性递减的动态惯性权重策略,以改变粒子的寻优能力,使局部搜索和全局搜索达到平衡,避免算法陷入局部最优;然后,引入混沌映射策略,在最优解位置进行扰动变异产生新解,提高算法从局部最优中跳出的能力。最后,在Cloudsim平台上对所提算法进行实验验证,结果表明,与PSO,OBL_TP_PSO和SAPSO算法相比,OAPSO算法资源利用率更高,节能效果更好。
基于时间卷积网络的云平台负载预测方法
李英豪, 郭昊龚, 刘盼盼, 相毅浩, 刘成明
计算机科学. 2023, 50 (7): 254-260.  doi:10.11896/jsjkx.220500036
摘要 ( 453 )   PDF(3431KB) ( 288 )   
参考文献 | 相关文章 | 多维度评价
针对云平台资源负载数据高度非平稳以及存在着随机噪声导致预测准确度较低等问题,结合信号分解和深度学习等技术,提出了一种云平台资源负载预测方法。首先利用经验模态分解(Empirical Mode Decomposition,EMD)方法对原始数据进行分解,得到多个IMF分量;然后构建出基于时间卷积网络(Temporal Convolutional Network,TCN)的预测模型,分别对IMF分量进行预测;最后将预测结果进行合并以得到最终的预测值。将所提方法与传统的预测方法及深度学习预测方法进行比较,并在阿里巴巴开源的数据中心资源监控日志数据集上进行了对比实验。实验结果表明,所提方法的预测误差分别比ARIMA,Bi-LSTM,GRU,TCN降低了36.75%,23.5%,24.44%,24.53%,预测结果具有最优的准确度。
基于深度学习的活跃IPv6地址预测算法
李育强, 李林峰, 朱浩, 侯孟书
计算机科学. 2023, 50 (7): 261-269.  doi:10.11896/jsjkx.220700076
摘要 ( 304 )   PDF(3219KB) ( 292 )   
参考文献 | 相关文章 | 多维度评价
由于IPv6拥有庞大的地址空间,基于现有网络速度和硬件计算能力,难以实现全球IPv6地址扫描。通过地址生成算法来预测网络中可能出现的 IPv6 地址,随后将预测地址作为扫描的目标,可以达到 IPv6 地址快速扫描的目的。文中通过分析IPv6地址结构和分配方式来探索潜在的分配模式,结合已有的传统语言模型和目标生成算法,提出了一种基于深度学习的算法6LMNS,来预测潜在的活跃IPV6地址。6LMNS首先通过地址向量空间映射模型Add2vec来构建具有一定语义关系的 IPv6 地址词向量空间;随后基于Transformer构建语言训练模型GPT-IPv6,以此来估计IPv6地址词向量序列的概率分布;最后引入核心采样替代传统贪心搜索解码,完成活跃地址的生成。经验证,与其他语言模型和目标生成算法相比,6LMNS生成的地址拥有更好的多样性以及更高的活跃率。
基于协同迁移进化的自适应网络遥测路径编排方法
郝炳炜, 崔允贺, 钱清, 申国伟, 郭春
计算机科学. 2023, 50 (7): 270-277.  doi:10.11896/jsjkx.220500274
摘要 ( 140 )   PDF(3008KB) ( 228 )   
参考文献 | 相关文章 | 多维度评价
日趋庞大、复杂、高速的网络使得传统网络测量技术已经不能满足当下网络智慧管控的需求。作为一种新型网络测量技术,网络遥测可以提供细粒度、精确的会话级或报文级遥测信息。目前已有的网络遥测方案在部署网络遥测路径时不考虑网络状态,大多以静态的方式部署网络遥测路径。这种方法无法适应网络的动态性及不可靠性,如果网络遥测包所经路径出现带宽饱和或者遭遇网络攻击,则会造成网络遥测包丢失,使得网络遥测可靠性变差。除此之外,现有网络遥测方案通常采用全链路覆盖方式实现,遥测冗余较大,探针数据包的有效载荷较低。为了解决上述问题,文中提出了基于协同迁移进化的自适应网络遥测路径编排方法(AdaPtive network telemetry Path OrchestratIoN method based on CooperaTivE MigRation Evolution,APPOINTER)。APPOINTER根据网络状态信息,计算能够覆盖全部网络设备的最优网络遥测路径,以转发遥测报文。实验结果表明,APPOINTER增强了网络遥测的可靠性,有效避免了遥测冗余,提高了遥测效率。
移动边缘计算中基于Stackelberg模型的分布式定价与计算卸载
陈序展, 林兵, 陈星
计算机科学. 2023, 50 (7): 278-285.  doi:10.11896/jsjkx.220500254
摘要 ( 153 )   PDF(2412KB) ( 325 )   
参考文献 | 相关文章 | 多维度评价
移动边缘计算(Mobile Edge Computing,MEC)作为一种新颖的计算范式,通过将计算任务从移动设备卸载到物理上临近的网络边缘,为移动设备提供低延迟和灵活的计算与通信服务。然而,由于边缘服务器和移动设备通常属于不同的主体,它们之间的利益冲突给MEC系统带来了很大的挑战。因此,为多边缘服务器多移动设备的MEC系统设计一种定价和计算卸载方案,最大化边缘服务器的效用并优化移动设备的体验质量至关重要。考虑到多边缘服务器多移动设备之间复杂的相互作用,采用多领导者多追随者Stackelberg模型来分析它们之间的相互作用。其中,边缘服务器作为领导者为其计算资源设定价格,移动设备作为追随者根据边缘服务器的定价来调整卸载策略。在Stackelberg模型的基础上,提出了一种基于次梯度法的分布式迭代算法,该算法可以有效收敛到Stackelberg均衡。仿真实验结果表明,所提方案能够在提高边缘服务器效用的同时保证移动设备的体验质量。
时间敏感网络中多目标在线混合流量调度算法
王家兴, 杨思锦, 庄雷, 宋玉, 阳鑫宇
计算机科学. 2023, 50 (7): 286-292.  doi:10.11896/jsjkx.220500178
摘要 ( 388 )   PDF(2532KB) ( 417 )   
参考文献 | 相关文章 | 多维度评价
基于以太网协议的时间敏感网络(TSN)通过不同类型流满足工业网络的实时传输、互联互通等多种需求。但时间触发(TT)流、音视频桥接(AVB)流和尽力而为(BE)流在网络中传输时,同种流争用队列、不同种流相互干扰的情况难以避免。针对TSN中多种流量调度影响端到端时延确定性的问题,提出了一种在线混合流量分析的粒子群(PSO)改进算法。该算法根据网络状况动态为混合流量计算路径,通过减少冗余搜索和约束粒子速度,避免粒子陷入局部最优,并加快搜索速度以满足在线计算的时间限制;对不同类型流量设置对应的适应度函数,降低混合流量间的相互干扰,减少了排队时延。仿真结果表明,所提算法在TSN网络中有效提高了混合流量传输成功率,并拥有稳定的性能和良好的计算效率。
信息安全
混淆应用中的第三方库函数定位
袁江风, 李昊翔, 游伟, 黄建军, 石文昌, 梁彬
计算机科学. 2023, 50 (7): 293-301.  doi:10.11896/jsjkx.221100147
摘要 ( 126 )   PDF(2478KB) ( 255 )   
参考文献 | 相关文章 | 多维度评价
第三方库是Android应用程序的重要组成部分。在对应用进行基于重打包技术的安全增强或分析时,往往需要定位第三方库中的一些特定函数,此时需要将第三方库源码中的函数映射到目标应用反汇编代码中,以找到其对应的位置。在实际工作中,很多应用经过了代码混淆,这给定位第三方库函数带来了挑战。在经过混淆处理的应用程序反汇编代码中,大部分可供定位的特征被消除,代码也变得晦涩、难以分析。在缺少线索的情况下,从庞大的代码空间中定位到一个特定的函数十分困难。目前对混淆后应用进行的分析仅仅关注识别应用程序中包含了哪些第三方库,而没有更细粒度的函数级别的识别。文中提出了一种在混淆后的应用代码中定位第三方库中特定函数的方法。首先,对应用所用到的混淆器和混淆参数进行识别,从而将第三方库源码处理成与目标应用相同混淆方式的代码,即混淆对齐;在此基础上,通过静态插桩在待定位的函数中引入查找特征,并抽取其混淆后的结构特征来从目标应用中最终识别出待定位的函数位置。实验结果表明,所提方法能以较高的正确率识别出目标应用所使用的混淆工具及混淆参数,且能准确定位流行的混淆闭源应用中感兴趣的第三方库函数。
对一个基于身份远程数据完整性验证方案的分析与改进
王少辉, 赵铮宇, 王化群, 肖甫
计算机科学. 2023, 50 (7): 302-307.  doi:10.11896/jsjkx.220600067
摘要 ( 298 )   PDF(1856KB) ( 245 )   
参考文献 | 相关文章 | 多维度评价
云存储服务能够让个人或者企业以更低的成本轻松地维护和管理大量数据,但其在为人们带来便利的同时却无法保证其外包数据的完整性和隐私性。远程数据完整性验证方案可以使用户在不下载全部数据的情况下对外包数据的完整性进行验证,即云服务器能够向验证者证明它实际上是在诚实地存储用户的数据。对Li等提出的基于身份云存储远程数据完整性验证方案的安全性进行了分析,结果表明该方案容易受到伪造攻击,即云服务器仅需保存少量的数据就能够生成合法的数据完整性证明。在Li等方案的基础上,提出了一个新的基于身份远程数据完整性验证方案。分析表明,所提方案能够满足健壮性和隐私性的安全需求,且与Li等方案的计算开销也能保持基本一致。
基于分层强化学习的智能化攻击路径发现方法
曾庆伟, 张国敏, 邢长友, 宋丽华
计算机科学. 2023, 50 (7): 308-316.  doi:10.11896/jsjkx.220500101
摘要 ( 266 )   PDF(2691KB) ( 445 )   
参考文献 | 相关文章 | 多维度评价
智能化攻击路径发现是开展自动化渗透测试的一项关键技术,但现有方法面临着状态、动作空间呈指数型增长和奖励稀疏等问题,导致算法难以收敛。为此,提出了一种基于分层强化学习的智能化攻击路径发现方法iPathD(Intelligent Path Discovery)。iPathD将攻击路径发现过程构建为一个分层的马尔可夫决策过程,以分别描述上层的主机间渗透路径发现和下层的单主机内部攻击路径发现,并在此基础上提出并实现了一种基于分层强化学习的攻击路径发现算法。实验结果表明,与传统基于DQN(Deep Q Learning)及其改进算法的方法相比,iPathD路径发现方法更加快速有效,并且随着主机中漏洞数目的增加,iPathD的效果更好,且适用于大规模的网络场景。
基于改进Self-paced Ensemble算法的浏览器指纹识别
张德升, 陈博, 张建辉, 卜佑军, 孙重鑫, 孙嘉
计算机科学. 2023, 50 (7): 317-324.  doi:10.11896/jsjkx.220600068
摘要 ( 375 )   PDF(2536KB) ( 278 )   
参考文献 | 相关文章 | 多维度评价
浏览器指纹技术凭借其无状态、跨域一致等优点,已经被许多网站应用到用户追踪、广告投放和安全验证等方面。浏览器指纹识别的过程是典型的不平衡数据的分类过程。针对当前浏览器指纹长期追踪过程中存在数据样本类不平衡导致指纹识别准确度低、长期追踪易失效等问题,提出了改进的Self-paced Ensemble(Improved SPE,ISPE)方法应用于浏览器指纹识别。对浏览器指纹样本欠采样过程和集成学习单个分类器的训练过程进行了改进,重点针对难以识别的浏览器指纹,添加类注意力机制并优化自协调因子,使分类器在训练和识别浏览器指纹的过程中更加注重边界样本的分类效果,从而提升总体的浏览器指纹识别准确度。在所收集的3 483条指纹和开源数据集中的15 000条指纹上进行了实验,结果表明,ISPE算法在浏览器指纹匹配识别的F1-score达到95.6%,相比Bi-RNN算法提高了16.8%。
基于遗传算法的恶意软件对抗样本生成方法
李坤, 郭威, 张帆, 杜加玉, 杨梅樾
计算机科学. 2023, 50 (7): 325-331.  doi:10.11896/jsjkx.220800176
摘要 ( 133 )   PDF(2162KB) ( 285 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着互联网技术的发展,恶意软件成为网络攻击的重要手段。为防御恶意软件攻击,可以将深度学习技术应用于恶意软件检测。然而,由于深度学习模型自身的局限性,基于深度学习的恶意软件检测模型容易受到恶意软件对抗样本的攻击,导致恶意软件对抗样本逃逸模型检测。通过研究恶意软件对抗样本的生成,可以帮助模型设计者改进模型设计、提升模型鲁棒性和防御能力。因此,针对基于灰度图的恶意软件检测模型,提出一种基于遗传算法的恶意软件对抗样本生成方法。该方法通过遗传算法优化扰动,再结合混淆操作向恶意软件中注入扰动,从而保证生成的恶意软件对抗样本具有对抗性、可执行性和恶意性。经实验验证,相比现有工作,所提方法生成的对抗样本攻击成功率平均提高56.4%。
面向纵向图联邦学习的数据重构攻击方法
李荣昌, 郑海斌, 赵文红, 陈晋音
计算机科学. 2023, 50 (7): 332-338.  doi:10.11896/jsjkx.220900038
摘要 ( 208 )   PDF(1990KB) ( 278 )   
参考文献 | 相关文章 | 多维度评价
近年来,数据隐私保护法规限制了不同图数据拥有者之间的数据直接交换,出现了“数据孤岛”现象。为解决上述问题,纵向图联邦学习通过秘密交换嵌入表示的方式实现图数据分布式训练,在众多现实领域具有广泛应用,如药物研发、用户发掘以及商品推荐等。然而,纵向图联邦学习中的诚实参与方在训练过程中仍然存在隐私泄露的风险,为此提出了一个由诚实但好奇的参与方基于生成式网络发动嵌入表示重构攻击,通过范数损失函数使得生成式网络的输出结果向训练公布的置信度逼近,从而重构参与方的隐私数据。实验结果表明,所提嵌入表示重构攻击在Cora,Citeseer以及Pubmed数据集上均能完整地重构参与方的嵌入表示,凸显了纵向图联邦学习中参与方嵌入表示的隐私泄露风险。
云环境下基于属性策略隐藏的细粒度高效可搜索加密方案
周艺华, 李美奇, 扈新宇, 杨宇光
计算机科学. 2023, 50 (7): 339-346.  doi:10.11896/jsjkx.220500238
摘要 ( 371 )   PDF(2209KB) ( 263 )   
参考文献 | 相关文章 | 多维度评价
基于属性的加密为存储在云中的外包数据提供了灵活且细粒度的访问控制。传统的基于属性的密文策略加密方案(CP-ABE)的访问策略常以明文形式出现,极易暴露用户的隐私敏感信息。另外,由于属性的加入,在加解密以及搜索阶段的相关计算和存储开销与属性数量呈线性关系,而且策略隐藏也会增加后续的计算开销。这些都难以满足云环境下具有隐私保护的安全高效可搜索加密的实际需求。针对上述问题,提出了一种同时支持策略隐藏与密文长度恒定的可搜索加密方案。该方案基于多值通配符与门策略,实现了密文长度恒定,并且具有固定的加解密和搜索开销,减少了用户的计算开销和云端对密文的存储开销。将访问策略中的属性通过加密完全隐藏,在搜索时使用布隆过滤器判断用户是否拥有访问策略中的相关属性,保护了用户隐私,也提高了计算效率。所提方案在 q-BDHE假设下满足 IND-CPA安全。安全性分析与实验结果表明了所提方案的安全性、高效性和可行性,其是一个高效的关键词搜索方案,在云环境与物联网中具有较好的应用前景。
交叉&前沿
论算法解释权的重构——全算法开发流治理与分级分类解释框架
丛颖男, 王兆毓, 朱金清
计算机科学. 2023, 50 (7): 347-354.  doi:10.11896/jsjkx.220900120
摘要 ( 221 )   PDF(1469KB) ( 271 )   
参考文献 | 相关文章 | 多维度评价
随着人工智能技术的快速发展,自动化决策算法逐渐进入公共领域并越来越多地影响到社会公益与个人权益。而相应的算法风险如算法歧视、算法偏见、算法垄断等不断出现,进而引发了算法治理的切实需求。面对自动化决策使用者与用户之间信息、技术的不对称地位,传统法律资源不敷适用,对自动化决策用户保护之权利的不足成为算法解释权的必要性基础。作为算法治理的重要手段,算法解释权的价值在于对算法的“黑盒”构建“适度透明性”,矫正开发者与用户之间的信息不对称,并且再平衡双方畸形的分配风险负担,成为规制自动化决策使用者、保障用户权益必不可少的制度配置,因此算法解释权研究成为国内外学界与司法实践共同关注的焦点。而在现行法视野下,算法解释权制度存在适格主体过于狭窄,保护范围不够全面,权利内容尚需明确等问题。对此,在解构算法解释权的基础上,从全算法开发流治理与分级分类解释框架的视角对算法解释权制度进行重构。通过全算法开发流治理的建构,对算法解释权的主客体进行适度扩张;通过分级分类解释框架的构筑,结合个案视角明确算法解释权的内容与边界,以此兼顾算法的个性与共性,平衡算法解释的效率与用户权益的保护,全面保障自动化决策中的各方权利主体利益,为数字经济发展赋能。
面向“RNAO-生态”超网络复杂结构的流域水资源治理模式
锁利铭, 李军
计算机科学. 2023, 50 (7): 355-367.  doi:10.11896/jsjkx.220900134
摘要 ( 196 )   PDF(2201KB) ( 291 )   
参考文献 | 相关文章 | 多维度评价
长久以来,流域的整体性与权威碎片化致使我国流域水资源治理成本甚高,向网络治理转型成为近些年流域研究的关注热点并形成广泛共识。强调协调策略的RNAO(Restricted Network Administration Organization)网络结构,相较于西方学者提出的3种传统方案,更符合流域水资源治理本土化的实践需要,而针对RNAO的更为一般化的治理理论则是其理论发展方向。首先,梳理了流域水资源治理“传统-网络-超网络”模式的三维进阶逻辑;其次,将RNAO与“社会-生态”系统理论加以融合,创新地提出了“RNAO-生态”规模匹配的流域超网络治理模式,详细分析了“组织网、行为网、生态网”三层子网的复杂互动机理,从而初步形成了对RNAO的一般性理论构建;最后,针对“联合河长制”与“黑河流域水资源治理”两个案例,分析了RNAO与“RNAO-生态”在中国流域治理实践中的应用现状,并给出未来流域治理网络化转型的相关政策建议和可能的学术议题。
网络结构影响传播效果的解耦分析
崔允松, 吴晔, 许小可
计算机科学. 2023, 50 (7): 368-375.  doi:10.11896/jsjkx.220900113
摘要 ( 381 )   PDF(3586KB) ( 240 )   
参考文献 | 相关文章 | 多维度评价
如今越来越多的人通过社交网络传播信息,在线社交网络逐渐改变了人们交换信息的方式,因此基于在线社交网络研究信息传播效果的影响因素受到众多研究人员的关注,尤其是网络结构对信息传播效果的影响。以往研究大都强调某种网络统计量对信息传播效果的影响,但各个网络统计量之间相互耦合的现象是客观存在的,某种网络统计量的改变可能导致其他网络统计量同步改变,从而可能影响最终的传播效果。提出一个解耦的零模型框架,通过零模型解耦不同网络统计量间的耦合作用,然后使用SIR传播模型仿真实验来分析网络统计量在没有耦合作用下对信息传播效果的影响,最后使用线性阈值模型仿真实验验证SIR模型的实验结论在社会强化中的适用性。通过Facebook和Twitter实证网络的传播模型仿真实验表明:网络的平均最短路径是影响信息传播速度和信息传播范围的主要因素,聚类系数是影响信息传播范围的次要因素。
基于信息风险感知理论的虚假信息点对点传播建模与仿真研究
于凯, 宿天睿
计算机科学. 2023, 50 (7): 376-385.  doi:10.11896/jsjkx.220900084
摘要 ( 191 )   PDF(4085KB) ( 226 )   
参考文献 | 相关文章 | 多维度评价
在计算社会科学研究中,受传染病启发的传播模型被广泛用于模拟虚假信息传播,但传统的传染病模型不区分个体间的差异。现实世界中,个体间的差异有助于理解虚假信息如何在个体间传播,这对于探究社交网络中虚假信息的传播规律、抑制虚假信息的传播具有重要意义。文中基于信息风险感知理论,利用在线社交用户的情绪、知识水平、信任度和媒体的接触数量等对传播个体的差异加以区分,构建更加符合现实的虚假信息点对点传播模型。在传播过程中,个体间的差异表现为不同的传播概率,高传播概率的个体更容易转化为传播状态,同时使用人工标注的Facebook数据集进行仿真模拟来研究虚假信息的传播规律。结果发现,相比平均概率传播系统,在点对点传播模式下传播虚假信息的时间跨度更长,波及范围更广。此外,通过控制高传播概率节点,能够实现对虚假信息传播的事前控制,且其相比随机控制、控制高影响力节点的方法取得了更好的效果,但依次增加节点控制比例并未按照预想得到更好的控制效果,出现了“反常识”的特征。