计算机科学

第48卷第10期目录

计算机科学. 2021, 48 (10): 0-0.

摘要 ( 230 )

PDF(6341KB) ( 782 )

相关文章 | 多维度评价

基于强化学习的推荐研究综述

余力, 杜启翰, 岳博妍, 向君瑶, 徐冠宇, 冷友方

计算机科学. 2021, 48 (10): 1-18. doi:10.11896/jsjkx.210200085

摘要 ( 1662 )

PDF(2455KB) ( 3904 )

参考文献 | 相关文章 | 多维度评价

推荐系统致力于从海量数据中为用户寻找并自动推荐有价值的信息和服务,可有效解决信息过载问题,成为大数据时代一种重要的信息技术。但推荐系统的数据稀疏性、冷启动和可解释性等问题,仍是制约推荐系统广泛应用的关键技术难点。强化学习是一种交互学习技术,该方法通过与用户交互并获得反馈来实时捕捉其兴趣漂移,从而动态地建模用户偏好,可以较好地解决传统推荐系统面临的经典关键问题。强化学习已成为近年来推荐系统领域的研究热点。文中从综述的角度,首先在简要回顾推荐系统和强化学习的基础上,分析了强化学习对推荐系统的提升思路,对近年来基于强化学习的推荐研究进行了梳理与总结,并分别对传统强化学习推荐和深度强化学习推荐的研究情况进行总结;在此基础上,重点总结了近年来强化学习推荐研究的若干前沿,以及其应用研究情况。最后,对强化学习在推荐系统中应用的未来发展趋势进行分析与展望。

移动机器人全局路径规划算法综述

王梓强, 胡晓光, 李晓筱, 杜卓群

计算机科学. 2021, 48 (10): 19-29. doi:10.11896/jsjkx.200700114

摘要 ( 1129 )

PDF(1835KB) ( 5134 )

参考文献 | 相关文章 | 多维度评价

全局路径规划是移动机器人室外工作的关键技术,全局路径规划相关算法主要应用于地理场景预知的室外环境中,机器人面对复杂多变的室外环境,通过对算法的优化改进来提高机器人路径规划的实时避障性、路径平滑性、规划有效性就成为了全局路径规划算法的核心研究内容。首先根据算法的智能程度,将移动机器人的全局路径规划算法分为传统全局路径规划算法和仿生智能全局路径规划算法,并深入阐述了实际应用更为广泛的多目标路径规划算法,然后介绍了当前每种算法的几种典型的优化改进方法,并对其优化改进后的算法的优缺点进行了分析总结,最后对全局路径算法的未来发展趋势进行了展望,指出全局路径规划算法将向优化已有常规算法路径规划的性能、多种算法优势融合、复杂环境中动态避障、适应多样化环境的地图表示方法这4方面发展。

面向高维连续行动空间的蒙特卡罗树搜索算法

刘天星, 李伟, 许铮, 张立华, 戚骁亚, 甘中学

计算机科学. 2021, 48 (10): 30-36. doi:10.11896/jsjkx.201000129

摘要 ( 893 )

PDF(2138KB) ( 1919 )

参考文献 | 相关文章 | 多维度评价

蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)在低维离散控制任务中取得了巨大的成功。然而,在现实生活中许多任务需要在连续动作空间进行行动规划。由于连续行动空间涉及的行动集过大,蒙特卡罗树搜索很难在有限的时间内从中筛选出最佳的行动。作为蒙特卡罗树搜索的一个变种,KR-UCT(Kernel Regression UCT)算法通过核函数泛化局部信息的方式提高了蒙特卡罗树搜索在低维连续动作空间的模拟效率。但是在与环境交互的过程中,为了找出最佳的行动,KR-UCT在每一步都需要从头进行大量的模拟,这使得KR-UCT算法仅局限于低维连续行动空间,而在高维连续行动空间难以在有限的时间内从行动空间筛选出最佳的行动。在与环境交互的过程中,智能体可以获得环境反馈回来的信息,因此,为了提高KR-UCT算法在高维行动空间的性能,可以使用这些反馈信息剪枝树搜索过程来加快KR-UCT算法在高维连续行动空间的模拟效率。基于此,文中提出了一种基于策略-价值网络的蒙特卡罗树搜索方法(KR-UCT with Policy-Value Network,KRPV)。该方法使用策略-价值网络保存智能体与环境之间的交互信息,随后策略网络利用这些信息帮助KR-UCT算法剪枝KR-UCT搜索树的宽度;而价值网络则通过泛化不同状态之间的价值信息对蒙特卡罗树搜索在深度上进行剪枝,从而提高了KR-UCT算法的模拟效率,进而提高了算法在高维连续行动任务中的性能。在OpenAI gym中的4个连续控制任务上对KRPV进行了评估。实验结果表明,该方法在4个连续控制任务上均优于KR-UCT,特别是在6维的HalfCheetah-v2任务中,使用KRPV算法所获得的奖励是KR-UCT的6倍。

基于情节经验回放的深度确定性策略梯度方法

张建行, 刘全

计算机科学. 2021, 48 (10): 37-43. doi:10.11896/jsjkx.200900208

摘要 ( 729 )

PDF(2351KB) ( 1360 )

参考文献 | 相关文章 | 多维度评价

强化学习中的连续控制问题一直是近年来的研究热点。深度确定性策略梯度(Deep Deterministic Policy Gradients,DDPG)算法在连续控制任务中表现优异。DDPG算法利用经验回放机制训练网络模型,为了进一步提高经验回放机制在DDPG算法中的效率,将情节累积回报作为样本分类依据,提出一种基于情节经验回放的深度确定性策略梯度(Deep Determinis-tic Policy Gradient with Episode Experience Replay,EER-DDPG)方法。首先,将经验样本以情节为单位进行存储,根据情节累积回报大小使用两个经验缓冲池分类存储。然后,在网络模型训练阶段着重对累积回报较大的样本进行采样,以提升训练质量。在连续控制任务中对该方法进行实验验证,并与采取随机采样的DDPG方法、置信区域策略优化(Trust Region Policy Optimization,TRPO)方法以及近端策略优化(Proximal Policy Optimization,PPO)方法进行比较。实验结果表明,EER-DDPG方法有更好的性能表现。

一种基于图的文档关键词和摘要协同抽取方法研究

毛湘科, 黄少滨, 余秦勇

计算机科学. 2021, 48 (10): 44-50. doi:10.11896/jsjkx.200900082

摘要 ( 524 )

PDF(1767KB) ( 1123 )

参考文献 | 相关文章 | 多维度评价

关键词提取和摘要抽取的目的都是从原文档中选择关键内容并对原文档的主要意思进行概括。评价关键词和摘要抽取质量的好坏主要看其能否对文档的主题进行良好的覆盖。在现有基于图模型的关键词提取和摘要抽取方法中,很少涉及到将关键词提取和摘要抽取任务协同进行的,而文中提出了一种基于图模型的方法进行关键词提取和摘要的协同抽取。该方法首先利用文档中词、主题和句子之间的6种关系,包括词和词、主题和主题、句子和句子、词和主题、主题和句子、词和句子,进行图的构建;然后利用文档中词和句子的统计特征对图中各顶点的先验重要性进行评价;接着采用迭代的方式对词和句子进行打分;最后根据词和句子的得分,得到关键词和摘要。为验证所提方法的效果,文中在中英文数据集上进行关键词提取和摘要抽取实验,发现该方法不管是在关键词提取还是摘要抽取任务上都取得了良好的效果。

多源异构用户生成内容的融合向量化表示学习

纪南巡, 孙晓燕, 李祯其

计算机科学. 2021, 48 (10): 51-58. doi:10.11896/jsjkx.200900194

摘要 ( 542 )

PDF(3514KB) ( 1111 )

参考文献 | 相关文章 | 多维度评价

随着移动网络和APPs的发展,包含用户评价、标记、打分、图像和视频等多源异构数据的用户生成内容(User Generated Contents,UGC)成为提高个性化服务质量的重要依据,对这些数据的融合和表示学习成为其应用的关键。对此,提出一种面向多源文本和图像的融合表示学习。采用Doc2vec和LDA模型,给出多源文本的向量化表示,采用深度卷积网络获取与评价文本相关的图像特征;给出多源文本向量化表示的多策略融合机制,以及文本和图像卷积融合的表示学习。将所提算法应用于亚马逊含UGC内容的商品数据集上,基于UGC向量化表示物品的分类准确率说明了该算法的可行性和有效性。

基于单词-章节关联的科技论文摘要

付颖, 王红玲, 王中卿

计算机科学. 2021, 48 (10): 59-66. doi:10.11896/jsjkx.200900180

摘要 ( 573 )

PDF(3789KB) ( 895 )

参考文献 | 相关文章 | 多维度评价

为科技论文生成自动摘要,这能够帮助作者更快撰写摘要,是自动文摘的研究内容之一。相比于常见的新闻文档,科技论文具有文档结构性强、逻辑关系明确等特点。目前,主流的编码-解码的生成式文摘模型主要考虑文档的序列化信息,很少深入探究文档的篇章结构信息。为此,文中针对科技论文的特点,提出了一种基于“单词-章节-文档”层次结构的自动摘要模型,利用单词与章节的关联作用增强文本结构的层次性和层级之间的交互性,从而筛选出科技论文的关键信息。除此之外,该模型还扩充了一个上下文门控单元,旨在更新优化上下文向量,从而能更全面地捕获上下文信息。实验结果表明,提出的模型可有效提高生成文摘在ROUGE评测方法上的各项指标性能。

具有博弈概率选择的多子群粒子群算法

田梦丹, 梁晓磊, 符修文, 孙媛, 李章洪

计算机科学. 2021, 48 (10): 67-76. doi:10.11896/jsjkx.200800128

摘要 ( 298 )

PDF(5821KB) ( 943 )

参考文献 | 相关文章 | 多维度评价

针对粒子群算法在求解复杂多峰函数时存在早熟、易陷入局部最优、全局收敛性能差等缺陷,考虑种群结构、多模式学习和个体间博弈等因素,提出了具有博弈概率选择的多子群粒子群算法。该算法从改善群体多样性、提升个体搜索能力的角度出发,构建了动态多种群结构,并针对每个子群构建不同的学习策略(极端学习、复合学习、邻域学习和随机学习),子群间进行最优信息共享,形成异构多子群的多源学习方式;将进化博弈思想引入群体搜索过程中,个体通过收益矩阵和扎根概率进行策略概率选择,进入适合个体能力提升的子群进行学习。基于12个标准测试函数,针对算法中重要参数子群规模L的取值进行了组合实验,结果表明L取值N/2或N/3时,种群适应度分布及中位值具有明显优势;针对算法性能测试,利用不同维度下的标准测试函数与7种同类型算法进行对比实验,实验结果显示,改进算法在最优值、求解稳定性及收敛特征上整体优于对比算法,说明多源学习和博弈概率选择策略可以有效改善粒子群算法的性能。

基于深度神经网络和自注意力机制的医学实体关系抽取

张世豪, 杜圣东, 贾真, 李天瑞

计算机科学. 2021, 48 (10): 77-84. doi:10.11896/jsjkx.210300271

摘要 ( 565 )

PDF(1514KB) ( 1269 )

参考文献 | 相关文章 | 多维度评价

随着医学信息化的推进,医学领域已经积累了海量的非结构化文本数据,如何从这些医学文本中挖掘出有价值的信息,是医学行业和自然语言处理领域的研究热点。随着深度学习的发展,深度神经网络被逐步应用到关系抽取任务中,其中“recurrent＋CNN”网络框架成为了医学实体关系抽取任务中的主流模型。但由于医学文本存在实体分布密度较高、实体之间的关系交错互联等问题,使得 “recurrent＋CNN”网络框架无法深入挖掘医学文本语句的语义特征。基于此,在“recurrent＋CNN”网络框架基础之上,提出一种融合多通道自注意力机制的中文医学实体关系抽取模型,包括:1)利用BLSTM捕获文本句子的上下文信息;2)利用多通道自注意力机制深入挖掘句子的全局语义特征;3)利用CNN捕获句子的局部短语特征。通过在中文医学文本数据集上进行实验,验证了该模型的有效性,其精确率、召回率和F1值与主流的模型相比均有提高。

基于数据增强的中文隐式篇章关系识别方法

王体爽, 李培峰, 朱巧明

计算机科学. 2021, 48 (10): 85-90. doi:10.11896/jsjkx.200800115

摘要 ( 394 )

PDF(1439KB) ( 1190 )

参考文献 | 相关文章 | 多维度评价

由于缺乏显式连接词,隐式篇章关系识别是一个具有挑战性的任务。文中提出了一种结合主动学习和多任务学习来间接扩充隐式篇章关系训练数据的隐式篇章关系识别方法,旨在在增强训练数据的同时尽量少地引入伪隐式篇章关系数据中的噪声。首先,基于BERT模型通过主动学习方法的分类不确定性来选择部分显式篇章关系样本;然后,移除显式篇章关系数据中的显式连接词作为伪隐式篇章关系数据;最后,采用多任务学习方法使伪隐式篇章关系数据有助于隐式篇章关系识别。在中文篇章树库(CDTB)上进行的实验的结果显示,相比基准模型,所提方法在宏平均F1、微平均F1值上均得到了提高。

融合BERT和记忆网络的实体识别

陈德, 宋华珠, 张娟, 周泓林

计算机科学. 2021, 48 (10): 91-97. doi:10.11896/jsjkx.200900015

摘要 ( 729 )

PDF(2056KB) ( 1229 )

参考文献 | 相关文章 | 多维度评价

实体识别是信息提取的子任务,传统实体识别模型针对人员、组织、位置名称等类型的实体进行识别,而在现实世界中必须考虑更多类别的实体,需要细粒度的实体识别。同时,BiGRU等传统实体识别模型无法充分利用更大范围内的全局特征。文中提出了一种基于命名记忆网络和BERT的实体识别模型,记忆网络模块能够记忆更大范围的特征,BERT语言预训练模型能进行更好的语义表示。对水泥熟料生产语料数据进行实体识别,实验结果表明,所提方法能够识别实体且较其他传统模型更具优势。为了进一步验证所提模型的性能,在CLUENER2020数据集上进行实验,结果表明,在BiGRU-CRF模型的基础上使用BERT和记忆网络模块进行优化是能够提高实体识别效果的。

基于多粒度粗糙直觉犹豫模糊集的最优粒度选择方法

薛占熬, 孙冰心, 侯昊东, 荆萌萌

计算机科学. 2021, 48 (10): 98-106. doi:10.11896/jsjkx.200800074

摘要 ( 561 )

PDF(1373KB) ( 754 )

参考文献 | 相关文章 | 多维度评价

为了对含有多属性的直觉犹豫模糊决策信息系统进行约简,获取最优粒度,运用多粒度粗糙集处理直觉犹豫模糊决策信息系统中的不确定信息,并对多粒度粗糙直觉犹豫模糊集的最优粒度选择方法进行了研究。首先,在直觉犹豫模糊集的基础上引入属性信息,给出粗糙直觉犹豫模糊集的概念,提出乐观、悲观多粒度粗糙直觉犹豫模糊集的下、上近似这4种模型,且研讨了它们的性质。其次,主要定义了基于悲观多粒度粗糙直觉犹豫模糊集下近似的粒度质量相似度和内、外粒度重要度的计算公式,设计了其最优粒度选择算法。最后,通过葡萄酒测评的案例,分别基于乐观、悲观多粒度粗糙直觉犹豫模糊集的下、上近似这4种情况,计算出最优粒度并进行了分析,验证了该算法在直觉犹豫模糊决策信息系统中的约简是有效的。

基于多模态表示学习的阿尔兹海默症诊断算法

樊连玺, 刘彦北, 王雯, 耿磊, 吴骏, 张芳, 肖志涛

计算机科学. 2021, 48 (10): 107-113. doi:10.11896/jsjkx.200900178

摘要 ( 612 )

PDF(2407KB) ( 1176 )

参考文献 | 相关文章 | 多维度评价

阿尔茨海默症是一种典型的涉及多种致病因素的神经系统退行性疾病。然而,阿尔茨海默症的病因尚不明确,病程不可逆转,且无治愈方法,因此其早期诊断和治疗一直是人们关注的重点。受试者的神经影像数据对于该疾病的诊断具有重要的辅助作用,而结合多个模态的数据可进一步提高诊断效果。目前,联合该疾病的多模态数据进行辅助诊断逐渐成为一个新兴的研究领域。在此提出了一种基于自编码器的多模态表示学习方法,用于阿尔茨海默症的诊断。首先将多个模态的数据进行初步融合,得到初级的共同表示;然后将其送入自编码器网络,学习隐空间中的共同表示;最后对隐空间中的共同表示进行分类,得到疾病的诊断结果。在国际公开ADNI数据集上,所提算法对患病和健康受试者的诊断准确率达到88.9%,与同类算法相比取得了最好的诊断效果。实验结果验证了所提算法对阿尔茨海默症诊断的有效性。

基于堆叠自动编码器的miRNA-疾病关联预测方法

刘丹, 赵森, 颜志良, 赵静, 王会青

计算机科学. 2021, 48 (10): 114-120. doi:10.11896/jsjkx.200900169

摘要 ( 354 )

PDF(2967KB) ( 1197 )

参考文献 | 相关文章 | 多维度评价

作为一类小的非编码RNA,miRNA的异常调控与人类疾病的发生和发展密切相关,研究miRNA与疾病的关联对于了解人类疾病致病机制具有重要意义。机器学习方法被广泛应用于miRNA-疾病关联预测,然而现有方法仅仅考虑了miRNA与疾病相似性网络信息,忽略了相似性网络的拓扑结构。因此,文中提出基于堆叠自动编码器的miRNA-疾病关联预测模型SAEMDA,该模型采用重启随机游走获取miRNA与疾病相似性网络的拓扑结构特征,用堆叠自动编码器提取miRNA与疾病的抽象低维特征,将得到的低维特征输入深度神经网络进行miRNA-疾病关联预测。SAEMDA模型在5折交叉验证中取得了较好的结果,并在结肠癌和肺癌两个案例中进行了验证。在结肠癌的案例中,此模型预测的前50个miRNA-疾病关联中的45个miRNA在数据库中得到了验证;在肺癌的案例中,排名前50的miRNA均在数据库中得到了验证。

基于U-Net++的心电信号识别分类研究

杨春德, 贾竹, 李欣蔚

计算机科学. 2021, 48 (10): 121-126. doi:10.11896/jsjkx.200700103

摘要 ( 488 )

PDF(3062KB) ( 1460 )

参考文献 | 相关文章 | 多维度评价

探索高效、快速、精准的心电信号识别分类算法是心电诊断的难点。基于心电片段的识别分类更贴合临床应用。基于此,文中将改进的深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks,DCGAN)用于数据扩充,将优化的一维U-Net++用于心律不齐的片段信号识别。连续截取MIT-BIH数据库中1 200个采样点的心电片段作为实验数据集,以每条片段记录中心拍标签次数出现最多的类型作为整段记录的标签。再将优化的一维U-Net++作为DCGAN结构的生成器实现部分数据扩充,以解决数据不平衡的问题。在原始心电信号未经过任何预处理以及生成的扩充数据用于完成小波阈值去噪的情况下,优化的一维U-Net++模型对于正常、室性早搏、左束支阻滞、右束支阻滞4类不同的心电类型训练集的准确率能够达到98.10%,且对于测试集的精准率、召回率和F1值等指标均有较好的结果。在相同实验数据集下,优化的一维U-Net++模型比U-Net模型的准确率提高了1.05%;在相同实验参数的条件下,与欠采样数据对比,经DCGAN数据扩充后的数据集实验模型的准确率提高了0.85%。

基于图卷积神经网络的药物靶标作用关系预测方法

高创, 李建华, 季秀怡, 朱程龙, 李诗良, 李洪林

计算机科学. 2021, 48 (10): 127-134. doi:10.11896/jsjkx.200700068

摘要 ( 721 )

PDF(2247KB) ( 1586 )

参考文献 | 相关文章 | 多维度评价

药物-靶标作用关系预测在药物研发以及药物重定位中扮演着重要角色,但现有的机器学习方法在正负样本高度不平衡的数据上仍存在预测能力不足的问题。为此,提出一种基于图卷积神经网络的药物靶标作用关系预测方法。该方法首先构造一个结合多种药物(靶标)相关信息的异质信息网络,然后采用图卷积神经网络在此异质信息网络上学习得到能精确表达每个节点拓扑特征及邻居特征信息的低维向量表征,最后利用这些向量信息通过向量空间投影预测节点间概率的评分。在DrugBank_FDA和Yammanishi_08数据集上进行的药物-靶标作用关系预测的对比实验中,所提方法的AUPR(Area Under the Precision-Recall Curve)值都优于其他4种方法,并且在较大型数据集上也有较好的表现。实验结果表明,所提方法提高了样本高度不平衡时的药物-靶标作用关系预测性能;同时在生物药物数据库上的实验也验证了所提方法所发现的未知药物-靶标作用关系的有效性。

船舶虚拟制造中狼群优化卷积神经网络的控制应用

肖世龙, 吴迪, 唐超尘, 神显豪, 张德育

计算机科学. 2021, 48 (10): 135-139. doi:10.11896/jsjkx.200900183

摘要 ( 499 )

PDF(1691KB) ( 791 )

参考文献 | 相关文章 | 多维度评价

为了优化虚拟工业制造的控制策略,采用狼群优化的卷积神经网络算法进行虚拟工业制造控制研究。首先根据虚拟工业制造任务和资源数据,建立任务-资源列表,并结合单位矩阵对任务-资源列表进行稀疏化,形成虚拟制造单元;接着建立卷积神经网络虚拟制造控制模型,并采用狼群算法对权重和偏置进行优化;最后以所有任务的平均制造时间为目标函数,对虚拟制造单元进行训练优化。船舶主机虚拟制造实验证明,相比于常用的控制算法,通过合理设置卷积核池化尺寸的狼群优化卷积神经网络算法能够获得平均制造时间的最优解。

关系型数据库向图数据库的转换方法

鄂海红, 韩鹏昊, 宋美娜

计算机科学. 2021, 48 (10): 140-144. doi:10.11896/jsjkx.201100073

摘要 ( 853 )

PDF(1410KB) ( 2688 )

参考文献 | 相关文章 | 多维度评价

由于关系型数据库和图数据库存储模式的天然差别,将关系型数据库中的数据转存到图数据库的过程中,需解决对于关系的定义、节点唯一性以及保留原数据库约束信息的主要问题。针对上述问题,提出了一种关系型数据库向图数据库转换的方法。首先通过自定义或使用已有主键,并结合数据库表名的唯一性,解决了节点唯一性的问题;通过不同的配置方案,最大化保留了原关系型数据库的约束信息;然后提出了基于配置与中间表的边定义方法(Edge Definition Method based on Configuration and Intermediate Table,EDCIT),针对多种类型的数据库提供不同关系的映射方案,解决了转换过程中对于关系的定义。最终,通过对多个数据集进行实验,并使用Gremlin语句对转换后的数据进行测试,验证了转换后的数据具有完整性和可靠性。

对象关系数据库到RDF(S)的映射方法

鲁佳文, 严丽

计算机科学. 2021, 48 (10): 145-151. doi:10.11896/jsjkx.200800006

摘要 ( 285 )

PDF(2604KB) ( 1122 )

参考文献 | 相关文章 | 多维度评价

随着智能信息技术的发展,知识图谱已被广泛应用于智能搜索等各个领域。知识图谱中的信息一般采取RDF(S)的数据模型来表示。知识图谱的构建需要从大量的数据源抽取信息,而数据库是不可忽视的重要数据源。近几年,对象关系数据库得到了广泛的应用,且其中存储着丰富的语义信息,而基于对象关系数据库自动构建RDF(S)的研究却较少。因此,文中给出了对象关系数据库与RDF(S)的形式化定义,根据形式化定义将对象关系数据库中的语义信息进行抽取,提出了构建RDF(S)数据的映射规则。该映射规则不仅考虑了数据库的面向对象的语义,还考虑了数据库的约束,可以充分抽取数据库中包含的语义信息。最后实现了一个名为ORDB2RDF的映射工具,验证了该映射规则的正确性与映射结果的语义完整性。

时序图中Top-k稠密子图查询算法研究

穆聪聪, 王一舒, 袁野, 乔百友, 马玉亮

计算机科学. 2021, 48 (10): 152-159. doi:10.11896/jsjkx.201100005

摘要 ( 420 )

PDF(2392KB) ( 1092 )

参考文献 | 相关文章 | 多维度评价

稠密子图的查询是图分析领域的重要研究问题之一,在社交用户相关性分析、Web中社群分析等方面都有着广泛的应用。目前,关于稠密子图查询的研究工作主要基于静态图。而在实际应用中,时序信息会对稠密子图查询产生重要的影响,使得图拓扑结构随时间序列不断发生变化,包含的信息量也不断增加,使得已有的针对静态图的查找方法不再适用于时序图。因此,如何高效地在时序图上查找稠密子图仍然是一个挑战。为了解决上述挑战,首先规范化地定义了基于时序图的稠密子图查找问题;然后,根据图的拓扑结构和包含时间标签的边之间的相似度,提出一种基于阈值的近似查找算法DTS-base。为了加快算法的收敛速度,提出了一个基于快速计算最大相似度时间片的优化算法DTS-opt。最后,通过在真实数据集上的实验,证明了所提算法的高效性和可扩展性。

KSN:一种基于知识图谱和相似度网络的Web服务发现模型

于扬, 邢镔, 曾骏, 文俊浩

计算机科学. 2021, 48 (10): 160-166. doi:10.11896/jsjkx.200900026

摘要 ( 584 )

PDF(2829KB) ( 1176 )

参考文献 | 相关文章 | 多维度评价

服务发现旨在解决服务信息爆炸的问题,找到定位满足服务请求者需求的服务。由于服务描述信息主要由带有噪声的短文本组成,并且具有语义稀疏的特征,因此很难提取服务描述文档的隐含上下文信息,此外,传统的服务发现方法在获取服务的特征表示后,直接进行相似度计算,其使用的度量函数是不符合人类感知的。针对上述两个问题,文中提出了一种基于知识图谱和神经相似网络的服务发现框架(KSN)。它使用知识图谱来连接服务描述和规格中的实体以获得丰富的外部信息,从而增强服务描述的语义信息,使用卷积神经网络(Convolutional Neural Network,CNN)提取服务的特征向量,并将其作为神经相似网络的输入,神经相似网络会学习一个相似度函数,用于计算服务和请求之间的相似度以支持服务发现过程。通过对ProgrammableWeb爬取的真实服务数据集的大量实验结果表明,就多种评估指标而言,KSN优于现有的Web服务发现方法。

基于邻域结构的时态RDF模型及索引方法

陈圆圆, 严丽, 章哲庆, 马宗民

计算机科学. 2021, 48 (10): 167-176. doi:10.11896/jsjkx.200900114

摘要 ( 493 )

PDF(2454KB) ( 956 )

参考文献 | 相关文章 | 多维度评价

资源描述框架(Resource Description Framework,RDF)是W3C推荐的一种元数据模型和信息描述规范,已被广泛地应用于各个领域。为了跟踪RDF数据随时间的变化,将时态信息引入RDF的框架中,随着时态RDF数据的快速增长,对时态RDF数据的有效管理变得十分必要,构建合理的索引机制能够实现对数据的高效存储和查询。文中提出了一种时态RDF数据模型,给出了具体的一维编码方案,实现了简单地表示时态信息,并以较低的开销扩展现有的RDF数据模型。在此基础上,提出了基于邻域的二级索引结构。首先利用动态计数过滤器的方法索引的邻域信息,然后利用B+树索引每个结点相关的全部时态RDF数据,同时,可对大规模时态RDF数据进行更新。实验结果表明,所提方法相比对比方法在大多数情况下性能提高了35%左右,具有可扩展性和有效性。

融合多视图注意力机制的城市交通流量补全

康雁, 陈铁, 李浩, 杨兵, 张亚钏, 卜荣景

计算机科学. 2021, 48 (10): 177-184. doi:10.11896/jsjkx.200800077

摘要 ( 437 )

PDF(4018KB) ( 981 )

参考文献 | 相关文章 | 多维度评价

交通流量信息是智能交通系统和城市计算的重要基础。交通流量数据作为新型时序数据,由于数据的采集方式和外部复杂因素的影响,使得数据缺失现象是常见且无法避免的。如何有效地挖掘交通流量数据的时空特性和数据间的关联成为了提高缺失数据补全精度的关键。传统的统计学方法不能满足日益增长的数据需求,深度学习的应用推动了缺失数据的补全方法向更高的精确度发展。文中深入分析了交通流量的时间特性和空间分布,对交通流量的缺失情况进行了假设,提出了一种UMAtNet(U-net with Multi-View Attention Mechanisms)交通流量补全模型。该模型将短期的、趋势的、周期的时间数据与空间数据融合,同时采用不同的数据相关性测量方法,融合了一种多视图注意力机制,能够优化模型对缺失部分数据空间相关性的影响。为了验证模型的有效性,文中使用北京交通轨迹开源数据集进行实验,并在实验中详细地分析了模型各部分和损失函数对补全精度的影响,实验结果表明,UMAtNet和相应组件融合能进一步提高补全精度。

基于样本特征核矩阵的稀疏双线性回归

邵政毅, 陈秀宏

计算机科学. 2021, 48 (10): 185-190. doi:10.11896/jsjkx.200800219

摘要 ( 315 )

PDF(1525KB) ( 874 )

参考文献 | 相关文章 | 多维度评价

在许多实际应用中出现了大量的冗余数据,这些数据可能是高维的,这时进行回归预测将会出现过拟合的现象,并且还会出现预测精度偏低等问题。另外,大多数回归方法都是基于向量的,忽略了矩阵数据原始位置之间的关系。为此,文中提出了一种基于样本特征核矩阵的稀疏双线性回归(Kernel Matrix-based Sparse Bilinear Regression,KMSBR)方法。该方法直接将数据矩阵作为输入,其是通过左右回归系数矩阵而建立的,利用样本的特征核矩阵和L_2,1范数,能够同时实现对样本及样本特征的选择,且考虑了数据的原始位置,提高了算法的性能。在若干数据集上的实验结果表明,KMSBR能有效地选择相对重要的样本和特征,从而提高算法的运行效率,且其预测精度优于已有的几种回归模型。

基于密度峰值聚类的高斯混合模型算法

王卫东, 徐金慧, 张志峰, 杨习贝

计算机科学. 2021, 48 (10): 191-196. doi:10.11896/jsjkx.200800191

摘要 ( 300 )

PDF(1846KB) ( 998 )

参考文献 | 相关文章 | 多维度评价

由于存在大量服从高斯分布的样本数据,采用高斯混合模型(Gaussian Mixture Models,GMM)对这些样本数据进行聚类分析,可以得到比较准确的聚类结果。通常采用EM算法(Expectation Maximization Algorithm)对GMM的参数进行迭代式估计。但传统EM算法存在两点不足:对初始聚类中心的取值比较敏感;迭代式参数估计的迭代终止条件是相邻两次估计参数的距离小于给定的阈值,这不能保证算法收敛于参数的最优值。为了弥补上述不足,提出采用密度峰值聚类(Density Peaks Clustering,DPC)来初始化EM算法,以提高算法的鲁棒性,采用相对熵作为EM算法的迭代终止条件,实现对GMM算法参数值的优化选取。在人工数据集及UCI数据集上的对比实验表明,所提算法不但提高了EM算法的鲁棒性,而且其聚类结果优于传统算法。尤其在服从高斯分布的数据集上的实验结果显示,所提算法大幅提高了聚类精度。

结合多目标优化算法的模糊聚类有效性指标及应用

崔国楠, 王立松, 康介祥, 高忠杰, 王辉, 尹伟

计算机科学. 2021, 48 (10): 197-203. doi:10.11896/jsjkx.200900061

摘要 ( 400 )

PDF(2399KB) ( 1058 )

参考文献 | 相关文章 | 多维度评价

模糊聚类方法可以更有效地对复杂数据集进行分析,由于模糊聚类算法的种类繁多且聚类结果会随着输入的聚类个数的不同而改变,使得模糊聚类算法产生的结果不准确,因此,要获得准确的聚类结果必须确定模糊聚类个数k。目前已有的研究主要是利用多种模糊聚类有效性指标来确定最优聚类个数k,但是诸如SSD,PBM等模糊聚类指标会随着划分的聚类个数k的增加而单调递减,导致聚类个数k不准确。为此,文中提出了一种结合多目标优化算法的模糊聚类有效性指标(A Validity Index of Fuzzy Clustering Combined with Multi-objective Optimization Algorithm,OSACF),将模糊聚类度量指标与多目标优化算法(Multi-Objective Optimization Algorithm,MOEA)相结合来解决聚类最优个数k的问题。与使用聚类有效性指标不同,OSACF通过建立聚类个数k与聚类度量指标之间的双目标模型并使用MOEA优化该双目标模型来确定最优聚类个数k,避免了聚类有效性指标趋于单调递减的影响。另一方面,OSACF使用形态形似距离替代传统的欧氏距离度量,避免了聚类形状对计算聚类k值的影响。实验结果表明,OSACF结合MOEA得到的最优模糊聚类个数k比已有的聚类有效性指标获得的结果更准确。

多方向分区网络结构的行人再识别

唐一星, 刘学亮, 胡社教

计算机科学. 2021, 48 (10): 204-211. doi:10.11896/jsjkx.210300128

摘要 ( 323 )

PDF(2692KB) ( 834 )

参考文献 | 相关文章 | 多维度评价

将全局特征与局部特征相结合是提高行人再识别(re-identification)任务识别能力的重要解决方案。以往主要借助姿态估计等外部信息来定位有相应语义的区域,从而挖掘局部信息,这种方法大多是非端到端的,训练过程复杂且缺乏鲁棒性。针对该问题,文中提出了一种能有效挖掘局部信息并且能结合全局信息与局部信息进行端到端特征学习的方法,即多方向分区网络(Multi-orientation Partitioned Network,MOPN),该网络有3个分支,一个用于提取全局特征,两个用于提取局部特征。该算法不依靠外部信息,而是在不同的局部分支分别将图像按水平方向和竖直方向切分为若干横条纹和竖条纹,从而得到不同的局部特征表示。在Market-1501、DukeMTMC-reID、CUHK03和跨模态素描数据集SketchRe-ID上的综合实验表明,该算法的整体性能优于其他对比算法,具备有效性和鲁棒性。

基于编码-解码器架构的光场深度估计方法

晏旭, 马帅, 曾凤娇, 郭正华, 伍俊龙, 杨平, 许冰

计算机科学. 2021, 48 (10): 212-219. doi:10.11896/jsjkx.200900005

摘要 ( 547 )

PDF(4004KB) ( 787 )

参考文献 | 相关文章 | 多维度评价

针对现有光场深度估计方法存在的计算时间长和精度低的问题,提出了一种融合光场结构特征的基于编码-解码器架构的光场深度估计方法。该方法基于卷积神经网络,采用端到端的方式进行计算,一次输入光场图像就可获得场景视差信息,计算量远低于传统方法,大大缩短了计算时间。为提高计算精确度,网络模型以光场图像的多方向极平面图堆叠体(Epipolar Plane Image Volume,EPI-volume)为输入,先利用多路编码模块对输入的光场图像进行特征提取,再使用带跳跃连接的编码-解码器架构进行特征聚合,使网络在逐像素视差估计时能够融合目标像素点邻域的上下文信息。此外,模型采取不同深度的卷积块从中心视角图中提取场景的结构特征,并将该结构特征引入对应的跳跃连接中,为视差图预测提供了额外的边缘特征参考,进一步提高了计算精确度。对HCI-4D光场基准测试集的实验结果表明,所提方法的坏像素率(BadPix)指标比对比方法降低了31.2%,均方误差(MSE)指标比对比方法降低了54.6%。对于基准测试集中的光场图像,深度估计的平均计算时间为1.2s,计算速度远超对比方法。

基于注意力机制和深度卷积神经网络的材质识别方法

许华杰, 杨洋, 李桂兰

计算机科学. 2021, 48 (10): 220-225. doi:10.11896/jsjkx.200800073

摘要 ( 589 )

PDF(2071KB) ( 1367 )

参考文献 | 相关文章 | 多维度评价

材质识别旨在识别自然材质图像中的主要对象及其所属材料类别。针对材质图像数据集通常数据量少、人工标注局部纹理区域困难所导致的材质识别准确率低的问题,提出了一种基于注意力机制和深度卷积神经网络的材质识别方法,该方法的核心是材质识别深度卷积神经网络(MaterialNet)。MaterialNet利用深度残差网络对图像进行特征提取,采用所提出的级联空洞空间金字塔池化的方式引入注意力机制,使网络可以通过端到端训练自适应地关注包含纹理特征的关键区域,从而有效识别材质的局部纹理特征。在FMD材质数据集上进行实验,结果表明,MaterialNet的总体识别准确率可达到82.3%,比当前主流的B-CNN和CNN+FV材质识别方法分别提高了7.2%和4.5%,对多种材质的识别准确率较高且具有参数量少、计算量小等优点。

基于YOLO v5算法的迷彩伪装目标检测技术研究

王杨, 曹铁勇, 杨吉斌, 郑云飞, 方正, 邓小桐, 吴经纬, 林嘉

计算机科学. 2021, 48 (10): 226-232. doi:10.11896/jsjkx.210100058

摘要 ( 1509 )

PDF(4547KB) ( 2232 )

参考文献 | 相关文章 | 多维度评价

迷彩伪装目标与周围环境高度相似,对迷彩伪装目标的检测任务比普通的检测任务更具挑战性,常规的检测算法对迷彩伪装目标检测任务不完全适用。文中对现有方法进行分析,以YOLO v5算法为基础,提出了一种针对迷彩伪装目标的检测算法。该算法结合注意力机制设计了新的特征提取网络,突出了迷彩伪装目标的特征信息;并且对原有的聚合网络进行了改进,增大了检测的尺度,使用非对称卷积模块强化了目标语义信息。在一种公开的迷彩伪装目标数据集上将该算法与7种算法进行对比,所提算法的mAP值较原始算法提升了 4.4%,召回率提升了2.8%,在mAP值方面也比其他算法更具优势,从而验证了所提算法对迷彩伪装目标检测任务的有效性。

面向小目标检测的改进RetinaNet模型及其应用

罗月童, 江佩峰, 段昶, 周波

计算机科学. 2021, 48 (10): 233-238. doi:10.11896/jsjkx.200900172

摘要 ( 717 )

PDF(3292KB) ( 1442 )

参考文献 | 相关文章 | 多维度评价

基于深度学习的目标检测算法广泛应用于工业检测,RetinaNet算法因兼具速度与精度两方面的优势而备受关注,但对于小于32×32像素的小目标,该算法的检测精度不能满足工业检测的要求。为此,文中以增强小目标的训练为基本思路,针对RetinaNet算法进行了如下改进:在采样阶段,将低层特征图P2添加到FPN中,以确保小目标能被充分采样,同时引入自适应训练样本选择策略,以保证增加特征层之后仍能保持足够快的检测速度;在训练后期采用了损失权重调整策略,用于提高小目标中困难样本的拟合度。针对公共数据集MS COCO 2017及实际应用中的LED点胶工业数据集,改进后的方法使小于32×32目标的检测精度分别提高了4.1%和10.7%,这表明改进后的方法能显著提升小目标检测的水平。

用于视频修复的连贯语义时空注意力网络

刘浪, 李梁, 但远宏

计算机科学. 2021, 48 (10): 239-245. doi:10.11896/jsjkx.200600130

摘要 ( 504 )

PDF(4565KB) ( 1346 )

参考文献 | 相关文章 | 多维度评价

现有的视频修复方法通常会产生纹理模糊、结构扭曲的内容以及伪影,而将基于图像的修复模型直接应用于视频修复会导致时间上的不一致。从时间角度出发,提出了一种新的用于视频修复的连贯语义时空注意力(Coherent Semantic Spatial-Temporal Attention,CSSTA)网络,通过注意力层,使得模型关注于目标帧被遮挡而相邻帧可见的信息,以获取可见的内容来填充目标帧的孔区域(hole region)。CSSTA层不仅可以对孔特征之间的语义相关性进行建模,还能对远距离信息和孔区域之间的远程关联进行建模。为合成语义连贯的孔区域,提出了一种新的损失函数特征损失(Feature Loss)以取代VGG Loss。模型建立在一个双阶段粗到精的编码器-解码器结构上,用于从相邻帧中收集和提炼信息。在YouTube-VOS和DAVIS数据集上的实验结果表明,所提方法几乎实时运行,并且在修复结果、峰值信噪比(PSNR)和结构相似度(SSIM)3个方面均优于3种代表性视频修复方法。

基于Wi-Fi信号的人体身份识别算法研究综述

孔金生, 李婧馨, 段鹏松, 曹仰杰

计算机科学. 2021, 48 (10): 246-257. doi:10.11896/jsjkx.210100076

摘要 ( 689 )

PDF(2405KB) ( 1326 )

参考文献 | 相关文章 | 多维度评价

近年来,Wi-Fi感知凭借低成本、非接触式、不受光照影响、隐私性更好等优势,成为人机交互的新兴研究方向。目前,Wi-Fi感知研究已从目标定位扩展到动作识别、身份识别等领域。以人体身份识别为例,对Wi-Fi感知技术在该领域的研究进行了总结和分析。首先,对Wi-Fi感知技术的发展历史及优缺点进行了简要概述,并介绍了与传统的身份识别技术相比,利用Wi-Fi信号进行身份识别的优势;其次,详细介绍了Wi-Fi感知身份的基本流程,其中包括信号采集、预处理、特征提取、身份识别4个步骤,并具体介绍了每个步骤具体的操作过程;然后,从步态与手势两个方面对现有的Wi-Fi感知身份研究成果进行了横向与纵向的对比和分析;最后,针对目前该领域研究中存在的关键问题,提出了未来的研究重点,主要包括多人身份识别与迁移学习。

基于特征变换的图像检索对抗防御

徐行, 孙嘉良, 汪政, 杨阳

计算机科学. 2021, 48 (10): 258-265. doi:10.11896/jsjkx.200800222

摘要 ( 463 )

PDF(3207KB) ( 1050 )

参考文献 | 相关文章 | 多维度评价

对抗攻击在图像分类中较早被研究,目的是产生可以误导神经网络预测的不可察觉的扰动。最近,图像检索中的对抗攻击也被广泛探索,研究结果表明最先进的基于深度神经网络的图像检索模型同样容易受到干扰,从而将不相关的图像返回。文中首次尝试研究无需训练的图像检索模型的对抗防御方法,根据图像基本特征因素对输入图像进行变换,以在预测阶段消除对抗攻击的影响。所提方法探索了4种图像特征变换方案,即调整大小、填充、总方差最小化和图像拼接,这些都是在查询图像被送入检索模型之前对其执行的。文中提出的防御方法具有以下优点:1)不需要微调和增量训练过程;2)仅需极少的额外计算;3)多个方案可以灵活集成。大量实验的结果表明,提出的变换策略在防御现有的针对主流图像检索模型的对抗攻击方面是非常有效的。

基于生成对抗网络的位置隐私博弈机制

魏礼奇, 赵志宏, 白光伟, 沈航

计算机科学. 2021, 48 (10): 266-271. doi:10.11896/jsjkx.200900021

摘要 ( 381 )

PDF(1778KB) ( 962 )

参考文献 | 相关文章 | 多维度评价

文中提出了一种以用户为中心的位置隐私博弈机制,目的是在满足LBS服务质量的基础上生成对应的保护策略,并减小计算规模和效用损失。该机制以Stackelberg博弈模型为基础,用户在请求LBS服务时,采用位置模糊机制对自身位置进行扰动后发送给LBS服务器,使攻击者难以推测自己的真实位置;攻击者根据已知的一部分背景知识,对匿名区域内用户的保护策略进行推断并调整攻击方式,最小化用户隐私水平。为了解决传统线性规划解法在现实场景中计算复杂度过高、实用性低的问题,文中采用生成对抗网络参与保护策略的生成,并尽可能降低效用代价。实验结果表明,该保护机制在隐私保护水平方面有着良好的表现,在损失一定服务质量的同时明显缩短了保护机制的生成时间。

一个强安全的无证书签名方案的分析和改进

叶胜男, 陈建华

计算机科学. 2021, 48 (10): 272-277. doi:10.11896/jsjkx.201200117

摘要 ( 637 )

PDF(1360KB) ( 1071 )

参考文献 | 相关文章 | 多维度评价

无证书公钥密码体制结合了基于身份的密码体制和传统PKI公钥密码体制的优势,克服了基于身份的公钥密码体制的密钥托管问题及PKI系统的证书管理问题,具有明显的优势。对Hassouna等提出的一个强安全无证书签名方案进行安全分析。结果表明,该方案不能验证消息的完整性,存在消息篡改攻击,且方案未使用根据系统主密钥生成的私钥进行签名,所以不是无证书签名方案。在此基础上,提出了一个改进的无证书签名方案,在随机预言机模型下,基于椭圆曲线Diffie-Hellman问题假设,证明了该方案可以抵抗第一类强敌手和第二类敌手的攻击,满足存在性不可伪造的安全性。

TopoObfu:一种对抗网络侦察的网络拓扑混淆机制

刘亚群, 邢长友, 高雅卓, 张国敏

计算机科学. 2021, 48 (10): 278-285. doi:10.11896/jsjkx.210400296

摘要 ( 675 )

PDF(2709KB) ( 966 )

参考文献 | 相关文章 | 多维度评价

链路洪泛等典型网络攻击需要在拓扑侦察的基础上针对网络中的关键链路开展攻击行为,具有较强的破坏性和隐蔽性。为了有效抵御这类攻击,提出了一种对抗网络侦察的拓扑混淆机制TopoObfu。TopoObfu能够根据网络拓扑混淆的需求,在真实网络中添加虚拟链路,并通过修改探测分组的转发规则使攻击者获得虚假的拓扑探测结果,隐藏网络中的关键链路。为了便于实现,TopoObfu将虚假拓扑映射为SDN交换机的分组处理流表项,并支持在仅部分节点为SDN交换机的混合网络中部署。基于几种典型真实网络拓扑的仿真分析结果表明,TopoObfu能够从链路重要性、网络结构熵、路径相似度等方面有效提升攻击者进行关键链路分析的难度,并在SDN交换机流表数量、混淆拓扑生成时间等方面具有较高的实现效率,可以减小关键链路被攻击的概率。

基于神经网络的二进制函数相似性检测技术

方磊, 魏强, 武泽慧, 杜江, 张兴明

计算机科学. 2021, 48 (10): 286-293. doi:10.11896/jsjkx.200900185

摘要 ( 363 )

PDF(1802KB) ( 1511 )

参考文献 | 相关文章 | 多维度评价

二进制代码相似性检测在程序的追踪溯源和安全审计中都有着广泛而重要的应用。近年来,神经网络技术被应用于二进制代码相似性检测,突破了传统检测技术在大规模检测任务中遇到的性能瓶颈,因此基于神经网络嵌入的代码相似性检测技术逐渐成为热门研究。文中提出了一种基于神经网络的二进制函数相似性检测技术,该技术首先利用统一的中间表示来消除不同汇编代码在指令架构上的差异;其次在程序基本块级别,利用自然语言处理的词嵌入模型来学习中间表示代码,以获得基本块语义嵌入;然后在函数级别,利用改进的图神经网络模型来学习函数的控制流信息,同时兼顾基本块的语义,获得最终的函数嵌入;最后通过计算两个函数嵌入向量间的余弦距离来度量函数间的相似性。文中实现了一个基于该技术的原型系统,实验表明该技术的程序代码表征学习过程能够避免人为偏见的引入,改进的图神经网络更适合学习函数的控制流信息,系统的可扩展性和检测的准确率较现有方案都得到了提升。

基于多阶段博弈的虚拟化蜜罐动态部署机制

高雅卓, 刘亚群, 张国敏, 邢长友, 王秀磊

计算机科学. 2021, 48 (10): 294-300. doi:10.11896/jsjkx.210500071

摘要 ( 624 )

PDF(2547KB) ( 1109 )

参考文献 | 相关文章 | 多维度评价

作为一种重要的欺骗防御手段,蜜罐对于增强网络主动防御能力具有重要意义,但现有蜜罐大多采用静态部署方法,难以高效应对攻击者的策略性探测攻击等行为。为此,将完全信息静态博弈与马尔可夫决策过程相结合,提出了一种基于多阶段随机博弈的虚拟化蜜罐动态部署机制HoneyVDep。HoneyVDep结合攻防双方多阶段持续对抗的特点,以资源约束下防御方的综合收益最大化为目标,建立了基于多阶段随机博弈对抗的蜜罐部署优化模型,并实现了基于Q_Learning的求解算法,以快速应对攻击者的策略性探测攻击行为。最后,基于软件定义网络和虚拟化容器实现了一个可扩展的原型系统对HoneyVDep进行验证,实验结果表明,HoneyVDep能够根据攻击者的攻击行为特征,有效生成蜜罐部署策略,提升对攻击者的诱捕率,减少部署成本。

基于云服务器辅助的多方隐私交集计算协议

王勤, 魏立斐, 刘纪海, 张蕾

计算机科学. 2021, 48 (10): 301-307. doi:10.11896/jsjkx.210300308

摘要 ( 753 )

PDF(1568KB) ( 1525 )

参考文献 | 相关文章 | 多维度评价

隐私集合交集(Private Set Intersection,PSI)技术允许私有集合数据持有方联合计算出集合交集而不泄露交集外的任何隐私信息。作为安全多方计算中的重要密码学工具,该技术已被广泛应用于人工智能和数据挖掘的安全领域。随着多源数据共享时代的到来,大多数PSI协议主要解决两方隐私集合交集问题,一般无法直接推广到多方隐私交集计算场景。文中设计了基于云服务器辅助的多方隐私交集计算协议,能将部分计算和通信外包给不可信云服务器而又不会泄露任何隐私数据,通过使用不经意伪随机函数、秘密共享和键值对打包方法使得协议更高效。通过模拟范例证明了协议在半诚实模型下能够安全地计算多方隐私集合交集,所有参与方和云服务器都无法窃取额外数据。与现有方案相比,所提协议受限制更少,适用范围更广。

基于Attention-DenseNet-BC的恶意软件家族分类方法

李一萌, 李成海, 宋亚飞, 王坚

计算机科学. 2021, 48 (10): 308-314. doi:10.11896/jsjkx.210200166

摘要 ( 467 )

PDF(4331KB) ( 1069 )

参考文献 | 相关文章 | 多维度评价

恶意软件是互联网最严重的威胁之一。现存的恶意软件数据庞大,特征多样。卷积神经网络具有自主学习的特点,可以用来解决恶意软件特征提取复杂、特征选择困难的问题。但卷积神经网络连续增加网络层数会引起梯度消失,导致网络性能退化、分类准确率较低。针对此问题,提出了一种适用于恶意软件图像检测的Attention-DenseNet-BC模型。首先结合DenseNet-BC网络和注意力机制(attention mechanism)构建了Attention-DenseNet-BC模型,然后将恶意软件图像作为模型的输入,通过对模型进行训练和测试得到检测结果。实验结果表明,相比其他深度学习模型,Attention-DenseNet-BC模型可以取得更好的分类结果。在Malimg公开数据集上该模型取得了较高的分类精确率。

Grover算法改进与应用综述

刘晓楠, 宋慧超, 王洪, 江舵, 安家乐

计算机科学. 2021, 48 (10): 315-323. doi:10.11896/jsjkx.201100141

摘要 ( 757 )

PDF(1491KB) ( 2074 )

参考文献 | 相关文章 | 多维度评价

量子信息科学是一门新兴的交叉学科,它在信息领域中有着独特的性能,在提高运算速度、确保信息安全、增大信息容量和提高检测精度等方面可突破现有经典信息系统的极限。Grover算法是一类典型的量子算法,能够对任意经典暴力穷举搜索问题实现二次加速,进一步推动了量子计算的发展,如何有效地改进和应用Grover算法成为量子计算的一个重要研究领域。文中综述了Grover算法的优化改进和应用,对Grover算法在不同领域应用及不同方面的改进进行了概述,并对Grover算法未来的改进和相关应用的若干研究方向进行了探讨。

应用“大数据+区块链”优化立法评估制度的机理与路径

张光君, 张翔

计算机科学. 2021, 48 (10): 324-333. doi:10.11896/jsjkx.201200105

摘要 ( 601 )

PDF(2003KB) ( 791 )

参考文献 | 相关文章 | 多维度评价

立法评估中的大数据应用有助于革除评估主体单一、数据遗漏、数据失真和结论形式化等痼疾,但仍然存在立法机关主导模式下公众参与不足、清洗方法不当导致数据质量不高、信息不对称及“算法黑箱”引发信任危机、“算法偏见”造成评估结论失之偏颇等缺陷。基于技术-制度协同演化论的进路,应用与大数据本质契合的区块链革新底层架构,补强立法评估中大数据应用的缺陷,进而建构“大数据+区块链”的融合应用模式,以公众参与激励机制、数据清洗审查机制、共识形成磋商平台和程序正当化流转平台优化立法评估制度,从而充分释放立法评估汇聚民意民智、强化民主监督、提升立法质量的制度功能。

故障场景下的边缘计算DAG任务重调度方法

蔡凌峰, 魏祥麟, 邢长友, 邹霞, 张国敏

计算机科学. 2021, 48 (10): 334-342. doi:10.11896/jsjkx.210300304

摘要 ( 599 )

PDF(3486KB) ( 1052 )

参考文献 | 相关文章 | 多维度评价

边缘计算将计算和存储资源部署在靠近数据源的网络边缘,并高效调度用户卸载的任务,从而极大地提升了用户的服务体验(Quality of Experience,QoE)。但是,边缘计算缺乏可靠的基础设施保护,服务器节点或通信链路的突发故障可能会导致服务失败。为此,建立了边缘计算中的计算节点和通信链路故障模型,并针对依赖型用户任务的调度,提出了资源故障场景下的任务重调度算法DaGTR(Dependency-aware Greedy Task Rescheduling)。DaGTR包括两种子算法,即DaGTR-N和DaGTR-L,分别用于处理节点和链路故障事件。DaGTR能够感知任务的数据依赖关系,并基于贪心方法对所有受故障影响的用户任务进行重调度,以保证每个任务的成功执行。仿真结果显示,所提算法能够有效避免节点或链路故障导致的任务失败,提高了资源故障情况下任务的成功率。

基于改进多目标进化算法的微服务用户请求分配策略

朱汉卿, 马武彬, 周浩浩, 吴亚辉, 黄宏斌

计算机科学. 2021, 48 (10): 343-350. doi:10.11896/jsjkx.201100009

摘要 ( 758 )

PDF(2643KB) ( 1184 )

参考文献 | 相关文章 | 多维度评价

如何对基于微服务架构的系统进行并发用户请求的分配以使得时间、成本和均衡性等目标得到优化,是面向微服务的应用系统需关注的重要问题之一。现有的基于固定规则的用户请求分配策略仅着重于负载均衡性的解决,难以处理多目标需求间的平衡。为此,文中提出以请求处理总时间、负载均衡率和通信传输总距离为多个目标的微服务用户请求分配模型,研究并发用户请求在部署于不同资源中心的多个微服务实例间的分配策略,并使用基于改进初始解生成策略、交叉算子和变异算子的多目标进化算法对该问题进行求解。在不同规模的数据集上进行多次实验,结果表明,提出的方法与常用的多目标进化算法和传统的基于固定规则的方法相比,能够更好地处理多个目标间的平衡,具有更好的求解性能。

多层供应链网络中欠载失效和过载级联失效的协同演化研究

李姝, 杨华, 宋波

计算机科学. 2021, 48 (10): 351-358. doi:10.11896/jsjkx.200900144

摘要 ( 419 )

PDF(4447KB) ( 1180 )

参考文献 | 相关文章 | 多维度评价

供应链网络与我们的生活密切相关,而供应链网络的级联失效问题一直是研究的重点。文中提出了一种多层供应链网络混合失效模型,更好地模拟了真实供应链网络欠载失效和过载级联失效的过程,为预防供应链网络崩溃提供了参考。首先,建立了上层供应商网络过载级联失效模型和下层零售商网络欠载失效模型,它们共同构成了上下层网络混合的供应链网络模型;然后,通过采用不同的攻击方式攻击上下层网络,分析了供应链网络的失效迭代过程和脆弱性。在初始攻击比例一定的情况下,上层供应商网络相较于下层零售商网络有更强的鲁棒性,初始攻击节点为上层供应商网络节点时,网络崩溃的阈值更低,更容易使供应链网络发生全面崩溃。仿真结果验证了模型的有效性,为预防供应链网络崩溃提供了新的研究模型。