计算机科学

第50卷第10期目录

计算机科学. 2023, 50 (10): 0-0.

摘要 ( 330 )

PDF(274KB) ( 285 )

相关文章 | 多维度评价

基于序贯三支决策的半监督目标检测算法

宋法兴, 苗夺谦, 张红云

计算机科学. 2023, 50 (10): 1-6. doi:10.11896/jsjkx.230600035

摘要 ( 469 )

PDF(1901KB) ( 1517 )

参考文献 | 相关文章 | 多维度评价

深度学习对大规模数据的需求以及目标检测标注任务的复杂性促进了半监督目标检测任务的发展。近年来,半监督目标检测已经取得了很多优秀的成果。然而,伪标签中的不确定性依然是半监督目标检测研究中难以避免的问题,优越的半监督方法要求选取合适的过滤阈值来权衡伪标签的噪声信息比例和召回率,以最大程度保留准确有效的伪标签。为了解决此问题,在半监督检测的框架中引入了序贯三支决策算法,将模型输出的伪标签根据不同的筛选阈值划分为干净的前景标签、有噪声的前景标签,以及干净的背景标签,并对其采取不同的处理策略。对有噪声的前景标签采用负类学习损失来学习这些存在噪声的标签,避免学习到其中的噪声信息。实验结果表明了所提算法的性能优势,针对COCO数据集,在有监督数据占比只有10%的情况下,该方法实现了35.2%的检测精度,相比仅依靠有监督训练性能提升了11.34%。

不完备形式背景中基于OE-cp-近似概念的规则提取

牛丽慧, 米据生, 白宇璋

计算机科学. 2023, 50 (10): 7-17. doi:10.11896/jsjkx.230600037

摘要 ( 181 )

PDF(1596KB) ( 1241 )

参考文献 | 相关文章 | 多维度评价

在许多实际的应用场景中,数据测量的误差、对数据的理解和传输失真等都会导致数据的丢失,这种数据不完整的形式背景即为不完备形式背景。为了丰富不完备形式背景中的知识获取模型,文中结合三支思想在不完备形式背景中利用正算子与粗糙集理论中的必然-可能性算子构造了共同-可能(cp)近似概念,讨论了对象诱导的共同-可能(cp)近似概念与经典概念、面向属性概念、对象诱导的三支近似概念的关系,提出了由经典概念和面向属性概念构造对象诱导的cp-近似概念的算法。进而,基于OE-cp-近似概念讨论了不完备决策形式背景中近似决策规则的获取,提出了OE-cp-协调的不完备决策形式背景下的正规则和可能性规则,并给出了与基于经典概念的决策规则之间的关系。

覆盖多粒度下的形式概念更新方法

王太滨, 李德玉, 翟岩慧

计算机科学. 2023, 50 (10): 18-27. doi:10.11896/jsjkx.230600049

摘要 ( 313 )

PDF(1658KB) ( 1177 )

参考文献 | 相关文章 | 多维度评价

多粒度形式概念分析是数据挖掘与知识发现的重要工具。文中研究了覆盖多粒度下的形式概念的粗化和细化更新方法。首先,举例说明了现有的概念粗化更新算法可能导致概念缺失,通过分析缺失概念的本质特征,对现有概念粗化算法进行补充,并证明了新算法的正确性。其次,举例说明了现有的概念细化更新算法可能会生成冗余概念,通过分析冗余细概念的内涵特性,对现有的概念细化更新算法进行了优化,并证明了新算法生成结果的无冗余性,具有更低的时间复杂度。最后,通过实验验证了所提算法的有效性。

考虑需求优先性的在线医患双边匹配方法

范婷睿, 刘盾, 叶晓庆

计算机科学. 2023, 50 (10): 28-36. doi:10.11896/jsjkx.230600042

摘要 ( 205 )

PDF(2172KB) ( 1256 )

参考文献 | 相关文章 | 多维度评价

近年来,随着互联网与智慧医疗的飞速发展,在线问诊平台逐渐成为满足大众基本医疗需求的重要渠道。随着在线问诊平台患者和医生数量的不断增长,医生回答参差不齐、患者提问响应不及时、答复率严重不足等问题不断涌现。如何从大量的在线医疗内容中挖掘患者需求信息和医生服务信息,刻画患者需求满意度和医生的服务能力,实现精确匹配是亟需解决的问题。基于此,文中提出了一个融合机器学习算法的多阶段匹配模型,用于提高匹配精度和多样性。首先,从医生和患者两个视角,利用机器学习算法和情感分析工具,深度挖掘患者服务需求和医生服务能力,同时考虑到患者强烈的风险规避态度,引入前景理论描述患者风险偏好。然后,考虑到患者需求的优先性,以粒计算思想为指导,以提高医患匹配的准确性和多样性为目的, 构建多阶段动态匹配模型。最后,通过爬取好大夫网站的真实数据来进行实验,结果验证了所提方法的有效性。

基于粗糙集与密度峰值聚类的特征选择算法

曹栋涛, 舒文豪, 钱进

计算机科学. 2023, 50 (10): 37-47. doi:10.11896/jsjkx.230600038

摘要 ( 276 )

PDF(6046KB) ( 1147 )

参考文献 | 相关文章 | 多维度评价

特征选择可以有效地去除高维数据中的冗余和不相关的特征,保留重要的特征,从而降低模型计算的复杂性,提高模型精度。在特征选择过程中,针对数据中存在的离群点和边界点等可能影响分类效果的噪声数据,提出了基于粗糙集与密度峰值聚类的特征选择方法。首先,通过密度峰值聚类方法去除噪声数据,并挑出簇类中心;然后,结合粗糙集理论的思想,按簇类中心划分数据,并根据同一簇类的点应具有相同标签的假设,定义特征重要性评价指标;最后,设计了一种启发式特征选择算法,用于挑选出使簇类结构纯度更高的特征子集。在6个UCI数据集上,与其他算法进行了分类精度、特征选择个数和运行时间的对比实验,实验结果验证了所提算法的有效性和高效性。

基于构造性神经网络与全局密度信息的不平衡数据欠采样方法

严远亭, 马迎澳, 任艳平, 张燕平

计算机科学. 2023, 50 (10): 48-58. doi:10.11896/jsjkx.230600022

摘要 ( 285 )

PDF(4922KB) ( 1080 )

参考文献 | 相关文章 | 多维度评价

多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样面临的主要挑战。针对该挑战,提出了一种基于构造性神经网络和全局分布密度的不平衡数据集欠采样方法。该方法首先基于构造性神经网络,设计了一种多数类局部模式的学习方法;然后基于多数类局部模式,设计了两种具有结构保持特性的样本选择策略;最后针对局部模式学习的随机性可能导致的采样结果非优的问题,进一步引入了bagging集成策略,提升了方法的性能。在59个数据集上与13种对比方法进行了对比实验,验证了所提方法在G-mean,AUC和F1-score这3个常用指标上的有效性。

结合共享近邻和流形距离的自适应谱聚类算法

张喜梅, 解滨, 米据生, 徐童童, 张祎玲

计算机科学. 2023, 50 (10): 59-70. doi:10.11896/jsjkx.230600010

摘要 ( 318 )

PDF(6167KB) ( 1078 )

参考文献 | 相关文章 | 多维度评价

谱聚类算法是建立在图论的基础上,将聚类问题转化为图的划分问题,能识别任意形状的类簇且易于实现,因此比传统聚类算法具有更强的适应性。然而,该算法中常用的距离度量不能同时考虑全局和局部一致性,且易受到噪声影响;聚类结果依赖由输入数据构造的相似度矩阵,且通过特征分解得到松弛划分矩阵和离散化过程的两步独立策略难以得到一个共同最优解。因此,提出一种结合共享近邻和流形距离的自适应谱聚类算法(SNN-MSC),引入一种新的具有指数项和比例因子的流形距离,可以灵活调整同一流形内数据的相似度和不同流形之间数据的相似度之比,并将密度因子纳入流形距离度量中,以消除噪声影响;采用共享近邻重新定义相似度度量,能挖掘数据点之间的空间结构和局部关系;同时,对拉普拉斯矩阵施加秩约束,使相似度矩阵中的连通分量完全等于簇个数,能够在优化求解过程中自适应优化数据相似度矩阵和聚类结构,无须再进行离散化操作。在人工数据集和UCI真实数据集上的对比实验显示,所提算法在多个聚类有效性指标上能体现出更好的性能。

介粒度空间中的最优粒度选择和属性约简

李腾, 李德玉, 翟岩慧, 张少霞

计算机科学. 2023, 50 (10): 71-79. doi:10.11896/jsjkx.230500218

摘要 ( 202 )

PDF(1418KB) ( 1057 )

参考文献 | 相关文章 | 多维度评价

以往的形式概念分析采用介粒度形式背景,满足对数据跨层粒化的需求,但其既没有将寻找最优粒度和属性约简有效结合起来,又没有在多粒度的背景下高效地解决组合爆炸问题。为此,基于介粒度中粒度选择和属性约简的联系,提出了一种新的最优粒度选择方式——最优粒度约简,以同步进行粒度选择和属性约简。鉴于寻找最优粒度约简存在组合爆炸的问题,设计了逐步搜索方法,通过已搜索的信息更新粒度空间,去除大量非最优粒度约简,显著提高了搜索效率。实验结果表明了所提方法的有效性和优势。

基于多粒度特征融合的新型图卷积网络用于方面级情感分析

邓入菡, 张清华, 黄帅帅, 高满

计算机科学. 2023, 50 (10): 80-87. doi:10.11896/jsjkx.230600036

摘要 ( 172 )

PDF(2117KB) ( 1096 )

参考文献 | 相关文章 | 多维度评价

方面级情感分析是情感分析中的细粒度任务,旨在检测给定句子中方面词的情感极性。随着图卷积网络的兴起,通过依赖树构建的图卷积网络模型被广泛用于该任务,并取得了令人满意的效果。但大多数研究只获取图卷积网络最后一层输出作为分类层的输入,忽略了其他层的节点特征,且深层图卷积网络存在节点平滑问题。近年来,有研究者将图卷积网络的多层节点特征进行集成,提高了情感分类模型的性能。文中结合自适应特征融合与高速公路网络,提出了一种基于多粒度特征融合的高速公路图卷积网络模型,用于方面级情感分析。首先,该模型通过句法依赖结构和双向的上下文信息构建图卷积网络;同时,在图卷积网络引入高速公路网络缓解深层图卷积网络过平滑的问题,加深图卷积网络的深度。然后,使用自适应融合机制从不同深度图卷积网络获得多粒度节点信息。最后,在公共数据集上进行实验,实验结果表明,与基准模型相比,所提模型能更好地捕获更多粒度的句法信息和长距离依存关系。

基于分类不确定性最小化的半监督集成学习算法

何玉林, 朱鹏辉, 黄哲学, Fournier-Viger PHILIPPE

计算机科学. 2023, 50 (10): 88-95. doi:10.11896/jsjkx.230600048

摘要 ( 306 )

PDF(2418KB) ( 1087 )

参考文献 | 相关文章 | 多维度评价

半监督集成是将半监督学习与集成学习相结合的一种学习范式,它一方面通过无标记样本来提高集成学习的多样性,同时解决集成学习样本量不足的问题,另一方面集成多个分类器能够进一步提升半监督学习模型的性能。现有的研究从理论和实践两个角度证明了半监督学习与集成学习之间的互益性。针对当前半监督集成学习算法对无标记样本信息利用不完全的缺陷,文中提出了一种新的基于分类不确定性最小化的半监督集成学习(Classification Uncertainty Minimization-Based Semi-Supervised Ensemble Learning,CUM-SSEL)算法,它引入信息熵作为对无标记样本进行打标的置信度评判标准,通过最小化无标记样本打标过程中的不确定性迭代地训练分类器,实现对无标记样本的高效利用,以增强分类器的泛化性能。在标准的实验数据集上对CUM-SSEL算法的可行性、合理性和有效性进行了验证,实验表明:随着基分类器的增加,CUM-SSEL算法的训练呈现收敛的趋势,同时它能够获得优于Self-Training,Co-Training,Tri-Training,Semi-Boost,Vote-Training,Semi-Bagging以及CST-Voting算法的分类精度。

融合跟踪器:融合图像特征和事件特征的单目标跟踪框架

王琳, 刘哲, 史殿习, 周晨磊, 杨绍武, 张拥军

计算机科学. 2023, 50 (10): 96-103. doi:10.11896/jsjkx.220900075

摘要 ( 297 )

PDF(2834KB) ( 1458 )

参考文献 | 相关文章 | 多维度评价

目标跟踪是计算机视觉领域的一项基本研究问题。作为主流目标跟踪方法传感器,传统相机可以提供丰富的场景信息。但是由于受到采样原理的限制,传统相机在极端光照条件下会出现过曝光或欠曝光的问题,且在高速运动场景中存在运动模糊的现象。而事件相机是一种仿生传感器,它能够感知光照强度变化输出事件流,具有高动态范围、高时间分辨率等优点,但难以捕捉静态目标。受传统相机和事件相机的特性启发,提出了一种双模态融合的单目标跟踪方法,称为融合跟踪器(Fusion Tracker)。该方法通过特征增强的方式自适应地融合来自传统相机和事件相机数据中的视觉线索,同时设计一种基于注意力机制的特征匹配网络,将模板帧的目标线索与搜索帧相匹配,建立长期特征关联,使跟踪器关注目标信息。融合跟踪器可以解决特征匹配过程中相关性运算导致的语义丢失问题,提升目标跟踪的性能。在两个公开数据集上的实验展示了所提方法的优越性,并且通过消融实验验证了融合跟踪器中关键部分的有效性。融合跟踪器可以有效提升在复杂场景中目标跟踪任务的鲁棒性,为下游应用提供可靠的跟踪结果。

基于自适应正则化的无偏场景图生成方法

李浩晨, 曹付元, 乔世昌

计算机科学. 2023, 50 (10): 104-111. doi:10.11896/jsjkx.221000084

摘要 ( 217 )

PDF(4153KB) ( 1432 )

参考文献 | 相关文章 | 多维度评价

场景图生成旨在给定一张图片,通过目标检测模块得到实体和实体间关系的视觉三元组形式,即主语、关系和宾语,构建语义结构化表示。场景图可应用于图像检索和视觉问答等下游任务。然而,由于数据集中的实体间关系呈长尾分布,因此现有模型在预测关系时更偏向于粗粒度的头部关系。这样的场景图无法对下游任务起到辅助性作用。以往工作普遍采用再平衡策略,如重采样和重加权的方法,来解决长尾问题。但模型反复学习尾部关系样本,易出现过拟合现象。为了解决上述问题,文中提出了一种自适应正则化无偏场景图生成方法。具体来说,该方法通过设计一个基于先验关系频率的正则项,自适应地调整模型全连接分类器权重,从而实现对模型的平衡预测。所提方法在场景图VG(Visual Genome)数据集上进行了实验,实验结果表明,该方法不仅能防止模型过拟合,也能缓解关系长尾分布问题对场景图生成的负面影响,且最先进的场景图生成方法在结合所提方法后能更有效地改善无偏场景图生成的性能。

基于多尺度Transformer融合多域信息的伪造人脸检测

马欣, 吉立新, 李邵梅

计算机科学. 2023, 50 (10): 112-118. doi:10.11896/jsjkx.220900048

摘要 ( 324 )

PDF(2733KB) ( 1545 )

参考文献 | 相关文章 | 多维度评价

当前,基于Deepfakes等深度伪造技术生成的“换脸”类伪造视频泛滥,给公民个人隐私和国家政治安全带来巨大威胁,为此,研究视频中深度伪造人脸检测技术具有重要意义。针对已有伪造人脸检测方法存在的面部特征提取不充分、泛化能力弱等不足,提出一种基于多尺度Transformer对多域信息进行融合的伪造人脸检测方法。基于多域特征融合的思路,同时从视频帧的频域与RGB域进行特征提取,提高模型的泛化性;联合EfficientNet和多尺度Transformer,设计多层级的特征提取网络以提取更精细的伪造特征。在开源数据集上的测试结果表明,相比已有方法,所提方法具有更好的检测效果;同时在跨数据集上的实验结果证明了所提模型具有较好的泛化性能。

基于ConvNeXt热图定位和对比学习的细粒度图像分类研究

郑世杰, 王高才

计算机科学. 2023, 50 (10): 119-125. doi:10.11896/jsjkx.220900196

摘要 ( 276 )

PDF(2251KB) ( 1444 )

参考文献 | 相关文章 | 多维度评价

针对细粒度图像分类中高类内差异和低类间差异的挑战,提出一种以ConvNeXt网络为主干,使用GradCAM热图进行裁剪和注意力擦除的多分支细粒度图像分类方法。该方法利用GradCAM通过梯度回流得到网络的注意力热图,定位到具有判别性特征的区域,裁剪并放大该区域,使网络关注局部更深层次的特征。同时引入有监督的对比学习,扩大类间差异,减小类内差异。最后进行热图注意力擦除操作,使网络在关注最具判别性特征的前提下,也能关注其他对分类有用的区域。所提方法在CUB-200-2011,Stanford Cars,FGVC Aircraft和Stanford Dogs数据集上的分类准确率分别达到了91.8%,94.9%,94.0%,94.4%,优于多种主流的细粒度图像分类方法,并且在CUB-200-2011和Stanford Dogs数据集上分别达到了top-3和top-1的分类准确率。

一种基于主动学习的文本实体与关系联合抽取方法

丁泓馨, 邹佩聂, 赵俊峰, 王亚沙

计算机科学. 2023, 50 (10): 126-134. doi:10.11896/jsjkx.230300079

摘要 ( 295 )

PDF(1942KB) ( 1709 )

参考文献 | 相关文章 | 多维度评价

非结构化文本数据中蕴含了大量有价值的知识,从中抽取出实体与关系形成结构化的知识,有助于知识图谱的构建,也可以为下游任务提供支持,具有广泛的应用前景。目前,实体与关系抽取问题多采用深度学习方法,但其模型的训练需要消耗大量标注数据,人工成本高,如何减少人工标注的工作量是当前研究的重点之一。主动学习是机器学习的领域之一,旨在通过选择最有价值的样本交予模型训练,在最大化模型性能增益的同时减少模型训练所需的数据量,其减少模型训练所需数据的潜力与深度学习数据贪婪的特性互补。因此,将主动学习应用到深度学习中的深度主动学习也是目前的研究热点。在上述背景下,使用深度主动学习进行实体与关系的联合抽取,将主动学习用于实体与关系抽取的深度学习模型的训练过程,在保持抽取模型性能的同时尽可能减少模型训练所需的人工标注数据。使用了一个基于统一标签空间、通过矩阵标注实现实体与关系联合抽取的深度学习模型,并在其基础上设计并实现了多种主动学习采样策略,在医疗领域的文本数据集和常用的实体与关系联合抽取数据集上验证了所提方法的有效性。对主动学习停止时机确定问题展开了研究,提出了根据模型训练损失曲线、模型在训练集上的性能、模型在预留数据上的预测稳定性来选择训练停止时机的方法,并通过实验研究了面向实际应用场景选取停止时机的方法。设计并实现了基于主动学习的文本实体与关系联合抽取的智能文本标注工具,可供用户对文本进行实体标注与关系标注,该工具实现了实体与关系抽取的深度学习模型与主动学习方法,可以最大程度地减少用户标注的工作量。

基于图对比学习的多模态交通流量协同预测方法

肖杨, 秦建阳, 李肯立, 王鸽, 李瑞, 廖清

计算机科学. 2023, 50 (10): 135-145. doi:10.11896/jsjkx.230700127

摘要 ( 297 )

PDF(4113KB) ( 1631 )

参考文献 | 相关文章 | 多维度评价

准确的城市区域交通流量预测对市区车辆调度、公交系统优化等具有重要指导意义。目前,大多数现有的交通流量预测方法只考虑规则网格区域上单一种类的交通流量预测,忽略了交通网络中空间的不规则性和异质性以及不同出行模式交通流的交互性。针对上述问题,提出了一种基于图对比学习的多模态交通流量协同预测方法(CoF-MGCL),以揭示各类出行方式之间的交互对不规则异构区域的交通需求的影响。具体而言,根据现实中城市的不规则区域采集多模态流量数据,包括各类出行模式流量(如自行车和出租车流量)和总流量;并对不规则区域构建多关系异构图,包括地理邻近和功能相似关系。通过异构图编码模块,可以结合异构图中不同的关系来学习各区域各类交通流量的高质量表征信息。学习到的单一交通流量表征经过注意力机制加权融合后与总交通流量表征进行图对比学习,以捕获不同出行模式之间的交互关系。最后,使用互信息约束实现多模态流量的协同预测,确保多模态信息学习最大化。为了实现不规则区域的多模态交通流量预测,自行构建了新的纽约市曼哈顿区和芝加哥市两地多模态交通流量数据集,并在此基础上进行实验。实验结果表明,所提方法可以结合现有的单模态交通流量预测模型,在均方误差(RMSE)和平均绝对误差(MAE)两个预测指标上实现0.43%～12.13%的性能提升,验证了所提方法的有效性。

基于知识增强的企业实体关系预测模型

王家祺, 李文根, 关佶红, 邢婷, 魏小敏, 邵冰清, 付宠洁

计算机科学. 2023, 50 (10): 146-155. doi:10.11896/jsjkx.221000063

摘要 ( 332 )

PDF(3651KB) ( 1557 )

参考文献 | 相关文章 | 多维度评价

随着知识图谱的不断发展,大量应用于工业界的产业知识图谱应运而生。然而,这些产业知识图谱经常缺乏充足的企业关联关系,如上下游关系、供应关系、合作关系、竞争关系等,导致其应用范围受到极大限制。现有企业关系预测研究大多仅关注知识图谱中三元组本身的结构信息,未能充分利用企业文本描述和企业关联实体的描述等多视角信息。为解决该问题,提出了一种基于知识增强的企业实体关系预测模型KERP。模型首先通过多视角实体特征三元组学习,完善企业实体特征表示;其次,利用图注意力网络获取实体的高阶语义表示,并与TransR模型学习的实体关系低阶语义表示进行融合,进一步增强企业实体及其关系的特征表示;最后,通过二维卷积解码器ConvE实现对企业实体关系的预测。在新能源汽车产业知识图谱数据上的实验分析表明,与现有主流实体关系预测模型相比,KERP在预测企业关系上具有更好的效果,在F1值上有6.7%的提升。此外,在多个公开实体关系预测数据集上的实验结果表明,KERP模型在一般化的实体关系预测任务上也具有较好的通用性。

基于意图的多智能体深度强化学习运动规划方法

彭滢璇, 史殿习, 杨焕焕, 胡浩萌, 杨绍武

计算机科学. 2023, 50 (10): 156-164. doi:10.11896/jsjkx.220900031

摘要 ( 210 )

PDF(3505KB) ( 1624 )

参考文献 | 相关文章 | 多维度评价

现有的多智能体运动规划任务存在缺乏有效合作方法、通信依赖要求高以及缺乏信息筛选机制等问题。针对这些问题,提出了一种基于意图的多智能体深度强化学习运动规划方法,该方法可以帮助智能体在无需显式通信的条件下无碰撞地到达目标点。首先,将意图概念引入多智能体运动规划问题,将智能体的视觉图像和历史地图相结合以预测智能体的意图,使智能体可以对其他智能体的动作做预判,从而有效协作;其次,设计了一个基于注意力机制的卷积神经网络架构,并利用该网络预测智能体的意图、选择智能体的动作,在筛选出有用的视觉输入信息的同时,减少了多智能体合作对通信的依赖;最后提出了一种基于价值的深度强化学习算法来学习运动规划策略,通过改进目标函数和Q值计算方式使策略更加稳定。在PyBullet仿真平台的6种不同的仿真场景中进行了测试,实验结果表明,相较于其他先进的多智能体运动规划方法,所提方法使多智能体团队的合作效率平均提高了10.74%,具有显著的性能优势。

基于联邦学习的网络化ICU呼吸机和镇静剂管理方法

曹林霄, 刘佳, 朱怡飞, 周浩泉, 龚伟, 于卫华, 李朝友

计算机科学. 2023, 50 (10): 165-175. doi:10.11896/jsjkx.220900177

摘要 ( 199 )

PDF(3287KB) ( 1582 )

参考文献 | 相关文章 | 多维度评价

医疗物联网设备的激增和丰富的医疗数据为智慧医疗提供了新的可能。重症监护室(ICU)的病人依靠众多医疗边缘设备来持续监测管理患者的健康状况。在ICU常见的治疗干预措施中,有创机械通气和镇静剂的注射多用于维持患者的呼吸功能,提高治疗质量,而现有的治疗干预措施很大程度上依赖于医生的判断。文中提出了一种基于联邦学习的临床辅助决策方法——MFed,可以基于网络化ICU分布式协作学习最佳干预政策。该方法应用基于差分隐私的联邦学习方法,打破了医疗数据隐私方面的限制以及医疗数据孤岛的窘境;用分布鲁棒优化确保最坏情况下的性能并结合伪孪生网络实现自适应地滤除噪声数据。最后,在现实ICU数据集上的实验表明,与其他最先进的基线相比,所提方法的准确率提高了36.75％。

基于变分自编码器的多隐变量双向推理模型

赵雁斌, 苏锦钿

计算机科学. 2023, 50 (10): 176-183. doi:10.11896/jsjkx.220900201

摘要 ( 277 )

PDF(1819KB) ( 1533 )

参考文献 | 相关文章 | 多维度评价

开放域对话系统的关键任务之一是生成丰富多样且连贯的对话回复,但是仅从上文信息进行单向推理无法达到这一目标。针对该问题,提出了基于多隐变量的双向推理模型MLVBI(Multiple Latent Variables Bidirectional Inference)。首先,在语言模型中结合变分自动编码器并将单向推理扩充到双向推理,将语料分割为上文、查询与回复后,使用正向推理从查询中推理出回复用于学习正常语序信息,同时使用反向推理从回复中推理出查询用于学习额外主题信息,最后融合成双向推理,使得模型生成更连贯的回复。其次,针对双向推理过程中单个隐变量解释能力不足的问题,引入多个隐变量进一步提高生成对话的多样性。实验结果表明,MLVBI在两个开放域数据集DailyDialog和PersonalChat上的准确性和多样性都达到了当前最佳的效果,并且消融实验也证明了双向推理和多隐变量的有效性。

基于纳什竞价的空间众包任务定价算法

林韦达, 董红斌, 赵炳旭

计算机科学. 2023, 50 (10): 184-192. doi:10.11896/jsjkx.220900130

摘要 ( 239 )

PDF(4210KB) ( 1553 )

参考文献 | 相关文章 | 多维度评价

任务定价是众包平台解决利润驱动的任务分配、最大化利润的重要步骤。然而关于工人期望的任务定价研究相对较少,现有大多数研究并不考虑工人与任务的动态需求。此外,出于工人隐私和传感器限制,获取完整的工人信息是困难的。为解决上述难题,提出了基于纳什竞价的空间众包任务定价算法。首先通过机器学习算法获取任务的价格范围,然后在价格区间上进行纳什竞价。为了解决动态供需造成的价格大幅波动问题,设计调整机制来稳定任务均价。最后为模拟纳什均衡点,采用了两种不同的梯度递减函数,来搜索匹配数最大的任务定价。分别在gMission数据集和合成数据集进行了实验,结果表明所提算法的匹配数量和任务均价分别是MCMF算法的60%和1.57倍,时间花费是MCMF算法的9.6%,验证了所提算法的有效性。

基于方面语义和门控过滤网络的方面级情感分析

何智豪, 陈红梅, 罗川

计算机科学. 2023, 50 (10): 193-202. doi:10.11896/jsjkx.220900192

摘要 ( 279 )

PDF(2276KB) ( 1516 )

参考文献 | 相关文章 | 多维度评价

方面级情感分析(Aspect-based Sentiment Analysis,ABSA)是一项细粒度的情感分析任务,旨在预测文本中特定方面的情感极性。目前,鉴于循环神经网络在序列建模方面的卓越性能以及卷积神经网络学习局部模式的出色表现,部分工作将两者相结合来挖掘情感信息,并且取得了不错的效果。但是,少有工作在将两者结合后应用到方面级情感分析任务中的同时考虑方面信息。在方面级情感分析任务中,大部分工作将方面视作一个独立整体与上下文进行交互,但是对于方面的表示过于简单,缺乏真实语义。针对上述问题,文中提出了一种基于方面语义和门控过滤网络(Aspect Semantic and Gated Filtering Network,ASGFN)的神经网络模型,用于挖掘方面级情感信息。首先,设计了方面编码模块,用于捕捉特定语境下的方面语义信息,该模块基于全局上下文融合多头注意机制与图卷积神经网络构建包含特定语义的方面表示。其次,设计门控过滤网络连接循环神经网络和卷积神经网络,以此增强方面与上下文的交互,同时结合循环神经网络与卷积神经网络的优势,进而提取情感特征。最后,将情感特征与方面表示相结合,生成预测情感极性的语义表征。在restaurant,laptop和twitter这3个公用数据集上分别取得了84.72%,78.64%,76.22%的情感分类准确率。实验结果表明了所提模型的有效性,它能提高方面级情感分类任务的性能。

基于两层知识迁移的多代理多任务优化方法

马慧, 冯翔, 虞慧群

计算机科学. 2023, 50 (10): 203-213. doi:10.11896/jsjkx.220900242

摘要 ( 233 )

PDF(4954KB) ( 1540 )

参考文献 | 相关文章 | 多维度评价

进化多任务优化是计算智能领域一个新兴的研究方向,它致力于研究通过进化算法如何同时、有效地求解多个优化问题,从而提高单独求解每个任务的性能。基于此,提出了一种基于两层知识迁移的多代理多任务优化算法(AMS-MTO),其通过在代理间和代理内同时进行知识迁移来达到跨域优化的目的。具体来讲,代理内的知识迁移是通过差分进化实现决策变量信息的跨维迁移,从而避免算法陷入局部最优;代理间的学习采用了隐式知识迁移和显式知识迁移两种策略。隐式知识迁移利用种群的选择性交叉来产生后代,促进遗传信息的交流;显式知识迁移是对精英个体的迁移,可以弥补隐式迁移随机性很强的缺点。为了评估两层知识迁移的多代理多任务优化方法的有效性,在8个高达100维的基准问题上进行了实证研究,同时给出了收敛证明,并将其与现有的算法进行了对比。实验结果表明,在求解单目标优化的昂贵问题时,AMS-MTO算法效率更高,性能更好,收敛速度更快。

基于课程强化学习的无人机反坦克策略训练模型

林泽阳, 赖俊, 陈希亮, 王军

计算机科学. 2023, 50 (10): 214-222. doi:10.11896/jsjkx.220700121

摘要 ( 252 )

PDF(3960KB) ( 1567 )

参考文献 | 相关文章 | 多维度评价

智能化时代,陆战场的争夺从平面制陆向立体制陆拓展,无人机反坦克作战在未来智能化战争制陆权的争夺中起着至关重要的作用。针对深度强化学习方法在复杂问题求解中面临的决策空间爆炸、奖励稀疏等问题,提出了一种基于VDN的动态多智能体课程学习方法。该方法在多智能体深度强化学习的训练过程中加入课程学习方法,结合Stein变分梯度下降算法改善课程学习的学习过程,解决了强化学习在复杂任务中初始训练效果差、训练时间长和收敛难的问题,并在多智能体粒子环境和无人机反坦克作战场景中分别构建了课程学习模型,实现了模型与训练先验知识从易到难的迁移。实验结果表明,通过课程学习DyMA-CL机制对强化学习训练过程进行改善,强化学习智能体在进行困难任务学习时能够获得更好的初始训练效果和更快的模型收敛速度,从而得到更好的最终效果。

基于提示学习的生物医学关系抽取方法

文坤建, 陈艳平, 黄瑞章, 秦永彬

计算机科学. 2023, 50 (10): 223-229. doi:10.11896/jsjkx.220900108

摘要 ( 282 )

PDF(3062KB) ( 1674 )

参考文献 | 相关文章 | 多维度评价

在非结构化生物医学文本数据中提取出实体之间的关系,对生物医学的信息化发展有着重大意义,同时也是自然语言处理领域的研究热点。目前,在生物医学数据中正确地提取出实体间的关系面临着两个难点:1)由于在生物医学数据中实体单词大多由复合词、未知词组成,模型难以学习到实体内部的语义特征;2)由于生物医学带标注数据较少,而神经网络的参数量较大,使得神经网络容易过拟合。因此,文中提出了基于提示学习的生物医学关系抽取方法,增加了一种针对实体的注解标签,来对实体进行提示以达到实体语义增强以及联系上下文信息的目的。此外,在传统提示调优方法的基础上,文中使用连续性模板来缓解人工设计模板所带来的性能偏差,同时结合深度前缀控制attention的深度提示能力,使模型在处理较少数据的情况时仍能取得良好的效果。

基于演化序搜索的混合贝叶斯网络结构学习方法

李明嘉, 钱鸿, 周爱民

计算机科学. 2023, 50 (10): 230-238. doi:10.11896/jsjkx.221000046

摘要 ( 222 )

PDF(2222KB) ( 1508 )

参考文献 | 相关文章 | 多维度评价

贝叶斯网络是一种不确定性知识表示与推理的有效工具,学习其结构是利用这一工具进行推理的基础。现有的贝叶斯网络结构学习算法,在智能教育等应用场景中往往面临着难以权衡有效性与高效性的问题。一方面,评分搜索类方法能搜索到高质量的解,但面临着算法复杂度高的挑战。另一方面,混合类方法效率高,但所找到的解的质量不尽如人意。针对上述问题,提出了一种基于演化序搜索的混合贝叶斯网络结构学习方法(EvOS)。该方法首先通过约束类算法构建无向图骨架,然后利用演化算法搜索最优节点序,最后使用该节点序指导贪婪搜索得到贝叶斯网络结构。基于常用基准数据集以及教育知识结构发现任务,验证了所提方法的有效性与高效性。实验结果表明,所提方法相较于评分搜索类方法,能够在保持相仿精度的情况下最高加速百倍,且有效性显著高于混合类方法。

vsocket:一种基于RDMA的兼容标准套接字加速方法

陈云芳, 茆昊天, 张伟

计算机科学. 2023, 50 (10): 239-247. doi:10.11896/jsjkx.220800048

摘要 ( 262 )

PDF(3675KB) ( 2218 )

参考文献 | 相关文章 | 多维度评价

为了兼容Linux标准套接字,同时利用RDMA提高使用套接字的程序的性能,提出在上层应用与底层RDMA之间搭建一个中间件——Viscore Socket adaptor(简称vsocket);通过拦截socket API,将上层应用通过套接字收发的数据流无缝转接到RDMA承载上。vsocket绕过管理收发缓冲区的内核,针对TCP和UDP分别实现了用户空间的内存管理机制,使用RC类型的RDMA网络支持TCP加速,使用UD类型的RDMA网络支持UDP加速,并重用Linux UDP来辅助其路由。实验结果表明vsocket能够保证Linux标准套接字接口的兼容性,提升网络性能,摆脱Linux内核网络协议栈的限制,改善收发数据的延迟与带宽。

基于谱聚类的边缘服务器放置算法

郭迎亚, 王丽娟, 耿海军

计算机科学. 2023, 50 (10): 248-257. doi:10.11896/jsjkx.220900211

摘要 ( 150 )

PDF(2532KB) ( 2016 )

参考文献 | 相关文章 | 多维度评价

随着物联网(IoT)和 5G 技术的快速发展,移动边缘计算以其低访问延迟、低带宽成本和低能源消耗的优点引起了工业界和学术界的广泛关注。在移动边缘计算中,边缘服务器为移动端用户的请求提供服务,其放置位置对边缘计算性能和用户体验具有重要影响。目前边缘服务器的放置算法只考虑基站的地理位置,而缺乏对基站连接的用户数目因素的考虑。因此在实际用户分布不均的情况下,现有算法得到的服务器放置位置导致用户平均访问延迟较大。为了更好地解决上述问题,提出了基于谱聚类的延迟最小化边缘服务器放置算法LAMP。该算法在考虑边缘服务器放置位置时,不仅考虑了基站的地理位置,而且考虑了不同基站连接的用户数目这一重要参数,能够有效地降低用户的平均访问时延,同时实现边缘服务器的工作负载均衡。在仿真实验中,使用了上海电信的真实基站数据集来测试LAMP算法的性能。大量的实验结果表明,在用户访问延迟方面,LAMP算法的性能比传统的K-means 算法提高了37.9%。在负载均衡方面,LAMP算法的性能与K-means算法相比最大可提高82.85%。LAMP算法在降低访问延迟和平衡边缘服务器工作负载方面均表现出了优越的性能。

基于跨层链路质量状态感知的无人机地理位置路由协议

周雁翎, 米志超, 路颜霞, 王海

计算机科学. 2023, 50 (10): 258-265. doi:10.11896/jsjkx.230500221

摘要 ( 81 )

PDF(3071KB) ( 2050 )

参考文献 | 相关文章 | 多维度评价

地理位置路由协议由于开销较低和可扩展性较好而在FANET网络中得到了广泛应用,但其贪婪转发过程中依据最靠近目的地的邻居节点作为中继的策略还存在一定的局限性。文中通过感知链路质量,提出了一种适用于拓扑变化频繁、网络环境拥挤的跨层链路质量状态感知的无人机地理位置路由协议(CLAQ-GPSR)。通过设立通信安全区,建立链路负载和流间干扰度量模型,采用交付比ETX衡量链路质量,结合物理层、MAC层、网络层数据综合衡量最可靠的中继节点,以提升通信质量。同时采用左右手组合转发规则,加快路径恢复中的转发速度,避免传统周边转发出现的路由循环等问题。通过网络仿真平台比对分析可知,相比传统的GPSR,W-GeoR和DGF-ETX协议,所提协议在数据包分组投递成功率、端到端时延和跳数等指标上更具优势。

基于BiLSTM神经网络的多服务器门限服务系统性能分析

杨志军, 黄文洁, 丁洪伟

计算机科学. 2023, 50 (10): 266-274. doi:10.11896/jsjkx.221000221

摘要 ( 85 )

PDF(2545KB) ( 1915 )

参考文献 | 相关文章 | 多维度评价

为了满足运行速度快、时延低、性能好、公平性好等特点,提出了多服务器门限服务系统,并利用BiLSTM(Bi-direc-tional Long Short-Term Memory)神经网络对其进行预测分析,使用多服务器接入方式来降低网络时延,改善系统性能。多个服务器调度时,可以采用同步和异步两种方式。首先,研究多服务器门限服务的系统模型。其次,在单服务器的基础上,利用嵌入马尔可夫链和概率母函数的分析方法对多服务器门限服务的平均排队队长、平均循环周期和平均时延进行求解;同时,利用Matlab进行仿真实验,分别将单服务器系统与多服务器系统的理论值与仿真值进行系统分析,对比多服务器同步和异步两种方式。最后,构建BiLSTM神经网络来预测多服务器系统的性能。实验结果表明,该多服务器系统异步方式优于同步和单服务器系统,多服务器异步系统的性能更好,时延更低,效率更高。综合对比多服务器的3种基本服务系统,在保证公平性的情况下,门限服务系统更加稳定。并且使用BiLSTM神经网络预测算法能够准确预测系统的性能,提高计算效率,对轮询系统的性能评价具有指导意义。

服务缓存约束下优化用户设备执行成本的任务卸载策略

张俊娜, 陈家伟, 鲍想, 刘春红, 袁培燕

计算机科学. 2023, 50 (10): 275-281. doi:10.11896/jsjkx.220900185

摘要 ( 306 )

PDF(2869KB) ( 1904 )

参考文献 | 相关文章 | 多维度评价

边缘计算通过在网络边缘侧提供更优的计算和存储能力,能够有效降低用户设备的执行时延和能耗。随着应用程序对计算和存储资源的需求越来越大,任务卸载作为消除用户设备固有限制的一种有效手段,成为了主要的研究热点之一。然而,在已有的任务卸载研究中,常常忽略不同类型的任务对服务需求的多样性以及边缘服务器服务缓存有限的情形,从而导致不可行的卸载决策。因此,在服务缓存约束下,研究了能够使得用户设备执行成本最优的任务卸载问题。首先设计了云服务器、边缘服务器和本地设备的协同卸载模型,用于平衡边缘服务器的负载问题,同时借助云服务器弥补边缘服务器有限的服务缓存能力。然后,提出了适用于云边端协同的任务卸载算法,优化用户设备的执行成本。当任务被卸载时,先采用改进的贪婪算法选择最佳的边缘服务器,再通过比较任务在不同位置上的执行成本,来确定任务的卸载决策。实验结果表明,所提算法相比对比算法能够有效降低用户设备的执行成本。

众包中基于CIDA和PI-Cosine的双向质量控制策略

刘庆菊, 潘庆先, 童向荣, 于嵩, 潘亚楠

计算机科学. 2023, 50 (10): 282-290. doi:10.11896/jsjkx.221000133

摘要 ( 268 )

PDF(2645KB) ( 1909 )

参考文献 | 相关文章 | 多维度评价

随着移动智能终端的普及,众包采集大规模感知数据变得越来越容易。众包工人的自私性使得他们想通过最少的努力获得最多的报酬,甚至互相勾结、随意提交众包数据,导致众包任务完成质量不高。文中提出了一种基于陪审团的质量控制策略,该机制解决了数据验证问题。针对降低众包质量的行为,在判断是否存在垃圾邮件员工和共谋组织后,使用社区影响力检测算法(CIDA)来检测出共谋团伙领导者及其所在组织,最后使用改进的相似性检测算法(PI-Cosine)筛查垃圾邮件员工。从这两个方面来提高众包数据质量。实验结果表明,所提方法在accuracy和F1-score衡量指标上相比Cosine相似度检测算法提高了12.3%。

云环境中面向可靠性约束的工作流调度策略研究

李金亮, 林兵, 陈星

计算机科学. 2023, 50 (10): 291-298. doi:10.11896/jsjkx.220800039

摘要 ( 126 )

PDF(1836KB) ( 1912 )

参考文献 | 相关文章 | 多维度评价

随着越来越多的计算密集型依赖应用被卸载到云环境中执行,工作流调度问题受到了广泛的关注。针对云环境多目标优化的工作流调度问题,考虑到任务执行过程中服务器可能会发生性能波动和宕机等问题,基于模糊理论,使用三角模糊数表示任务执行时间和数据传输时间,提出了一种基于遗传算法的自适应粒子群优化算法(Adaptive Particle Swarm Optimization based GA,APSOGA),目的是在工作流的可靠性约束下,综合优化工作流的完成时间和执行代价。该算法为了避免传统粒子群优化算法存在的过早收敛问题,引入了遗传算法的随机两点交叉操作和单点变异操作,有效地提升了算法的搜索性能。实验结果表明,与其他策略相比,基于APSOGA的调度策略能够有效地降低云环境中面向可靠性约束的科学工作流的模糊总代价。

使用Wi-Fi感知连续行为动作的跨域身份认证

孔浩, 俞嘉地

计算机科学. 2023, 50 (10): 299-307. doi:10.11896/jsjkx.220900163

摘要 ( 96 )

PDF(2989KB) ( 1303 )

参考文献 | 相关文章 | 多维度评价

目前,面向智能物联网场景的用户身份认证方法正蓬勃发展。一些工作利用室内环境中广泛存在的Wi-Fi信号感知用户的行为动作,并提取用户行为动作中蕴含的个体行为的独特性来实现用户身份认证。然而,用户必须在已知域背景(环境、位置、方向)下执行独立的行为动作,系统才能有效地进行身份认证。为突破现有方法的限制,提出了使用Wi-Fi信号感知人体连续行为动作的跨域身份认证系统CroAuth,其能够在用户执行连续行为动作时实现跨环境、位置、方向的用户身份认证。为突破执行独立行为动作的限制,提出了基于动态时间规整的连续行为动作分离算法,在用户多样化的连续行为中分离出特定的行为动作序列,以实现有效的行为信息提取。之后,提出了基于孪生神经网络的跨域身份认证方法,提取域无关的个体行为特征,并进一步利用知识蒸馏方法构建小样本学习的跨域身份认证模型,以实现在不同环境、位置和方向下的用户身份认证。实验结果表明,CroAuth能够在用户执行多样化的连续行为动作时,在跨环境、位置、方向的场景下对用户身份进行认证。

基于侧信道特征的IPSec VPN闭合性检测方法

孙云霄, 李军, 王佰玲

计算机科学. 2023, 50 (10): 308-314. doi:10.11896/jsjkx.230500141

摘要 ( 143 )

PDF(2595KB) ( 1208 )

参考文献 | 相关文章 | 多维度评价

IPSec VPN按照应用场景的不同可以分为闭合型网络和开放型网络,闭合型网络常用于定制虚拟专用网,而开放型网络代理是规避网络审计的常用手段,因此,IPSec VPN网络类型的识别分类对于网络监管具有重要意义。根据两种网络类型在业务复杂度上的区别,提出利用加密流量侧信道特征进行IPSec VPN闭合性检测的方法,提取IPSec加密流量帧长序列和隧道内TCP最大分片长度(Maximum Segment Size,MSS)的分布,引入信息熵来度量MSS值的分布情况,将MSS值信息熵和帧长序列的标准差作为特征向量,使用支持向量机和随机森林等机器学习算法进行训练和预测。实验结果表明,使用该分类方法进行闭合性检测的准确率超过了96%,可有效识别用于开放代理的VPN隧道。

效用优化的本地差分隐私联合分布估计机制

尹诗玉, 朱友文, 张跃

计算机科学. 2023, 50 (10): 315-326. doi:10.11896/jsjkx.221000053

摘要 ( 207 )

PDF(3180KB) ( 1216 )

参考文献 | 相关文章 | 多维度评价

相对于传统的中心化差分隐私,本地差分隐私(Local Differential Privacy,LDP) 具有不依赖可信第三方等优势,但也存在数据效用较低的问题。效用优化本地差分隐私模型ULDP(Utility-Optimized Local Differential Privacy) 利用不同输入的敏感度差异,可以提升估计结果的准确度。二维数据联合分布计算可广泛应用于众多数据分析场景,然而,如何在ULDP模型下实现二维数据联合分布估计,仍然是尚未解决的重要问题。针对这一问题,首先给出了二维ULDP模型的定义,兼顾了两个属性分别敏感与否的4种情况;其次,在该模型下,针对联合分布估计问题,提出了JuRR(Joint Utility-Optimized Randomized Response) 与CPRR(Cartesian Product Randomized Response) 2种机制,并理论证明了估计结果的无偏性;最后,在真实数据集上进行对比实验,讨论了不同参数对估计误差的影响。实验结果表明,所提2种机制具有更高的数据效用。

基于静态和动态特征相结合的隐私泄露检测方法

丁旭辉, 张琳琳, 赵楷, 王旭升

计算机科学. 2023, 50 (10): 327-335. doi:10.11896/jsjkx.220800181

摘要 ( 253 )

PDF(2752KB) ( 1259 )

参考文献 | 相关文章 | 多维度评价

大数据背景下Android软件窃取用户个人信息的问题愈发严峻。针对现有隐私泄露检测方法中静态分析误报率较高和动态分析容易出现漏检的问题,提出了一种基于静态和动态特征相结合的隐私泄露检测方法。融合应用程序中提取的多维度静态特征和动态特征,使用梯度下降算法为SVM,RF,XGBoost,LightGBM和CatBoost分配最优权重,通过集成学习加权投票来检测隐私泄露风险。对2 951个应用进行实验分析,结果表明该方法的精确率达到了95.14%,明显优于仅使用单一特征和单一分类器,可以有效检测Android应用的隐私泄露风险。

基于本体推理的智能合约漏洞检测系统

陈瑞翔, 焦健, 王若华

计算机科学. 2023, 50 (10): 336-342. doi:10.11896/jsjkx.220900183

摘要 ( 235 )

PDF(2055KB) ( 1216 )

参考文献 | 相关文章 | 多维度评价

随着区块链的不断发展,基于以太坊的智能合约越发受到各界的广泛关注,但随之而来的是其面临着更多的安全威胁。针对以太坊智能合约的安全问题,出现了各种漏洞检测方法,如符号执行、形式化验证、深度学习等,但现有的检测方法能检测到的漏洞类型大多不全面,缺乏可解释性。针对这些问题,设计并实现了针对Solidity高级语言层面的基于本体推理的智能合约漏洞检测系统。该系统先把智能合约源码解析为抽象语法树,再进行合约信息抽取,利用抽取到的数据信息构建智能合约漏洞检测本体,并使用推理机进行本体推理。实验选取了其他检测工具与本系统进行对比,并使用这几种工具对100份智能合约样本进行检测。实验结果表明,所提系统的检测效果良好,能检测多种类型的智能合约漏洞,并能给出其漏洞的相关信息。

基于Event-B的可靠智能合约自动生成方法

朱健, 胡凯, 王军, 李洁, 叶亚飞, 时希言

计算机科学. 2023, 50 (10): 343-349. doi:10.11896/jsjkx.220800134

摘要 ( 201 )

PDF(2636KB) ( 1201 )

参考文献 | 相关文章 | 多维度评价

智能合约是一种以代码的方式执行合同条款的可计算交易协议,其应用场景与规模日益增长,承载着多达数十亿美元的各类资产。由于其代码缺陷可能会造成严重的经济损失,因此智能合约的可信开发成为技术关键。为此,提出了一种基于集合论语言Event-B的智能合约可信验证与自动生成方法。Event-B方法是一种基于精化的形式化方法,可用于规约、设计和验证软件系统。通过对智能合约的模型验证和可执行代码的自动生成技术,研发了自动转换工具EB2S,打通了形式化模型和智能合约编程语言的语义鸿沟和技术壁垒。最后,选取典型的在线支付智能合约场景,应用基于Event-B的智能合约模型自动生成合约代码,验证了EB2S转换工具的有效性。

一种基于纠删码的区块链账本分组存储优化方法

张玉书, 何晓彤, 肖祥立, 朱友文, 王良民

计算机科学. 2023, 50 (10): 350-361. doi:10.11896/jsjkx.220800193

摘要 ( 202 )

PDF(3536KB) ( 1280 )

参考文献 | 相关文章 | 多维度评价

传统区块链系统采用全副本冗余的存储方式,每个节点存储相同的账本,使得区块链的存储负担非常大。目前,相关的区块链存储优化方法能够降低数据存储开销,但仍存在可扩展性差和可用性低的问题。为此,提出了一种基于纠删码的区块链账本分组存储优化方法。该方法引入一种新的区块链节点——分组存储(Grouping Storage,GS)节点,来解决上述问题。区块链账本的主要存储开销位于区块文件中,GS节点采用纠删码对区块文件编码,并以组为单位存储编码后的区块文件,如此,每个组织维持相同的账本,极大地降低了区块链的存储开销且提高了区块链的可用性。针对联盟链的存储扩展,基于GS节点对超级账本文件系统进行改进,重新设计了其存储、恢复和同步区块文件流程,使得本方案能够在实际的区块链架构上工作。最后,理论分析和实验结果表明,所提出的GS节点在存储开销方面取得了显著的进步,且具有较好的可扩展性和可用性。

基于SVD的深度学习模型对抗鲁棒性研究

赵子天, 詹文翰, 段翰聪, 吴跃

计算机科学. 2023, 50 (10): 362-368. doi:10.11896/jsjkx.220800090

摘要 ( 139 )

PDF(1607KB) ( 1204 )

参考文献 | 相关文章 | 多维度评价

对抗攻击的出现对于深度神经网络(DNN)在现实场景中的大规模部署产生了巨大的威胁,尤其是在与安全相关的领域。目前已有的大多数防御方法都基于启发式假设,缺少对模型对抗鲁棒性的分析。如何提升DNN的对抗鲁棒性,并提升鲁棒性的可解释性和可信度,成为人工智能安全领域的重要一环。文中提出从奇异值分布的角度分析模型的对抗鲁棒性。研究发现,模型在对抗性环境下鲁棒性的提升伴随着更加平滑的奇异值分布。通过进一步分析表明,平滑的奇异值分布意味着模型的分类置信度来源更加多样,从而也具有更高的对抗鲁棒性。基于此分析,进一步提出了基于奇异值抑制SVS(Singular Value Suppress)的对抗训练方法。实验结果表明,该方法进一步提高了模型在对抗性环境下的鲁棒性,在面对强力白盒攻击方法PGD(Project Gradient Descent)时,在CIFAR10和SVHN数据集上分别能达到55.3%和54.51%的精度,超过了目前最具有代表性的对抗训练方法。

基于语义的多架构二进制函数名预测方法

邵文强, 蔡瑞杰, 宋恩舟, 郭茜茜, 刘胜利

计算机科学. 2023, 50 (10): 369-376. doi:10.11896/jsjkx.220800175

摘要 ( 203 )

PDF(1770KB) ( 1211 )

参考文献 | 相关文章 | 多维度评价

丰富的可读性源信息对逆向工作具有重要意义,尤其是高质量的函数名对程序理解非常重要。然而,软件发布者无论是出于防止逆向或者精简软件大小的角度,往往会发布剥离掉源级调试信息的可执行文件,可读性信息缺失导致逆向分析难度加大。因此,提出了一种多架构函数名预测(Multi-architecture Function Name Prediction,MFNP)方法,利用LLVM RetDec反编译X86,ARM,MIPS架构的二进制文件为中间语言(IR)文件解决不同架构之间存在差异的问题。对中间语言.ll文件中的函数名进行形态上、语义上的相似性比较,对函数名进行相似性融合来降低函数名数据稀疏性。将携带顺序指令语义信息的基本块以及以基本块为基本单位的函数体控制流图作为函数体的语义特征,结合神经网络来实现X86,MIPS,ARM这3种架构下剥离二进制文件的函数名预测。相比DEBIN,所提方法额外支持MIPS架构下的剥离二进制函数名预测工作,其在Precision和F1方面相比NERO提高了13.86%和11.93%。最后验证了MFNP选用以基本块为基本单位提取的顺序指令序列和控制流图作为语义特征的有效性。

一种类自同步ZUC算法的认证加密方案

徐睿, 彭长根, 许德权

计算机科学. 2023, 50 (10): 377-382. doi:10.11896/jsjkx.220800007

摘要 ( 276 )

PDF(1580KB) ( 1253 )

参考文献 | 相关文章 | 多维度评价

针对国密ZUC算法的认证加密的安全性、效率以及轻量化需求,提出了一种类自同步ZUC的关联数据认证加密方案ZUCAE。该方案通过改进祖冲之流密码算法(ZUC-256)的LFSR层算法,设计实现了一种类似自同步流密码的ZUC-SSL算法,利用该算法使密文参与到状态更新函数中,用于认证码的生成。ZUC-256算法进行消息加密,通过优化初始化模块,将关联数据嵌入到初始化过程中,实现了密钥流生成和加密并行进行,解密前进行消息认证,减少计算消耗时间,提高方案的安全性。安全性分析结果表明该算法能够抵抗当前主流的基于LFSR设计的流密码相关攻击,且类自同步流密码的设计能增强认证码的安全性。与AES-CGM和AEGIS的效率实验对比表明,在数据规模大的环境下,所提算法的效率高于AES-CGM,与AEGIS的效率相当,具备一定的实用性。