1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2021年第2期, 刊出日期:2021-02-15
  
目录
目录
计算机科学. 2021, 48 (2): 0-0. 
摘要 ( 158 )   PDF(265KB) ( 371 )   
相关文章 | 多维度评价
新型分布式计算技术与系统*
Ceph分布式存储系统性能优化技术研究综述
张晓, 张思蒙, 石佳, 董聪, 李战怀
计算机科学. 2021, 48 (2): 1-12.  doi:10.11896/jsjkx.201000149
摘要 ( 431 )   PDF(2750KB) ( 2120 )   
参考文献 | 相关文章 | 多维度评价
Ceph是一个统一的分布式存储系统,可同时提供块、文件和对象3种接口的存储服务。与传统的分布式存储系统不同,它采用了无中心节点的元数据管理方式,因此具有良好的扩展性和线性增长的性能。经过十余年的发展,Ceph已被广泛地应用于云计算和大数据存储系统。作为云计算的底层平台,Ceph除了提供虚拟机的存储服务外,还可以直接提供对象存储服务和NAS文件服务。Ceph支撑着云计算系统中多种操作系统和应用的存储需求,它的性能对其上的虚拟机和应用有较大的影响,因此Ceph存储系统的性能优化一直是学术界和工业界的研究热点。文中首先介绍了Ceph的架构和特性;然后针对现有的性能优化技术,从对内部机制进行改进、面向新型硬件和基于应用的优化这3个方面进行了归纳和总结,综述了近年来Ceph存储和优化的相关研究;最后对该领域未来的工作进行了展望,以期为分布式存储系统性能优化的研究者提供有价值的参考。
企业云服务体系结构的参考模型与开发方法
蒋慧敏, 蒋哲远
计算机科学. 2021, 48 (2): 13-22.  doi:10.11896/jsjkx.200300044
摘要 ( 205 )   PDF(4541KB) ( 731 )   
参考文献 | 相关文章 | 多维度评价
服务与云计算范型的融合有助于大规模分布式软件的开发和应用,同时也为面向服务的软件工程带来了新的挑战。云计算的最大挑战是缺少事实上的标准或单一的体系结构方法,以满足企业将关键产品作为Internet上的云服务发布的应用需求。首先,针对企业云计算的业务特点,提出了一种企业云服务体系结构(Enterprise Cloud Service Architecture,ECSA)风格的通用和抽象参考模型,分析了该模型中的云服务、服务模式、服务消费者、管理、流程、质量属性、服务构件模型、服务匹配和交互模式匹配9个组件及其之间的关系,并讨论了它们中的角色。然后,提出了一个四阶段的ECSA迭代改进过程,该过程把云服务视为首要的类建模元素,通过解除云服务模型和来自目标构件配置之间的耦合,可实现相同云服务集的多种不同体系结构。最后,给出了一种基于该模型的期货程序化交易的私有云服务应用实例,用以展示该方法的可行性和有效性。
电力物联网下分布式状态感知的源网荷储协同调度
王锡龙, 李鑫, 秦小麟
计算机科学. 2021, 48 (2): 23-32.  doi:10.11896/jsjkx.200900209
摘要 ( 215 )   PDF(2504KB) ( 671 )   
参考文献 | 相关文章 | 多维度评价
随着新型发电、直流输电、电能存储等技术的发展,新能源发电、电动汽车等柔性负荷以及可充放电的储能装置不断并入电网中,使得传统配电网架构发生了巨大变化。由于新型源网荷储存在较大的不稳定性,给配电网调度带来了巨大挑战,尤其是难以控制调度的额外电损。借助泛在电力物联网的建设,可实现对源网荷储的实时信息采集与分析,为实时数据驱动的源网荷储协同调度提供了契机。配电网中的源网荷储协同具有天然的分布式特性,因此可以利用电力物联网的感知能力构建一个分布式状态实时感知系统,使得协同调度具有更高的调度精度。文中分析了泛在电力物联网背景下的配电网架构,对分布式环境下的源网荷储及其交互方式进行了建模,并据此提出了一种电力物联网下分布式状态感知的源网荷储协同调度机制,明确了源网荷储各端的响应策略,实现了削峰填谷、降低调度损耗的目标。基于部分电网真实数据,设计了模拟验证实验,其结果验证了源网荷储协同调度机制的有效性。
一种基于微服务的检察业务服务封装方法
陆懿帆, 曹芮浩, 王俊丽, 闫春钢
计算机科学. 2021, 48 (2): 33-40.  doi:10.11896/jsjkx.191100152
摘要 ( 208 )   PDF(1937KB) ( 538 )   
参考文献 | 相关文章 | 多维度评价
微服务架构是一种新兴的服务架构风格,在处理复杂服务系统时表现出运行高效、部署灵活等特性,相较于单体式服务架构,能够提供更好的业务管理和服务支持。针对检察院复杂的办案业务,需要对服务进行组合封装,形成新的增值服务以满足用户需求。但是,单独进行服务质量驱动的服务封装不能满足检察业务的需求,因此,结合服务功能和服务质量,提出了微服务架构下图规划算法的改进方法(Improved Graphplan Under MicroService Architecture,IGMA)。该方法首先对服务、用户请求建立数学模型,其次综合服务的功能需求和非功能需求,在不同案件类型下为用户提供多种组合方案,最后建立服务工作流,完成案件服务封装。该方法能够智能判断服务组合结构中的分支结构,并对不同的分支结构建立不同的组合方案。实验结果表明,该方法在服务封装的时效性和准确性上有了较大的提升。
面向MapReduce的中间数据传输流水线优化机制
张元鸣, 虞家睿, 蒋建波, 陆佳炜, 肖刚
计算机科学. 2021, 48 (2): 41-46.  doi:10.11896/jsjkx.191000103
摘要 ( 99 )   PDF(2370KB) ( 287 )   
参考文献 | 相关文章 | 多维度评价
MapReduce是一种适用于大数据处理的重要并行计算框架,通过在大量集群节点上并行执行多个任务,极大地提高了数据的处理性能。然而,由于中间数据需要等到Mapper任务完成之后才能被发送给Reducer任务,由此导致的大量传输延迟成为MapReduce框架性能的重要瓶颈。为此,文中提出了一种面向MapReduce的中间数据传输流水线优化机制,将有效计算与中间数据传输解耦,以流水线的方式重叠执行各个阶段,有效隐藏数据传输开销。文中还给出了中间数据传输流水线执行机制和实现策略,包括流水线划分、数据细分、数据归并和数据传输粒度等。在公开数据集上对所提中间数据传输流水线优化机制进行了评价,当Shuffle数据量较大时,该优化机制比默认框架的整体性能提高了60.2%。
一种基于分布式编码的卷积优化算法
苑晨宇, 谢在鹏, 朱晓瑞, 屈志昊, 徐媛媛
计算机科学. 2021, 48 (2): 47-54.  doi:10.11896/jsjkx.200800187
摘要 ( 178 )   PDF(1933KB) ( 415 )   
参考文献 | 相关文章 | 多维度评价
卷积在统计学、信号处理、图像处理、深度学习等领域有着广泛的应用,且起到了至关重要的作用。在深度神经网络中,使用卷积运算对输入信息进行特征提取的方法是实现神经网络的基础计算单元之一。如何优化卷积的运算速度,提高卷积计算效率一直是亟需探讨的问题。近年来,很多研究指出分布式计算架构可以提高卷积神经网络的计算速度,进而优化深度学习的训练效率,然而由于分布式系统中普遍存在落跑者问题(straggler),该问题可能会拖慢整个系统执行任务的时间,因此该问题也成为了分布式深度学习中一个待解决的问题。文中针对二维卷积计算,结合Winograd算法和分布式编码,提出了一种优化的分布式二维卷积算法。Winograd算法能够有效地加速单次二维卷积计算的速度,分布式编码通过使用一种基于分布式冗余的编码方式能够缓解straggler节点对整个分布式系统计算延迟的影响。因此,提出的分布式二维卷积算法可以在加速二维卷积计算的同时有效缓解分布式系统中的straggler问题,有效提高了分布式卷积的计算效率。
异构无人机编队防御及评估策略研究
左剑凯, 吴杰宏, 陈嘉彤, 刘泽源, 李忠智
计算机科学. 2021, 48 (2): 55-63.  doi:10.11896/jsjkx.191100053
摘要 ( 120 )   PDF(3952KB) ( 347 )   
参考文献 | 相关文章 | 多维度评价
无人机编队对抗问题一直是科学研究的一个热点,但针对无人机群防御部署问题的相关研究较少。文中以防御型无人机对普通无人机(如民用、商用、侦查、巡航、勘探)的保护问题为背景,对已有的异构无人机编队的编码解码方案进行改进。从导弹飞行距离和非武装无人机的安全两个方面建立适应度函数,使用遗传算法对无人机防御编队进行优化。针对不同规模和不同队形的敌机编队,对我方无人机编队进行优化。求解结果表明,在不同的敌机编队中,遗传算法均能在30次迭代内以较快速度收敛于最优值,并给出相应的优化队形。最后通过概率效果评估,绘制了5种战况损失曲线,可以看出所设计的防御部署战略是有效的,我方无人机最大损失数量为6,最小损失数量为0,平均损失数量为3,平均损失率为18.75%。该方法对异构无人机群的防御部署研究具有一定的参考价值。
基于随机几何的无线中继网络上行链路精细化性能分析
孙海华, 周思源, 谭国平, 张芝
计算机科学. 2021, 48 (2): 64-69.  doi:10.11896/jsjkx.200800205
摘要 ( 111 )   PDF(2174KB) ( 354 )   
参考文献 | 相关文章 | 多维度评价
无线网络用户呈现数量剧增、分布灵活多变的趋势,而传统蜂窝网络的拓扑结构已不能满足所有用户的服务需求。为改善小区边缘区域的上行覆盖率,构建了一种基于随机几何的无线中继网络模型,其中基站服从泊松点过程分布,中继节点围绕基站服从截断式聚类过程分布。在此网络中,中继节点通过放大转发策略将小区边缘用户的数据上传至基站。为了精细化分析网络模型的性能,文中基于信干比理论推导出每跳链路的条件覆盖率的矩,从而获得信干比 meta分布的解析表达式,即条件覆盖率的分布。相比传统的针对覆盖率期望值的性能分析,基于信干比meta分布的分析能够揭示出条件覆盖率大于一定阈值的网络用户比例。实验仿真结果验证了所推导出的理论表达式的正确性。另外,通过调整中继节点分布的半径以及方差参数等,研究了中继节点的分布参数对信干比meta分布的影响。最后,通过比较上行功率控制的功率补偿因子对网络覆盖率的影响,为后期研究网络性能优化提供了帮助。
基于TPE的SpaRC算法超参数优化方法
邓丽, 武金达, 李科学, 卢亚康
计算机科学. 2021, 48 (2): 70-75.  doi:10.11896/jsjkx.200500156
摘要 ( 129 )   PDF(2102KB) ( 238 )   
参考文献 | 相关文章 | 多维度评价
宏基因组序列组装在计算和内存上面临着巨大挑战。SpaRC(Spark Reads Clustering)是基于Apache Spark的宏基因组序列片段聚类算法,为来自下一代测序技术的数十亿测序片段聚类提供了一种可扩展的解决方案。但是,SpaRC算法参数的设置是一项非常具有挑战性的工作。SpaRC算法拥有许多对算法性能有着很大影响的超参数,选择合适的超参数集对于充分发挥SpaRC算法的性能来说是至关重要的。为了提高SpaRC算法的性能,探索了一种基于树状结构Parzen估计方法(Tree Parzen Estimator,TPE)的超参数优化方法,其能够利用先验知识高效地调节参数,并通过减少计算任务加速寻找最优参数,达到最佳聚类效果,从而避免昂贵的参数探索。对长序列片段(PacBio)和短序列片段(CAMI2)进行实验,结果表明,该方法在改善SpaRC算法性能方面有着良好的效果。
数据库&大数据&数据科学
社交网络用户影响力的建模方法
谭琪, 张凤荔, 张志扬, 陈学勤
计算机科学. 2021, 48 (2): 76-86.  doi:10.11896/jsjkx.191200102
摘要 ( 177 )   PDF(2085KB) ( 873 )   
参考文献 | 相关文章 | 多维度评价
社交网络用户影响力在舆情演化、广告营销及政治选举等领域有着广泛应用,研究者在过去的工作中,通过分析和建模,在影响力方面取得了一定的成果,但还存在着定义不明晰、技术落后和应用缺乏等问题。文中明确提出了社交网络用户影响力的研究模型,将传统技术与先进技术结合,并据此梳理了该领域的相关文献,主要从用户、内容特征和深度学习技术的角度论述了基于社交网络的用户影响力的研究方法,并进一步划分成本质和邻域属性、情感分析和元数据、面向局部网络和基于用户及内容特征,还介绍了节点识别的方法,为该领域的学者提供有效且全面的参考。其次,文中还介绍了用户影响力建模方法在预测应用方面的数据集、评价指标和实验结果等,旨在预测下一个激活节点。最后对其未来的发展趋势作出展望。
基于BERT的社交电商文本分类算法
李可悦, 陈轶, 牛少彰
计算机科学. 2021, 48 (2): 87-92.  doi:10.11896/jsjkx.200700111
摘要 ( 276 )   PDF(1610KB) ( 910 )   
参考文献 | 相关文章 | 多维度评价
随着网络购物的高速发展,网络商家和购物者在网络交易活动中产生了大量的交易数据,其中蕴含着巨大的分析价值。针对社交电商商品文本的文本分类问题,为了更加高效准确地判断文本所描述商品的类别,提出了一种基于BERT模型的社交电商文本分类算法。首先,该算法采用BERT(Bidirectional Encoder Representations from Transformers)预训练语言模型来完成社交电商文本的句子层面的特征向量表示,随后有针对性地将获得的特征向量输入分类器进行分类,最后采用社交电商文本的数据集进行算法验证。实验结果表明,经过训练的模型在测试集上的分类结果F1值最高可达94.61%,高出BERT模型针对MRPC的分类任务6%。因此,所提社交电商文本分类算法能够较为高效准确地判断文本所描述商品的类别,有助于进一步分析网络交易数据,从海量数据中提取有价值的信息。
面向NoSQL数据库的JSON文档异常检测与语义消歧模型
刘立成, 徐一凡, 谢贵才, 段磊
计算机科学. 2021, 48 (2): 93-99.  doi:10.11896/jsjkx.200900039
摘要 ( 118 )   PDF(2977KB) ( 259 )   
参考文献 | 相关文章 | 多维度评价
随着信息化技术的发展,面对材料等相关领域数据的多源异构、扩展性强、爆炸增长等特点,传统关系数据库无法对数据进行存储,因此可利用NoSQL的无模式存储、高扩展性等特性来解决这一难题。作为NoSQL数据库常用的数据存储格式,JSON因简单性和灵活性备受欢迎。然而,NoSQL数据库缺乏模式信息,在JSON文档存入数据库之前,需要对其进行数据验证与分析。目前,大多数方法是基于JSON schema对JSON文档格式的规范性进行校验,无法有效解决JSON文档的异常检测以及语义歧义问题。为此,文中提出了面向NoSQL数据库的JSON文档异常检测与语义消歧模型doctorJSON。该模型基于JSON schema对存入的JSON文档分别设计了异常检测算法deoutJSON和语义消歧算法disemaJSON,以检测JSON文档存在的异常和歧义。在真实数据集与合成数据集上的实验验证了所提模型的有效性和执行效率。
一种基于层级信息优化的有向网络表示学习方法
李鑫超, 李培峰, 朱巧明
计算机科学. 2021, 48 (2): 100-104.  doi:10.11896/jsjkx.191200033
摘要 ( 77 )   PDF(1525KB) ( 254 )   
参考文献 | 相关文章 | 多维度评价
网络表示方法旨在将每个节点映射到低维向量空间,并保留节点在网络中的结构关系。有向网络的环中节点相互可达,破坏了非对称传递性,影响了模型对网络整体结构信息的学习。为削弱有向网络的环在表示学习中的影响,增强模型对全局结构信息的感知,文中提出了一种针对有向网络表示学习的优化方法。该方法借助TrueSkill方法获取节点的层级信息,将该信息转化为边权重并引入表示学习过程。文中将此方法应用到已有的多种有向网络表示学习方法中,多个有向网络数据集上的链接预测和节点分类任务的实验结果表明,所提方法的性能相比原有方法得到了明显提升。
支持本地化差分隐私保护的k-modes聚类方法
彭春春, 陈燕俐, 荀艳梅
计算机科学. 2021, 48 (2): 105-113.  doi:10.11896/jsjkx.200700172
摘要 ( 108 )   PDF(2623KB) ( 312 )   
参考文献 | 相关文章 | 多维度评价
如何在保护数据隐私的同时进行可用性的数据挖掘已成为热点问题。鉴于在很多实际应用场景中,很难找到一个真正可信的第三方对用户的敏感数据进行处理,文中首次提出了一种支持本地化差分隐私技术的聚类方案——LDPK-modes(Local Differential Privacy K-modes)。与传统的基于中心化差分隐私的聚类算法相比,其不再需要一个可信的第三方对数据进行收集和处理,而由用户担任数据隐私化的工作,极大地降低了第三方窃取用户隐私的可能性。用户使用满足本地d-隐私(带有距离度量的本地差分隐私技术)定义的随机响应机制对敏感数据进行扰动,第三方收集到用户扰动数据后,恢复其统计特征,生成合成数据集,并进行k-modes聚类。在聚类过程中,将数据集上频繁出现的特征分配给初始聚类中心点,进一步提高了聚类结果的可用性。理论分析和实验结果表明了LDPK-modes的隐私性和聚类可用性。
融合用户属性与项目流行度的用户冷启动推荐模型
韩立锋, 陈莉
计算机科学. 2021, 48 (2): 114-120.  doi:10.11896/jsjkx.200900152
摘要 ( 111 )   PDF(2095KB) ( 365 )   
参考文献 | 相关文章 | 多维度评价
冷启动一直是推荐系统领域中被密切关注的问题,针对新注册用户冷启动的问题,文中提出了一种融合用户人口统计学信息与项目流行的推荐模型。首先对训练集用户进行聚类,将训练集用户划分为若干类。然后计算新用户与所属类别中其他用户之间的距离,选择其近邻用户集,在评分计算时综合考虑项目流行度对推荐效果的影响,进而为目标用户推送感兴趣的节目。最后在经典推荐系统数据集中对所提模型进行验证。实验结果表明,该模型明显优于传统协同过滤算法,并在一定程度上解决了冷启动问题。
高维大数据分析的无监督异常检测方法
邹承明, 陈德
计算机科学. 2021, 48 (2): 121-127.  doi:10.11896/jsjkx.191100141
摘要 ( 152 )   PDF(2369KB) ( 339 )   
参考文献 | 相关文章 | 多维度评价
高维数据的无监督异常检测是机器学习的重要挑战之一。虽然先前基于单一深度自动编码器和密度估计的方法已经取得了显著的进展,但是其仅通过一个深度自编码器来生成低维表示,这表明没有足够的信息来执行后续的密度估计任务。为了解决上述问题,文中提出了一种混合自动编码器高斯混合模型(Mixed Auto-encoding Gaussian Mixture Model,MAGMM)。MAGMM使用混合自动编码器来代替单一深度自动编码器生成串联的低维表示,因此它可以保存来自输入样本的特定集群的关键信息。此外,其利用分配网络来约束混合自动编码器,这样每个样本都可以分配给一个占主导地位的自动编码器。利用上述机制,MAGMM避免了陷入局部最优,降低了重构误差,从而可以促进密度估计任务的完成,提高高维数据异常检测的准确性。实验结果表明,该方法优于DAGMM,并在标准F1分数上提高了29%。
基于稀疏表示的电力负荷数据补全
李培冠, 於志勇, 黄昉菀
计算机科学. 2021, 48 (2): 128-133.  doi:10.11896/jsjkx.191200152
摘要 ( 86 )   PDF(2303KB) ( 293 )   
参考文献 | 相关文章 | 多维度评价
数据缺失在电力负荷数据采集过程中经常发生,对提高算法的预测精确度带来了不利影响。现有的缺失数据补全算法只适用于缺失数据量较少的情况,而对于缺失数据较多的情况表现不佳。面对严重数据缺失的挑战,文中提出了一种基于稀疏表示的电力负荷缺失数据补全方法。首先以数据随机缺失为前提,将训练数据中假定缺失后的数据与完整的训练数据上下拼接构成训练矩阵;其次,利用离散余弦变换(Discrete Cosine Transform,DCT)生成一个过完备字典,并根据训练矩阵对其进行学习,旨在通过调优得到一个合适的字典,能对训练矩阵中的样本进行最好的稀疏表示。最后,在测试阶段,先利用学习后字典的上半部分获得测试集缺失数据的稀疏表示,然后利用稀疏表示和学习后字典的下半部分重构出无缺失的完整数据。实验结果表明,使用该方法对电力负荷数据缺失值进行补全,可以获得比传统插值方法、基于相关性的KNN算法、时空压缩感知估计算法以及时序压缩感知预测算法更高的精度。即使数据缺失率高达95%,该方法依然可以有效地补全缺失数据。
计算机图形学&多媒体
语义区域风格约束下的图像合成
胡妤婕, 常建慧, 张健
计算机科学. 2021, 48 (2): 134-141.  doi:10.11896/jsjkx.200800201
摘要 ( 122 )   PDF(4158KB) ( 337 )   
参考文献 | 相关文章 | 多维度评价
生成对抗网络近年来发展迅速,其中语义区域分割与生成模型的结合为图像生成技术研究提供了新方向。在当前的研究中,语义信息作为指导生成的条件,可以通过编辑和控制输入的语义分割掩码来生成理想的特定风格图像。文中提出了一种具有语义区域风格约束的图像生成框架,利用条件对抗生成网络实现了图像分区域的自适应风格控制。具体而言,首先获得图像的语义分割图,并使用风格编码器提取出图像中不同语义区域的风格信息;然后,在生成端将风格信息和语义掩码对应生成器中的每个残差块分别仿射变换为两组调制参数;最后,输入到生成器中的语义特征图根据每个残差块的调制参数加权求和,并通过卷积与上采样渐进式地生成目标风格内容,从而有效地将语义信息和风格信息相结合,得到最终的目标风格内容。针对现有模型难以精准控制各语义区域风格的问题,文中设计了新的风格约束损失,在语义层次上约束区域风格变化,减小不同语义区域的风格编码之间的相互影响;另外,在不影响性能的前提下,采取权重量化的方式,将生成器的参数存储规模压缩为原来的15.6%,有效降低了模型的存储空间消耗。实验结果表明,所提模型的生成质量在主观感受和客观指标上较现有方法均有显著提高,其中FID分数比当前最优模型提升了约3.8%。
基于多重差异特征网络的街景变化检测
詹瑞, 雷印杰, 陈训敏, 叶书函
计算机科学. 2021, 48 (2): 142-147.  doi:10.11896/jsjkx.200500158
摘要 ( 105 )   PDF(3342KB) ( 476 )   
参考文献 | 相关文章 | 多维度评价
街景变化检测对于自然灾害破坏和城市发展变化的研究起着重要作用。其主要目标是将成对的输入图片中变化的区域标注出来,其实质是二分类的语义分割问题。不同时间拍摄的街景图片可能受到如光线、天气、背景噪声、视角误差等诸多干扰因素的影响,这给传统的变化检测方法带来挑战。针对该问题,提出了一种新的神经网络模型(Multiple Difference Features Network,MDFNet)。该模型首先使用孪生网络提取成对输入图片的不同深度特征,并使用差异模块对相同深度特征计算差异,以此有效获得不同尺度的变化信息;然后通过JPU模块融合多重差异特征,在不损失细节信息的情况下提取其深层语义信息;最后使用金字塔池化模块结合全局和局部信息生成二分类的变化检测图像。在PCD数据集上的GSV和TSUNAMI部分分别采用5折交叉验证法对模型进行实验,实验结果表明,MDFNet获得了0.787和0.862的F-score,相比排名第二的DOF-CDNet方法,其值提高了约11.9%和2.9%,同时其能够更精准地分割变化细节。因此,所提模型可以有效应对干扰,对于复杂场景也具备优秀的检测能力。
基于特征聚类的轻量级图像搜索系统
王晓飞, 周超, 刘利刚
计算机科学. 2021, 48 (2): 148-152.  doi:10.11896/jsjkx.191200104
摘要 ( 143 )   PDF(2045KB) ( 408 )   
参考文献 | 相关文章 | 多维度评价
在图像搜索的场景中,由于搜索请求的随机性,为了提高搜索速度,搜索算法运行时需要把整个数据集预先载入到运行内存。由于运行内存价格远高于同容量的硬盘价格,降低运行内存自然可以大大降低图像搜索服务的成本,但如果直接对数据进行压缩,往往会极大地损失搜索精度。在这种情况下,文中提出了一种基于图像内容特征的分块式图像搜索框架。先利用神经网络的方法来预先提取图片特征,在不对特征进行量化压缩的前提下,采用一种启发式的聚类方法对数据进行分块,同时保证每个数据块的数据之间有一定的相似性。对于每个数据块,采用基于图结构的HNSW算法来构建索引子图以加速图片查询。在该框架下,通过控制查询时访问的数据块的个数,可以在保证精度的前提下大大减少算法所需要的运行内存容量。
面向一致增强评估的子集比例动态选取方法
王凯巡, 刘浩, 沈港, 时庭庭
计算机科学. 2021, 48 (2): 153-159.  doi:10.11896/jsjkx.200800188
摘要 ( 82 )   PDF(2500KB) ( 188 )   
参考文献 | 相关文章 | 多维度评价
水下图像往往质量较低且数量众多,在许多应用中需要对其执行大规模的一致增强。在子集导引一致增强评估准则下,现有的子集选取方法在对原始图像集进行抽样时,所需候选子集的抽样数据过多,且不具备对数据内容的自适应能力。为此,文中将候选子集进一步划分为若干份抽样子集,按照不放回抽样策略进行抽样,并根据一致增强评估准则得到某一待检增强算法对逐份抽样子集的一致性增强度,利用一定置信水平条件下的学生-t分布,自适应地选定子集比例,并预估该增强算法对原始图像集的一致性增强度。实验结果表明,相比现有的子集选取方法,所提方法在各种情况下均能减少原始图像集的抽样数据,同时正确判断出每种增强算法的一致性能。所提方法在保持评估误差相当的条件下,相比子集固定比例方法可减少2%~14%的子集比例,相比逐级递增的方法可减少3%~9%的子集比例,从而鲁棒地降低了子集导引一致增强评估的复杂度。
基于双残差超密集网络的多模态医学图像融合
王丽芳, 王蕊芳, 蔺素珍, 秦品乐, 高媛, 张晋
计算机科学. 2021, 48 (2): 160-166.  doi:10.11896/jsjkx.200400095
摘要 ( 164 )   PDF(3238KB) ( 458 )   
参考文献 | 相关文章 | 多维度评价
针对基于残差网络和密集网络的图像融合方法存在网络中间层的部分有用信息丢失和融合图像细节不清晰的问题,提出了基于双残差超密集网络(Dual Residual Hyper-Densely Networks,DRHDNs)的多模态医学图像融合方法。DRHDNs分为特征提取和特征融合两部分。特征提取部分通过将超密集连接与残差学习相结合,构造出双残差超密集块,用于提取特征,其中超密集连接不仅发生在同一路径的层之间,还发生在不同路径的层之间,这种连接使特征提取更充分,细节信息更丰富,并且对源图像进行了初步的特征融合。特征融合部分则进行最终的融合。通过实验将其与另外6种图像融合方法对4组脑部图像进行了融合比较,并根据4种评价指标进行了客观比较。结果显示,DRHDNs在保留细节、对比度和清晰度等方面都有很好的表现,其融合图像细节信息丰富并且清晰,便于疾病的诊断。
基于事件的虚拟现实用户体验评估方法研究
马思琪, 车啸平, 于淇, 岳晨峰
计算机科学. 2021, 48 (2): 167-174.  doi:10.11896/jsjkx.200100065
摘要 ( 87 )   PDF(2596KB) ( 420 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着虚拟现实(Virtual Reality,VR)技术的逐渐成熟,我国VR产业处于高速增长的态势。虽然VR的发展为内容设计提供了许多新的可能性,但由于VR应用的设计不成熟,VR行业的从业者们仍面临着严峻的挑战,VR中的设计仍需要通过用户使用来验证是否可行。因此,用户体验(User Experience,UX)研究对于成功设计VR软件至关重要。同时,随着用户对内容质量要求的提高,VR内容是否有足够的吸引力将在很大程度上影响用户体验,决定了用户是否会进行更进一步的VR体验。因此,如何评估VR用户体验并找到影响用户体验的内容对于提高用户体验和用户黏性至关重要。目前,对VR的研究集中在硬件和软件的改善上,对内容设计的关注较少,对用户体验的评价也没有统一且明确的标准。文中尝试找出用户体验和用户特性以及VR内容之间的关联。首先,定义了4种类型的VR交互事件,并设计了一份问卷来收集测试者的用户特性及其主观评价。其次,将80名测试者分成两组,在固定的时间内体验两种类型的VR产品,在实验过程中,测试者的客观生理数据与参与实验的整个过程都被记录下来。最后,采用统计学方法和改进的Prism算法,找出了用户特性、游戏交互事件类型与用户体验之间的相关性。文中对VR用户体验规范化评估进行了初步尝试,实验结果可以为VR内容设计人员和开发人员提供参考。
人工智能
知识图谱构建技术:分类、调查和未来方向
杭婷婷, 冯钧, 陆佳民
计算机科学. 2021, 48 (2): 175-189.  doi:10.11896/jsjkx.200700010
摘要 ( 710 )   PDF(2659KB) ( 2174 )   
参考文献 | 相关文章 | 多维度评价
知识图谱的概念由谷歌于2012年提出,随后逐渐成为人工智能领域的一个研究热点,已在信息搜索、自动问答、决策分析等应用中发挥作用。虽然知识图谱在各领域展现出了巨大的潜力,但不难发现目前缺乏成熟的知识图谱构建平台,需要对知识图谱的构建体系进行研究,以满足不同的行业应用需求。文中以知识图谱构建为主线,首先介绍目前主流的通用知识图谱和领域知识图谱,描述两者在构建过程中的区别;然后,分类讨论图谱构建过程中存在的问题和挑战,并针对这些问题和挑战,分类描述目前图谱构建过程中的知识抽取、知识表示、知识融合、知识推理、知识存储5个层面的解决方法和策略;最后,展望未来可能的研究方向。
Lévy Flight的发展和智能优化算法中的应用综述
郑洁锋, 占红武, 黄巍, 张恒, 吴周鑫
计算机科学. 2021, 48 (2): 190-206.  doi:10.11896/jsjkx.200500142
摘要 ( 173 )   PDF(2199KB) ( 321 )   
参考文献 | 相关文章 | 多维度评价
Lévy Flight源自纯数学概念,目前已被广泛应用于许多领域,如物理、生物、统计、金融和计算机科学等。目前,国内尚无文献对Lévy Flight的发展及其在智能优化算法方面的应用进行总结。因此,文中首先回顾了Lévy Flight的发展情况和应用,介绍了Lévy Flight相关变体的基本原理和应用;然后着重讨论了近十年将Lévy Flight应用于智能优化算法的研究,对其应用的方法进行了分类分析;最后总结了Lévy Flight的未来发展趋势。文中的目的是让学者了解Lévy flight的基本原理和其在智能优化算法中的发展情况,同时促进Lévy Flight及其变体在众多学科尤其是计算机科学的发展和应用。
基于表示学习的在线学习交互质量评价方法
王雪岑, 张昱, 刘迎婕, 于戈
计算机科学. 2021, 48 (2): 207-211.  doi:10.11896/jsjkx.201000042
摘要 ( 110 )   PDF(1735KB) ( 354 )   
参考文献 | 相关文章 | 多维度评价
当今的教育模式发生着非常重大的变革,教育正在向泛在化、智能化、个性化的方向发展。以Massive Open Online Courses(MOOCs)为代表的在线教育逐渐进入大众视野,在线教育中的交互性成为了决定在线学习质量的关键。研究表明,学习过程中的交互为学习者提供了有效且高效的帮助和支持,对学习过程的评价反馈可以有效地提高学习效果。在教育领域,对学习者和学习资源之间的交互进行建模至关重要,表示学习技术为学习者和学习资源之间的顺序交互建模提供了具体方案。文中首先建立在线学习的交互网络模型,然后使用两个循环神经网络将网络中的学习者和学习资源节点嵌入到一个欧氏空间中,并提出交互质量评价指标,以判断学习者的学习效果是否达到预期。在实际数据集上的实验证明了所提方法的有效性。
基于回复生成的对话意图预测
王博宇, 王中卿, 周国栋
计算机科学. 2021, 48 (2): 212-216.  doi:10.11896/jsjkx.200700137
摘要 ( 116 )   PDF(1875KB) ( 480 )   
参考文献 | 相关文章 | 多维度评价
随着人机对话系统的不断发展,让计算机能够准确理解对话者的对话意图,并根据对话的历史信息对回复进行意图预测,对于人机对话系统有着十分重要的意义。已有研究重点关注根据对话文本和已有标签对回复进行意图预测,但是,在很多场景下回复可能并没有生成。因此,文中提出了一种结合回复生成的对话意图预测模型。在生成部分,使用Seq2Seq结构,根据对话历史信息生成文本,作为对话中未来回复的文本信息;在分类部分,利用LSTM模型,将生成的回复文本与已有的对话信息转变为子句级别的表示,并结合注意力机制突出同一轮次对话句与生成回复的联系。实验结果表明,所提出的模型相比简单基线模型取得了2.54%的F1-score提升,并且联合训练的方式有助于提升模型性能。
基于双重权重偏差建模的无监督域适应
马闯, 田青, 孙赫阳, 曹猛, 马廷淮
计算机科学. 2021, 48 (2): 217-223.  doi:10.11896/jsjkx.200700028
摘要 ( 96 )   PDF(1759KB) ( 277 )   
参考文献 | 相关文章 | 多维度评价
无监督域适应(Unsupervised Domain Adaptation,UDA)是一类新兴的机器学习范式,其通过对源域知识在无标记目标域上的迁移利用,来促进目标域模型的训练。为建模源域与目标域之间的域分布差异,最大均值差异(Maximum Mean Discrepancy,MMD)建模被广泛应用,其对UDA的性能提升起到了有效的促进作用。然而,这些方法通常忽视了领域之间对应类规模与类分布等结构信息,因为目标域与源域的数据类规模与数据分布通常并非一致。为此,文中提出了一种基于跨域类和数据样本双重加权的无监督域适应模型(Sample weighted and Class weighted based Unsupervised Domain Adaptation Network,SCUDAN)。具体而言,一方面,通过源域类层面的适应性加权来调整源域类权重,以实现源域与目标域之间的类分布对齐;另一方面,通过目标域样本层面的适应性加权来调整目标域样本权重,以实现目标域与源域类中心的对齐。此外,文中还提出了一种CEM(Classification Expectation Maximization)优化算法,以实现对SCUDAN的优化求解。最后,通过对比实验和分析,验证了所提模型和算法的有效性。
基于改进的蝗虫优化算法的红细胞供应预测方法
刘奇, 陈红梅, 罗川
计算机科学. 2021, 48 (2): 224-230.  doi:10.11896/jsjkx.200600016
摘要 ( 90 )   PDF(1511KB) ( 213 )   
参考文献 | 相关文章 | 多维度评价
当前国内“血荒”问题比较严峻,血站与用血单位之间存在着血液供不应求的现象。针对这个问题,提出了一种基于改进的蝗虫优化算法的LSTM预测方法,用于对未来的红细胞供应情况进行预测,为血站工作人员在制定采血计划以及制备计划时提供有效的指导。该预测模型通过使用长短期记忆网络(Long-Short Term Memory Network,LSTM)来捕捉历史红细胞库存数据之间的潜在规律,以达到对未来的供应情况进行预测的效果。首先,针对蝗虫优化算法容易陷入局部最优、收敛速度较慢的问题,通过加入基于折射原理的反向学习机制与混沌映射,加快蝗虫优化算法的收敛速度,使其具备更强的搜索能力。其次,为提高LSTM的预测性能,将改进的蝗虫优化算法与LSTM相结合,并使用某地区的红细胞库存真实数据作为实验数据,用于验证改进的LSTM预测模型的性能。与标准LSTM相比,所提方法的MAE,MAPE,RMSE分别降低了39.827 8,1.10%,55.819 1。实验结果证明,提出的方法具有较高的可靠性。
基于惯性传感器融合控制算法的聋哑手语识别
冉孟元, 刘礼, 李艳德, 王珊珊
计算机科学. 2021, 48 (2): 231-237.  doi:10.11896/jsjkx.191200143
摘要 ( 82 )   PDF(3176KB) ( 317 )   
参考文献 | 相关文章 | 多维度评价
聋哑人如何与外界进行有效沟通一直是一个备受关注的难点问题。文中提出了一种基于惯性传感器融合控制算法的手语识别方案,旨在实现高效准确的实时手语识别。该融合控制算法采用反馈控制思想,对两种传统的姿态信息计算方法进行融合,减少了环境对传感器的影响,可以准确获取被测对象在瞬时状态下的姿态信息。该算法通过对自采的聋哑手语数据进行数据融合、数据预处理和特征提取等处理,利用支持向量机、K-近邻法和前馈神经网络分类器自适应模型集成的分类方法进行分类。结果显示,所提传感器融合控制算法有效地得出了实时姿态,该手语识别方案对30种聋哑拼音手语的识别准确率达到96.5%。所提方案将为聋哑人手语识别打下坚实的基础,并为传感器融合控制的相关研究提供参考。
一种数据高效的第三人称模仿学习方法
姜冲, 章宗长, 陈子璇, 朱佳成, 蒋俊鹏
计算机科学. 2021, 48 (2): 238-244.  doi:10.11896/jsjkx.191100107
摘要 ( 102 )   PDF(1886KB) ( 287 )   
参考文献 | 相关文章 | 多维度评价
模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以及对应的专家动作序列组成。但是,在现实生活中,专家示范通常以第三人称视频的形式存在。相比第一人称专家示范,第三人称示范的观察视角与智能体的存在差异,导致两者之间缺乏一一对应关系,因此第三人称示范无法被直接用于模仿学习中。针对此问题,文中提出了一种数据高效的第三人称模仿学习方法。首先,该方法在生成对抗模仿学习的基础上引入了图像差分方法,利用马尔可夫决策过程的马尔可夫性质以及其状态的时间连续性,去除环境背景、颜色等领域特征,以得到观察图像中与行为策略最相关的部分,并将其用于模仿学习;其次,该方法引入了一个变分判别器瓶颈,以对判别器进行限制,进一步削弱了领域特征对策略学习的影响。为了验证所提算法的性能,通过MuJoCo平台中的3个实验环境对其进行了测试,并与已有算法进行了比较。实验结果表明,与已有的模仿学习方法相比,该方法在第三人称模仿学习任务中具有更好的性能表现,并且不需要额外增加对样本的需求。
一种循环卷积注意力模型的文本情感分类方法
陈千, 车苗苗, 郭鑫, 王素格
计算机科学. 2021, 48 (2): 245-249.  doi:10.11896/jsjkx.200100078
摘要 ( 198 )   PDF(1980KB) ( 507 )   
参考文献 | 相关文章 | 多维度评价
情感分类对推荐系统、自动问答、阅读理解等下游应用具有重要应用价值,是自然语言处理领域的重要研究方向。情感分类任务直接依赖于上下文,包括全局和局部信息,而现有的神经网络模型无法同时捕获上下文局部信息和全局信息。文中针对单标记和多标记情感分类任务,提出一种循环卷积注意力模型(LSTM-CNN-ATT,LCA)。该模型利用注意力机制融合卷积神经网络(Convolutional Neural Network,CNN)的局部信息提取能力和循环神经网络(Recurrent Neural Network,RNN)的全局信息提取能力,包括词嵌入层、上下文表示层、卷积层和注意力层。对于多标记情感分类任务,在注意力层上附加主题信息,进一步指导多标记情感倾向的精确提取。在两个单标记数据集上的F1指标达到82.1%,与前沿单标记模型相当;在两个多标记数据集上,小数据集实验结果接近基准模型,大数据集上的F1指标达到78.38%,超过前沿模型,表明LCA模型具有较高的稳定性和较强的通用性。
面向未知环境及动态障碍的人工势场路径规划算法
杜婉茹, 王潇茵, 田涛, 张越
计算机科学. 2021, 48 (2): 250-256.  doi:10.11896/jsjkx.191100170
摘要 ( 119 )   PDF(3189KB) ( 365 )   
参考文献 | 相关文章 | 多维度评价
实际战场环境错综复杂,很多隐蔽、动态的障碍无法通过高空手段预先探测得知,因而对智能体执行任务的安全性产生威胁。针对未知且障碍形态多样的战场环境,以躲避动、静障碍,追踪目标为研究对象,提出一种面向未知环境及动态障碍的改进人工势场(Artificial Potential Field,APF)路径规划算法。在该算法中,智能体构建了以目标点为中心的引力势场,以及以障碍物为中心的斥力势场,在智能体行进路途中感知局部障碍及目标点的运动信息,并且将信息加入势场函数的计算中达到动态避障与追踪的效果;另一方面,引入距离因子及动态临时目标点来消除APF算法常见的无解问题——极小解情况及路径抖动现象。通过建立不同数量的随机障碍场景,进行多次仿真对比实验,结果表明:所提算法能够在未知环境中灵活躲避动态障碍并进行目标点的追踪,可以有效消除死解及路径抖动问题。将所提算法与传统APF算法及添加了动态避障机制的文献[19]所述算法进行对比实验,结果表明所提算法能成功化解两种对比算法路径规划失败的情况,顺利完成路径规划任务,且成功率在95%以上。
自动驾驶出租车动态合乘效益仿真分析
曾伟良, 韩宇, 何锦源, 吴淼森, 孙为军
计算机科学. 2021, 48 (2): 257-263.  doi:10.11896/jsjkx.200400008
摘要 ( 107 )   PDF(3209KB) ( 219 )   
参考文献 | 相关文章 | 多维度评价
自动驾驶出租车共享出行是未来变革性的智能交通方式,它将带来前所未有的社会效益。共享订单数(合乘人数)是影响出行时间、费用、舒适度和运营成本的关键参数,然而鲜有研究对共享人数上限进行分析。为此,文中基于多人共享的路径规划方法,建立了一个自动驾驶出租车动态合乘的仿真系统。该系统由“搜索”“调度”“等待”3个模型组成,在变化乘车需求的情况下,对共享人数上限进行了探讨。在深圳市南山区41.25 km2的路网上仿真不同共享人数上限和出行需求情况下的效益,结果表明,共享模式极大地提高了出行成功率(达到了20%)并降低了总耗时(降低到原来的3%~23%)。当共享人数上限达到一定值时,合乘效益逐渐收敛。在出行需求较高的情况下(人车比率大于5),共享人数上限设为3~4人时,合乘效益得到最大优化。实验结果充分说明了多乘客共享出行能够缓解当下“打车难”的问题,且随着出行需求的增加,自动驾驶共享模式相比传统非共享模式具有更强的鲁棒性。
一种融合时空关联与社会事件的交通流预测方法
吕明琪, 洪照雄, 陈铁明
计算机科学. 2021, 48 (2): 264-270.  doi:10.11896/jsjkx.200300098
摘要 ( 136 )   PDF(1721KB) ( 457 )   
参考文献 | 相关文章 | 多维度评价
交通流预测作为智能交通系统的一个关键问题,是国内外交通领域的研究热点。交通流预测的主要挑战在于交通流数据本身具有复杂的时空关联,且易受各种社会事件的影响。针对这些挑战,提出一种用于交通流预测的深度学习框架。一方面,针对道路网络非欧氏的空间关联以及交通流时序数据的时间关联,设计了一种融合图卷积神经网络和循环神经网络的特征抽取子网络;另一方面,针对社会事件对交通流的潜在影响,设计了一种基于卷积神经网络的社会事件特征抽取子网络。最后,融合时空关联特征抽取子网络和社会事件特征抽取子网络,实现交通流预测模型。为了验证模型的有效性,文中基于真实交通流数据进行了实验。结果表明,所提模型与传统的预测模型相比具有较高的准确度,准确度提高了3%~6%。
信息安全
区块链技术原理与应用综述
郭上铜, 王瑞锦, 张凤荔
计算机科学. 2021, 48 (2): 271-281.  doi:10.11896/jsjkx.200800021
摘要 ( 618 )   PDF(1938KB) ( 1514 )   
参考文献 | 相关文章 | 多维度评价
近年来,随着数字加密货币逐步走进人们的视野,其底层的区块链技术也引起了研究者的高度重视。区块链作为一种分布式账本技术,具有多方维护、不可篡改、公开透明等特点。首先,将区块链结构按层级进行划分,从低到高介绍了每层的作用和原理,根据开放程度将区块链分为公有链、联盟链、私有链,以比特币、Hyperledger Fabric为例分析了公有链和联盟链的工作机理。其次,对区块链的底层核心技术共识算法、智能合约、隐私安全做了详细阐述。最后,分析了区块链的研究进展并进行了展望。
基于能量分类器的抗SSDF攻击协作频谱感知算法
丁诗铭, 王天荆, 沈航, 白光伟
计算机科学. 2021, 48 (2): 282-288.  doi:10.11896/jsjkx.191100124
摘要 ( 93 )   PDF(2711KB) ( 167 )   
参考文献 | 相关文章 | 多维度评价
频谱感知是认知无线电通信的重要环节,SSDF(Spectrum Sensing Data Falsification)是协作频谱感知面临的严重安全威胁。SSDF攻击方式逐渐呈现动态化的趋势,传统防御算法因假定攻击强度保持不变而难以识别动态的篡改数据。针对动态化的SSDF攻击,提出一种基于能量分类器的抗SSDF攻击协作频谱感知算法。该算法首先通过分析动态SSDF攻击的特性,结合距离判别法将邻居节点能量分类,通过将分类结果与本地结果进行对比来识别恶意邻居节点;然后本地节点在滑动时间窗内根据历史频谱判决信息和当前频谱判决信息建立信誉模型,并由此更新各邻居节点的信誉值;最后,本地节点实施加权协作频谱感知。仿真结果表明:相比LDCSS(Largest Deviation-based distributed Cooperative Spectrum Sensing)算法和RBCSS(Reputation-based Cooperative Spectrum Sensing)算法,所提算法在动态SSDF攻击的攻击强度接近阈值时频谱检测概率分别提高了15%和16%,显著增加了认知网络的协作频谱感知性能,提升了频谱共享的效率。
基于区块并行的以太坊智能合约高速重放
陈自民, 卢艺文, 郭燕
计算机科学. 2021, 48 (2): 289-294.  doi:10.11896/jsjkx.200500105
摘要 ( 136 )   PDF(2609KB) ( 722 )   
参考文献 | 相关文章 | 多维度评价
分析和研究以太坊上的区块、交易、账户和智能合约数据具有巨大价值,但是以太坊数据量大、数据种类多、存储结构各异,当前数据获取方法的获取速度慢而且获取的数据不全,因此充分利用这些数据非常困难。文中提出了基于区块并行的以太坊数据快速导出工具Geth-query,通过分析以太坊内部机制,利用区块世界状态快照消除区块之间的依赖关系,优化本机资源利用效率并行重放区块,实现了快速而全面地提取以太坊链上数据。实验证明,Geth-query提取的数据种类丰富,数据导出速度相比传统方法提升了10倍左右。为了使用方便,文中同时对导出的数据进行存储优化,并在前端页面进行数据展示,从而为分析和研究以太坊提供了数据基础。
基于改进区块链的智能制造安全模型
王卫红, 陈震宇
计算机科学. 2021, 48 (2): 295-302.  doi:10.11896/jsjkx.191200159
摘要 ( 144 )   PDF(3570KB) ( 344 )   
参考文献 | 相关文章 | 多维度评价
针对传统区块链智能制造安全模型存在的区块构建和数据查询速度慢、插入查询操作的时间复杂度高等难题,提出了基于改进区块链的智能制造安全模型。首先为了克服传统区块链耗电量大和吞吐量低的弊端,引入新型Merkle Patricia树(MPT)扩展区块链结构,以提供节点状态的快速查询;然后针对MPT不支持并发操作和高负载状态下性能较差的问题,设计无锁并发缓存Merkle Patricia树,支持无锁的并发数据操作,可以提升在多核系统下的效率;最后采用具体仿真实验分析了所提模型的性能。结果表明,改进区块链的智能制造安全模型可以有效降低插入查询操作的时间复杂度,大幅提升区块构建和数据查询的速度,相较于传统模型,获得了更优的整体性能。
基于信任度匹配的改进PBFT共识算法
季钰翔, 黄建华, 王喆, 郑红, 唐瑞琮
计算机科学. 2021, 48 (2): 303-310.  doi:10.11896/jsjkx.200500112
摘要 ( 207 )   PDF(1978KB) ( 707 )   
参考文献 | 相关文章 | 多维度评价
共识算法是去中心化的区块链系统实现数据状态一致的关键。针对传统的实用拜占庭容错(Practical Byzantine Fault Tolerance,PBFT)共识算法在可扩展性和安全性方面存在的不足,提出一种基于信任度的匹配拜占庭共识算法 (Trust-based Matching Byzantine Fault Tolerance,TMBFT)。首先,通过基于信任度的邻居匹配模型来选取部分节点进行投票共识,以降低区块链网络的通信量;其次,引入信任度评价机制来监督邻居节点的行为,确保有效检测出拜占庭节点,保证节点投票的安全性;最后,设计投票计数机制保证了共识结果的一致性,并提高了共识效率。与PBFT相比,TMBFT将通信复杂度从O(N2)降到O(Nlog2N),有效降低了网络中的通信开销。安全性分析表明,信任度评价机制可降低节点作恶的概率,并有效提高系统安全性。实验结果表明,TMBFT较传统拜占庭算法具有更好的性能优势。
一种可用于数据和模型分享的模型链
闫凯伦, 张继连
计算机科学. 2021, 48 (2): 311-316.  doi:10.11896/jsjkx.191000126
摘要 ( 164 )   PDF(2601KB) ( 368 )   
参考文献 | 相关文章 | 多维度评价
机器学习开始在越来越多的行业中得到应用,但使用机器学习执行任务的软件一直受限于第三方软件商更新模型。文中基于区块链,将训练神经网络消耗的算力和区块链的工作量证明机制相结合,提出并实现了模型链。模型链作为一种可用于分享数据和机器学习模型的区块链,基于骨架网络训练神经网络模型,以全网节点匿名分享的数据作为训练模型的数据集,实现了不依赖第三方更新神经网络模型。模型链使用环签名来保护用户数据隐私,节点训练的模型使用统一的测试集评估,通过评估的模型将作为节点的工作量证明用于投票达成一致共识。文中提出了两种可行的激励机制,即物质奖励和模型奖励。对于潜在的威胁,如账本分析、脏数据攻击和欺骗投票,给出了相应的解决方案.实现了一个用于数字识别的模型链。实验结果表明,模型链中的模型可以适应实际场景下发生的用户变迁和数据变化。
基于因果知识和时空关联的云平台攻击场景重构
王文娟, 杜学绘, 任志宇, 单棣斌
计算机科学. 2021, 48 (2): 317-323.  doi:10.11896/jsjkx.191200172
摘要 ( 99 )   PDF(2670KB) ( 310 )   
参考文献 | 相关文章 | 多维度评价
云计算环境下的攻击行为逐步表现出隐蔽性强、攻击路径复杂多步等特点,即一次完整的攻击需要通过执行多个不同的攻击步骤来实现最终目的。而现有的入侵检测系统往往不具有必要的关联能力,仅能检测单步攻击或攻击片段,难以发现和识别多步攻击模式,无法还原攻击者完整的攻击渗透过程。针对这一问题,提出了基于因果知识和时空关联的攻击场景重构技术。首先,利用贝叶斯网络对因果知识进行建模,从具有IP地址相关性的告警序列中发掘出具有因果关系的攻击模式,为后续关联分析提供模板依据。然后,借助因果知识网络,从因果、时间和空间多维度上对告警进行关联分析,以发现潜在的隐藏关系,重构出高层次的攻击场景,为构建可监管、可追责的云环境提供依据和参考。
IoTGuardEye:一种面向物联网服务的Web攻击检测方法
刘新, 黄缘缘, 刘子昂, 周睿
计算机科学. 2021, 48 (2): 324-329.  doi:10.11896/jsjkx.200800030
摘要 ( 150 )   PDF(2689KB) ( 399 )   
参考文献 | 相关文章 | 多维度评价
在包括物联网(Internet of Things,IoT)设备的绝大部分边缘计算应用中,基于互联网应用技术(通常被称为Web技术)开发的应用程序接口(Application Programming Interface,API)是设备与远程服务器进行信息交互的核心。相比传统的Web应用,大部分用户无法直接接触到边缘设备使用的API,使得其遭受的攻击相对较少。但随着物联网设备的普及,针对API的攻击逐渐成为热点。因此,文中提出了一种面向物联网服务的Web攻击向量检测方法,用于对物联网服务收到的Web流量进行检测,并挖掘出其中的恶意流量,从而为安全运营中心(Security Operation Center,SOC)提供安全情报。该方法在对超文本传输协议(Hypertext Transfer Protocol,HTTP)请求的文本序列进行特征抽取的基础上,针对API请求的报文格式相对固定的特点,结合双向长短期记忆网络(Bidirectional Long Short-Term Memory,BLSTM)实现对Web流量的攻击向量检测。实验结果表明,相比基于规则的Web应用防火墙(Web Application Firewall,WAF)和传统的机器学习方法,所提方法针对面向物联网服务API的攻击具有更好的识别能力。
基于深度特征增广的跨域小样本人脸欺诈检测算法
孙文赟, 金忠, 赵海涛, 陈昌盛
计算机科学. 2021, 48 (2): 330-336.  doi:10.11896/jsjkx.200100020
摘要 ( 163 )   PDF(2173KB) ( 287 )   
参考文献 | 相关文章 | 多维度评价
随着人脸识别技术的发展,人脸欺诈攻击已经成为一项实际的安全问题,人脸欺诈检测算法用于及早发现该类攻击,保护系统安全。文中将一种经典域自适应算法扩展到深度神经网络中,首先定义了基于深度特征增广的域自适应层,提出了一种基于深度特征增广的跨域小样本人脸欺诈检测算法。该算法在已有的基于全卷积神经网络的人脸欺诈检测深度神经网络的中部嵌入域自适应层将卷积特征图增广,来适配源域和目标域的差异,随后根据增广后的特征图进行像素级分类,最后将像素级概率图从空间上融合为帧级决策。文中在CASIA-FASD,Replay-Attack和OULU-NPU 3个数据集和6个常见测评协议(2个CASIA-FASD与Replay-Attack跨库协议和4个OULU-NPU标准协议)下进行实验,验证了算法在不同背景、不同攻击设备、不同相机等跨域情况下的性能。实验表明,基准FCN人脸欺诈检测算法已经能够达到较好的性能,在此基础上,借助小样本目标域数据学习域自适应模型,可进一步显著提升性能,将错误率减半(CASIA-FASD训练+Replay-Attack测试的HTER指标从27.31%降至11.23%,Replay-Attack训练+CASIA-FASD测试的HTER指标从37.33%降至21.83%,OULU-NPU标准协议IV的ACER指标从9.45%降至5.56%),实验结果验证了基于深度特征增广的跨域小样本人脸欺诈检测算法的有效性。