1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2022年第3期, 刊出日期:2022-03-15
  
目录
第49卷第3期目录
计算机科学. 2022, 49 (3): 0-0. 
摘要 ( 256 )   PDF(5500KB) ( 736 )    Suppl. Info.
相关文章 | 多维度评价
新兴分布式计算技术与系统*
新兴分布式计算技术与系统专题序言
廖小飞, 郭得科, 叶保留
计算机科学. 2022, 49 (3): 1-2.  doi:10.11896/jsjkx.qy20220301
摘要 ( 586 )   PDF(982KB) ( 766 )   
相关文章 | 多维度评价
OpenFoam中多面体网格生成的MPI+OpenMP混合并行方法
刘江, 刘文博, 张矩
计算机科学. 2022, 49 (3): 3-10.  doi:10.11896/jsjkx.210700060
摘要 ( 687 )   PDF(3603KB) ( 1392 )   
参考文献 | 相关文章 | 多维度评价
网格生成是计算流体力学中非常重要的一环,大规模数值模拟过程中对网格精度要求的提高会导致网格生成所耗的时间增加。文中基于OpenFoam开源软件中的网格生成算法,主要研究多面体网格的并行生成,并提出OpenMP和MPI混合并行的多面体网格生成方法。通过理论分析得到,使用混合并行方法生成相同质量的网格时,混合并行方法生成网格的时间消耗随着线程数量和网格单元数量的增加而减少。3组使用不同求解器的数值模拟实验结果表明,该混合并行方法不但可以保证生成网格的质量——可以正常进行数值计算模拟且模拟结果与原方法相比几乎没有差别,而且生成同样质量与数量网格的耗时最多可以缩短至未使用OpenMP并行方法之耗时的1/4以内。
减少Hadoop集群中网络队头阻塞的调度算法
田冰川, 田臣, 周宇航, 陈贵海, 窦万春
计算机科学. 2022, 49 (3): 11-22.  doi:10.11896/jsjkx.210900117
摘要 ( 609 )   PDF(3477KB) ( 937 )   
参考文献 | 相关文章 | 多维度评价
大数据分析系统的用户希望任务的执行时间尽可能短。然而,在任务执行期间,网络与计算时刻都可能成为阻碍任务执行的资源瓶颈。通过对大数据分析系统的观察与分析,得出如下结论:1)根据当前资源瓶颈的不同,数据并行框架应当在多种工作模式之间切换;2)子任务的调度应当充分考虑将来可能到达的新任务,而不能仅考虑当前已经提交的任务。基于上述观察,设计并实现了全新的任务调度系统Duopoly,其由感知计算资源的网络调度器cans与感知网络资源的子任务调度器nats两部分组成。通过小规模物理集群与大规模仿真实验对Duopoly的效果进行评估,实验结果表明,与现有工作相比,Duopoly可以将平均任务完成时间缩短37.30%~76.16%。
基于在线双边拍卖的分层联邦学习激励机制
杜辉, 李卓, 陈昕
计算机科学. 2022, 49 (3): 23-30.  doi:10.11896/jsjkx.210800051
摘要 ( 849 )   PDF(2220KB) ( 1514 )   
参考文献 | 相关文章 | 多维度评价
在分层联邦学习中,能量受限的移动设备参与模型训练会消耗自身资源。为了降低移动设备的能耗,文中在不超过分层联邦学习的最大容忍时间下,提出了移动设备能耗之和最小化问题。不同训练轮次的边缘服务器能够选择不同的移动设备,移动设备也能够为不同的边缘服务器并发训练模型,因此文中基于在线双边拍卖机制提出了ODAM-DS算法。基于最优停止理论,支持边缘服务器在合适的时刻选择移动设备,使得移动设备的平均能耗最小,然后对提出的在线双边拍卖机制进行理论分析,证明其满足激励相容性、个体理性、弱预算均衡约束等特性。模拟实验的结果证明,ODAM-DS算法产生的能耗比已有的HFEL算法平均降低了19.04%。
一种面向电能量数据的联邦学习可靠性激励机制
王鑫, 周泽宝, 余芸, 陈禹旭, 任昊文, 蒋一波, 孙凌云
计算机科学. 2022, 49 (3): 31-38.  doi:10.11896/jsjkx.210700195
摘要 ( 746 )   PDF(1813KB) ( 1337 )   
参考文献 | 相关文章 | 多维度评价
联邦学习解决了数据安全日益受到重视条件下的数据互用难题,但是传统联邦学习缺少鼓励和吸引数据拥有方参与到联邦学习中的激励机制,联邦学习审核机制的缺失给恶意节点进行破坏攻击提供了可能性。针对这个问题,文中提出基于区块链技术的面向电能量数据的可靠的联邦学习激励机制。该方法从对数据参与方的训练参与进行奖励和对数据参与方的数据可靠性进行评估两方面入手,设计算法对数据参与方的训练效果进行评估,从训练效果和训练成本等角度来确定数据参与方的贡献度,并根据贡献度来对参与方进行奖励,同时针对数据参与方的可靠性建立声望模型,根据训练效果对数据参与方的声望进行更新,藉此实现对数据参与方的可靠性评估。基于联邦学习开源框架和真实电能量数据进行算例分析,所得结果验证了所提方法的有效性。
面向多层无线边缘环境下的联邦学习通信优化的研究
赵罗成, 屈志昊, 谢在鹏
计算机科学. 2022, 49 (3): 39-45.  doi:10.11896/jsjkx.210800054
摘要 ( 684 )   PDF(2040KB) ( 1209 )   
参考文献 | 相关文章 | 多维度评价
现有的联邦学习模型同步方法大多基于单层的参数服务器架构,难以适应当前异构无线网络场景,同时存在单点通信负载过重、系统延展性差等问题。针对这些问题,文中提出了一种面向边缘混合无线网络的联邦学习高效模型同步方法。在混合无线网络环境中,边缘移动终端将本地模型传输给附近的小型基站,小型基站收到边缘移动终端模型后执行聚合算法,并将聚合后的模型发送给宏基站完成全局模型更新。考虑到信道性能的异构性和数据传输在无线信道上的竞争关系,文中提出了一种新型的分组异步模型同步方法,并设计了基于传输速率感知的信道分配算法。在真实的数据集上进行了实验,实验结果表明,与传统的模型更新算法相比,所提基于分组异步模型更新的信道分配方法可以缩短25%~60%的训练通信时间,大幅度提升了联邦学习的训练效率。
基于深度强化学习的无信号灯交叉路口车辆控制
欧阳卓, 周思源, 吕勇, 谭国平, 张悦, 项亮亮
计算机科学. 2022, 49 (3): 46-51.  doi:10.11896/jsjkx.210700010
摘要 ( 745 )   PDF(2133KB) ( 1367 )   
参考文献 | 相关文章 | 多维度评价
利用深度强化学习技术实现无信号灯交叉路口车辆控制是智能交通领域的研究热点。现有研究存在无法适应自动驾驶车辆数量动态变化、训练收敛慢、训练结果只能达到局部最优等问题。文中研究在无信号灯交叉路口,自动驾驶车辆如何利用分布式深度强化方法来提升路口的通行效率。首先,提出了一种高效的奖励函数,将分布式强化学习算法应用到无信号灯交叉路口场景中,使得车辆即使无法获取整个交叉路口的状态信息,只依赖局部信息也能有效提升交叉路口的通行效率。然后,针对开放交叉路口场景中强化学习方法训练效率低的问题,使用了迁移学习的方法,将封闭的8字型场景中训练好的策略作为暖启动,在无信号灯交叉路口场景继续训练,提升了训练效率。最后,提出了一种可以适应所有自动驾驶车辆比例的策略,此策略在任意比例自动驾驶车辆的场景中均可提升交叉路口的通行效率。在仿真平台Flow上对TD3强化学习算法进行了验证,实验结果表明,改进后的算法训练收敛快,能适应自动驾驶车辆比例的动态变化,能有效提升路口的通行效率。
以太坊Solidity智能合约漏洞检测方法综述
张潆藜, 马佳利, 刘子昂, 刘新, 周睿
计算机科学. 2022, 49 (3): 52-61.  doi:10.11896/jsjkx.210700004
摘要 ( 985 )   PDF(1865KB) ( 4276 )   
参考文献 | 相关文章 | 多维度评价
以太坊Solidity智能合约基于区块链技术,作为一种旨在以信息化方式传播、验证或执行的计算机协议,为各类分布式应用服务提供了基础。虽然落地还不足6年,但因其安全漏洞事件频繁爆发,且造成了巨大的经济损失,使得其安全性检查方面的研究备受关注。首先基于以太坊相关技术对智能合约的一些特殊机制和运行原理进行介绍,并根据智能合约的自身特性对一些出现频率较高的智能合约漏洞进行分析,然后从符号执行、模糊测试、形式化验证和污点分析等方面分类阐述了传统的主流智能合约漏洞检测工具。此外,为了应对层出不穷的新型漏洞以及提高漏洞检测效率的需求,将近年来基于机器学习的漏洞检测技术依据其问题转化方式的不同做了分类总结,并从文本处理、非欧几里得图和标准图像3个角度进行了简要介绍。最后,针对两类检测方向的不足之处,提出了建立相关标准化、规范化信息库以及衡量指标的建议。
基于贝叶斯攻击图的动态网络安全分析
李嘉睿, 凌晓波, 李晨曦, 李子木, 杨家海, 张蕾, 吴程楠
计算机科学. 2022, 49 (3): 62-69.  doi:10.11896/jsjkx.210800107
摘要 ( 532 )   PDF(2323KB) ( 1160 )   
参考文献 | 相关文章 | 多维度评价
针对目前攻击图模型不能实时反映网络攻击事件的问题,提出了前向更新风险概率计算方法,以及前向、后向更新相结合的动态风险概率算法。所提算法能够即时、准确地动态评估和分析网络环境变化问题,对网络攻击事件进行动态实时分析。首先对图中各个节点的不确定性进行具体量化分析,在贝叶斯网络中计算它们的静态概率,之后根据实时发生的网络安全事件沿前向和后向路径更新图中各个节点的动态概率,实时量化和反映外界条件的变化,评估网络各处的实时危险程度。实验结果表明,所提方法可以根据实际情况校准和调整攻击图中各节点的概率,进而帮助网络管理员正确认识网络各处的危险级别,更好地为预防和阻止下一步攻击做出决策。
基于奇异值分解的同态可交换脆弱零水印研究
任花, 牛少彰, 王茂森, 岳桢, 任如勇
计算机科学. 2022, 49 (3): 70-76.  doi:10.11896/jsjkx.210800015
摘要 ( 573 )   PDF(2492KB) ( 813 )   
参考文献 | 相关文章 | 多维度评价
现有的水印和加密方案大多难以确保水印和加密过程的交换性以及受保护图像的视觉质量,这些方案的水印嵌入和加密过程固定且对受保护图像的内容进行了或多或少的修改,很少有方案在不影响受保护图像内容质量的前提下完成水印和加密过程的交换。因此,提出了一种基于奇异值分解的同态可交换脆弱零水印方案。在发送端,内容所有者采取同态加密对原始图像内容进行加密,加密和水印生成两个阶段互不影响,可以分别从加密图像和原始宿主图像生成零水印信息。在接收端,合法接收者先进行图像解密,再在解密的图像内容上进行水印检测,通过提取的水印信息可以检测和定位水印图像的蓄意篡改区域。实验结果表明,零水印的引入不会造成图像灰度值的改变,在确保交换性的同时可以完美定位图像篡改区域。
支持访问策略隐藏和密钥追踪的轻量级医疗数据共享方案
王梦宇, 殷新春, 宁建廷
计算机科学. 2022, 49 (3): 77-85.  doi:10.11896/jsjkx.210800001
摘要 ( 525 )   PDF(1673KB) ( 658 )   
参考文献 | 相关文章 | 多维度评价
在传统的密文策略属性基加密(Ciphertext-Policy Attribute-Based,CP-ABE)方案中,访问策略是显式存在的,这可能会泄露数据所有者的隐私,在医疗场景中会给数据所有者带来潜在的安全隐患,因此支持访问策略隐藏的方案被陆续提出。但是多数方案在实现解密测试的过程中需要生成冗余密文或密钥组件,增加了数据所有者的计算开销和数据用户的存储开销。同时,恶意用户可能会受利益驱使,泄露其解密密钥。为了解决以上问题,提出了一个支持访问策略隐藏和密钥追踪的轻量级医疗数据共享方案。首先,采用SGX(Software Guard Extensions)技术,预先将部分主密钥存放在Enclave中,便于准确且快速地计算出测试结果,避免生成冗余密文和密钥组件;然后,为了降低用户的计算开销,同时保证解密结果的正确性和完整性,采用可验证外包技术;最后,通过在数据用户的解密密钥中嵌入身份标识实现了密钥追踪。性能分析表明,该方案在功能和开销上都具备一定的优势,安全性分析证明了该方案在选择明文攻击下是安全的。
数据库&大数据&数据科学
GSO:基于图神经网络的深度学习计算图子图替换优化框架
苗旭鹏, 周跃, 邵蓥侠, 崔斌
计算机科学. 2022, 49 (3): 86-91.  doi:10.11896/jsjkx.210700199
摘要 ( 865 )   PDF(2335KB) ( 3379 )   
参考文献 | 相关文章 | 多维度评价
深度学习在各种实际应用中取得了巨大成功,如何有效提高各种复杂的深度学习模型在硬件设备上的执行效率是该领域重要的研究内容之一。深度学习框架通常将深度学习模型表达为由基础算子构成的计算图,为了提高计算图的执行效率,传统的深度学习系统通常基于一些专家设计的子图替换规则,采用启发式搜索算法来优化计算图。它们的不足主要有:1)搜索空间大,效率低下;2)缺乏可拓展性;3)难以利用历史优化结果。为了解决上述问题,文中提出了GSO,即一个基于图神经网络的深度学习计算图子图替换优化框架。该框架将计算图的子图优化建模成经典的子图匹配问题,基于计算图中算子的特征信息和计算图的拓扑结构信息,通过图神经网络模型来估计每种子图替换规则的匹配可行性和位置。基于与主流深度学习系统兼容的Python接口实现了GSO,实验结果表明:1)相比全量的子图替换规则,基于图神经网络的子图匹配预测可以最多减少92%的搜索空间;2)相比现有的启发式搜索算法,GSO可以更快地完成计算图子图替换优化(2倍以上),并使优化后的子图最多得到34%的加速。
基于信息熵更新权重的数据流集成分类算法
夏源, 赵蕴龙, 范其林
计算机科学. 2022, 49 (3): 92-98.  doi:10.11896/jsjkx.210200047
摘要 ( 765 )   PDF(1699KB) ( 2946 )   
参考文献 | 相关文章 | 多维度评价
在动态的数据流中,由于其不稳定性以及存在概念漂移等问题,集成分类模型需要有及时适应新环境的能力。目前通常使用监督信息对基分类器的权重进行更新,以此来赋予符合当前环境的基分类器更高的权重,然而监督信息在真实数据流环境下无法立即获得。为了解决这个问题,文中提出了一种基于信息熵更新基分类器权重的数据流集成分类算法。首先使用随机特征子空间对每个基分类器进行初始化来构建集成分类器;其次基于每个新到来的数据块构建一个新的基分类器来替换集成中权重最低的基分类器;然后基于信息熵的权重更新策略实时对基分类器中的权重进行更新;最后满足要求的基分类器参与加权投票,得到分类结果。将所提算法和几个经典学习算法进行对比,实验结果表明,所提方法的分类准确性有着明显优势,并且适合多种类型的概念漂移环境。
基于评论和物品描述的深度学习推荐算法
王美玲, 刘晓楠, 尹美娟, 乔猛, 荆丽娜
计算机科学. 2022, 49 (3): 99-104.  doi:10.11896/jsjkx.210200170
摘要 ( 539 )   PDF(2073KB) ( 959 )   
参考文献 | 相关文章 | 多维度评价
评论文本中蕴含着丰富的用户和物品信息,将其应用于推荐算法有助于缓解数据稀疏问题,提高推荐准确度。然而,现有的基于评论的推荐模型对评论文本的挖掘不够充分和有效,并且大多忽视了用户兴趣随时间的迁移和蕴含物品属性的物品描述文档,使得推荐结果不够准确。基于此,文中提出了一种基于深度语义挖掘的推荐模型(Deep Semantic Mining based Recommendation,DSMR),通过深度挖掘评论文本和物品描述文档的语义信息,更精确地提取用户特征和物品属性特征,从而实现更准确地推荐。首先,所提模型利用BERT预训练模型来处理评论文本和物品描述文档,深度挖掘用户特征和物品属性,有效缓解了数据稀疏和物品冷启动问题;然后,利用前向LSTM来关注用户偏好随时间产生的变化,得到了更精确的推荐;最后,在模型训练阶段,将实验数据按1~5分1∶1∶1∶1∶1等量随机抽取,保证每个分值的数据量相等,使结果更加准确,模型鲁棒性更强。在4个常用的亚马逊公开数据集上进行实验,结果表明,以均方根误差为评价指标,DSMR推荐结果的误差比2个仅基于评分数据的经典推荐模型至少平均降低了11.95%,同时优于基于评论文本的3个最新推荐模型,且比其中最优的模型平均降低了5.1%。
基于结构深度网络嵌入模型的节点标签分类算法
陈世聪, 袁得嵛, 黄淑华, 杨明
计算机科学. 2022, 49 (3): 105-112.  doi:10.11896/jsjkx.201000177
摘要 ( 352 )   PDF(3719KB) ( 818 )   
参考文献 | 相关文章 | 多维度评价
在海量数据呈现爆炸增长态势的互联网时代,传统算法已无法满足处理大规模、多类型数据的需求。近年来最新的图嵌入算法通过学习图网络特征,在链路预测、网络重构和节点分类实践中普遍取得了极佳的效果。文中基于传统自动编码器模型,创新地提出了一种融合Sdne算法与链路预测相似度矩阵的新算法,通过在反向传播过程中引入高阶损失函数,依据自编码器的新特征调整性能,改进传统算法中以单一方式判定节点相似度这一方法存在的弊端,并建立简易模型分析证明优化的合理性。对比最新研究中效果最好的Sdne算法,该算法在Micro-F1和Macro-F1两种评价指标上的提升效果均接近1%,可视化分类效果表现良好。与此同时,研究发现高阶损失函数超参的最优值大致处于1~10范围内,数值的变化依旧能够基本稳定维持整体网络的鲁棒性。
基于好友亲密度的用户匹配
郭磊, 马廷淮
计算机科学. 2022, 49 (3): 113-120.  doi:10.11896/jsjkx.210200137
摘要 ( 570 )   PDF(2451KB) ( 964 )   
参考文献 | 相关文章 | 多维度评价
用户匹配的目的是检测来自不同社交网络的用户是否是同一个人。现有的研究主要集中在用户属性和网络嵌入上,而这些研究方法往往忽略了用户与好友间的亲密关系。因此,文中提出一种基于好友亲密度的用户匹配算法(FCUM)。该算法是一种半监督、端到端的跨社交网络用户匹配算法,其中注意力机制被用于量化用户与好友之间的亲密度。好友亲密度的量化能够提高FCUM的泛化能力。通过在单一目标函数中对用户个体相似性和亲密好友相似性进行联合优化,能充分利用用户个体相似性和亲密好友相似性。文中还设计了一种双向匹配策略,用于解决人工标记匹配用户代价较高的问题。在真实数据集上的实验表明,FCUM算法优于其他只考虑用户个体相似性的方法。在如今用户隐私保护限制愈发严格、难以获取用户其他完整属性信息的情形下,该算法具有实用和易于推广的特性。
基于节点相似性和网络嵌入的复杂网络社区发现算法
杨旭华, 王磊, 叶蕾, 张端, 周艳波, 龙海霞
计算机科学. 2022, 49 (3): 121-128.  doi:10.11896/jsjkx.210200009
摘要 ( 533 )   PDF(2060KB) ( 957 )   
参考文献 | 相关文章 | 多维度评价
社区发现算法对分析复杂网络的拓扑和层次结构、预测复杂网络的演化趋势等具有十分重要的意义。传统的社区发现算法划分精度不高,忽略了网络嵌入的重要性。针对这样的问题,提出了基于节点相似性和网络嵌入Node2Vec方法的无参数社区发现算法。首先,使用网络嵌入Node2Vec方法将网络节点映射成欧氏空间中低维向量表示的数据点,计算低维向量表示的数据点之间的余弦相似性,根据相应节点间的最大相似性构建偏好网络,得到初始社区划分,把每个初始社区的最大度节点作为备选节点;然后根据网络平均度和平均最短路径找出备选节点中的中心节点;最后将中心节点对应的数据点及其数量作为初始质心和聚类数,用K-Means算法对低维向量表示的数据点进行聚类,从而对相应的网络节点完成社区划分。该算法为无参数社区划分方法,可以自主地从网络中提取参数,无须根据网络的不同设定不同的超参数,从而可以自动地快速识别复杂网络的社区结构。在8个真实网络和人工网络上,将其与其他5个知名社区发现算法相比较,数值仿真实验表明所提算法具有很好的社区发现效果。
面向多中心数据的超图卷积神经网络及应用
周海榆, 张道强
计算机科学. 2022, 49 (3): 129-133.  doi:10.11896/jsjkx.201100152
摘要 ( 631 )   PDF(1317KB) ( 997 )   
参考文献 | 相关文章 | 多维度评价
近年来,图神经网络在神经性脑疾病诊断中的应用引起了广泛关注。然而,现有研究中使用的图通常只是基于简单的点对点连接,无法反映3个或更多受试者之间的复杂关联,尤其是在多中心数据集中,即由不同医疗机构所使用的不同采集设备和不同受试人群而集成的具有异质性的数据集。为解决医疗影像数据中存在的多中心异质性问题,提出了一种多中心超图数据结构来描述多中心数据之间的关系。这种超图由两种不同的超边构成,一种是描述单个中心内部关系的中心内超边,另一种是描述不同中心之间关系的跨中心超边。另外,还提出了一种超图卷积神经网络来学习节点的特征表示,这种超图卷积由两部分构成,第一部分是超图节点卷积,第二部分是超边卷积。在两个多中心数据集上的实验结果证明了所提方法的有效性。
基于自注意力的自监督深度聚类算法
韩洁, 陈俊芬, 李艳, 湛泽聪
计算机科学. 2022, 49 (3): 134-143.  doi:10.11896/jsjkx.210100001
摘要 ( 766 )   PDF(3909KB) ( 1054 )   
参考文献 | 相关文章 | 多维度评价
近年来,基于联合训练的深度聚类方法,如DEC(Deep Embedding Clustering)和DDC(Deep Denoising Clustering)算法,使基于特征提取的图像聚类取得了很多新进展,带来了聚类性能的突破,而且特征提取环节对后续聚类任务有直接影响。但是,这些方法的泛化能力较差,在不同数据集使用不同的网络结构,聚类性能相比分类性能仍有很大的提升空间。为此,文中提出了一种基于自注意力的自监督深度聚类方法(Self-attention Based Self-supervised Deep Clustering,SADC)。首先设计一个深度卷积自编码器用于提取特征,并且用带噪声的输入数据训练该网络来增强模型的鲁棒性;其次引入自注意力机制,辅助网络捕获对聚类有用的信息;最后编码器部分结合K-means算法形成一个深度聚类器,用于进行特征表示和聚类分配,通过迭代更新网络参数来提高聚类精度和网络的泛化能力。在6个图像数据集上验证所提聚类算法的性能,并与深度聚类算法DEC,DDC等进行比较。实验结果表明,SADC能提供令人满意的聚类结果,而且聚类性能与DEC和DDC相当。总之,统一的网络结构在保证聚类精度的同时降低了深度聚类算法的复杂度。
单类支持向量机融合深度自编码器的异常检测模型
武玉坤, 李伟, 倪敏雅, 许志骋
计算机科学. 2022, 49 (3): 144-151.  doi:10.11896/jsjkx.210100142
摘要 ( 380 )   PDF(2711KB) ( 866 )   
参考文献 | 相关文章 | 多维度评价
大规模高维不平衡数据是异常检测中的重大挑战。单类支持向量机在处理不平衡数据方面非常有效,但不适合大规模高维数据,同时单类支持向量机的核函数对检测性能也具有重要的影响。文中提出了一个深度自编码器与单类支持向量机相结合的异常检测模型,深度自编码器不仅负责提取特征和降维,同时拟合出了一个自适应核函数。深度自编码器与单类支持向量机共享损失函数,实现了端到端的训练。作为一个整体,模型采用梯度下降法进行联合训练。在4个公开数据集上与其他异常检测方法进行了对比实验。实验结果表明,在AUC以及召回率(RECALL)方面,所提模型的性能优于单核和多核单类支持向量机以及其他模型,并且所提模型在不同异常率时是鲁棒的,在时间复杂度方面也具有非常大的优势。
计算机图形学&多媒体
多目标跟踪的对象初始化综述
文成宇, 房卫东, 陈伟
计算机科学. 2022, 49 (3): 152-162.  doi:10.11896/jsjkx.210200048
摘要 ( 544 )   PDF(1898KB) ( 817 )   
参考文献 | 相关文章 | 多维度评价
对象初始化方法决定了如何对待多目标跟踪问题,与后续的多目标跟踪效果直接相关。不同的对象初始化方法能够确定不同的多目标跟踪框架,每一种框架都提供一种解决问题的思路,使得多目标跟踪的对象初始化问题具有巨大的研究前景。目前关于多目标跟踪中的对象初始化方法的综述性文献较少或缺乏系统性的对象初始化概述,因此文中从多假设跟踪方法、网络流方法、深度学习方法和主题发现方法4个方面对多目标跟踪的对象初始化方法进行分析。系统地阐述了不同多目标跟踪框架下的任务转换和对象映射问题,汇总了多目标跟踪的对象初始化方法。
基于互注意力指导的孪生跟踪算法
赵越, 余志斌, 李永春
计算机科学. 2022, 49 (3): 163-169.  doi:10.11896/jsjkx.210300066
摘要 ( 497 )   PDF(4101KB) ( 782 )   
参考文献 | 相关文章 | 多维度评价
针对传统孪生网络目标跟踪算法在相似物干扰、目标形变、复杂背景等跟踪环境下无法进行鲁棒跟踪的问题,提出了注意力机制指导的孪生网络目标跟踪方法,以弥补传统孪生跟踪方法存在的性能缺陷。首先,利用卷积神经网络ResNet50的不同网络层来提取多分辨率的目标特征,并设计互注意力模块使模板分支与搜索分支之间的信息能够相互流动。然后,在分类与回归网络中,将主干网络提取的每块特征信息权重参数通过神经网络自动学习、更新并加权融合每块特征的分类与回归信息。最后,根据响应图的峰值位置计算目标的预估位置和尺度信息。在UAV123数据集上,所提算法相比主流跟踪算法SiamBAN,准确率提升了1.7个点,成功率提升了0.7个点;在VOT2018数据集上,相比SiamRPN++算法,所提算法在EAO指标上提高了2.5个点,实时跟踪速度保持在35FPS。
基于特征定位与融合的行人重识别算法
杨晓宇, 殷康宁, 候少麒, 杜文仪, 殷光强
计算机科学. 2022, 49 (3): 170-178.  doi:10.11896/jsjkx.210100132
摘要 ( 908 )   PDF(3277KB) ( 807 )   
参考文献 | 相关文章 | 多维度评价
行人外观属性是区分行人差异的重要语义信息。行人属性识别在智能视频监控中有着至关重要的作用,可以帮助我们对目标行人进行快速的筛选和检索。在行人重识别任务中,可以利用属性信息得到精细的特征表达,从而提升行人重识别的效果。文中尝试将行人属性识别与行人重识别相结合,寻找一种提高行人重识别性能的方法,进而提出了一种基于特征定位与融合的行人重识别框架。首先,利用多任务学习的方法将行人重识别与属性识别结合,通过修改卷积步长和使用双池化来提升网络模型的性能。其次,为了提高属性特征的表达能力,设计了基于注意力机制的平行空间通道注意力模块,它不仅可以在特征图上定位属性的空间位置,而且还可以有效地挖掘与属性关联度较高的通道特征,同时采用多组平行分支结构减小误差,进一步提高网络模型的性能。最后,利用卷积神经网络设计特征融合模块,将属性特征与行人身份特征进行有效融合,以获得更具鲁棒性和表达力的行人特征。实验在两个常用的行人重识别数据集DukeMTMC-reID和Market-1501上进行,结果表明,所提方法在现有的行人重识别方法中处于领先水平。
基于生成对抗网络去影像的多基频估计算法
黎思泉, 万永菁, 蒋翠玲
计算机科学. 2022, 49 (3): 179-184.  doi:10.11896/jsjkx.201200081
摘要 ( 284 )   PDF(2425KB) ( 558 )   
参考文献 | 相关文章 | 多维度评价
多基频估计被广泛应用于音乐结构分析、乐音辅助教育、信息检索等各个领域。为了满足准确识别乐曲中随机和弦的需求,提出了基于生成对抗网络去影像的多基频估计算法。首先将完整音频切分成音符段,提出了一种谐音指纹图提取音符段频谱特征;然后通过卷积神经网络识别谐音指纹图当前的主导基频,将已识别出的主导基频作为干扰下一个基频识别的影像,并通过生成对抗网络去除干扰影像,对已去除干扰影像后的谐音指纹图进行新一轮的多基频估计;最后通过逐级迭代去影像操作实现完整和弦的多基频估计。对随机二音和弦及随机三音和弦组成的钢琴音频数据库进行实验,结果表明,所提算法与经典频谱迭代删除算法和大型词袋和弦识别算法相比,能够适应随机和弦的识别,在不同的音域范围内鲁棒性高,整体正确率有明显提升。
基于元迁移的太阳能电池板缺陷图像超分辨率重建方法
周颖, 常明新, 叶红, 张燕
计算机科学. 2022, 49 (3): 185-191.  doi:10.11896/jsjkx.210100234
摘要 ( 406 )   PDF(2462KB) ( 678 )   
参考文献 | 相关文章 | 多维度评价
针对太阳能电池板隐裂缺陷在进行光学检测时存在的特征不明显问题,以及小样本导致的训练不充分问题,提出了基于元迁移的太阳能电池板缺陷图像超分辨率重建方法,采用联合训练方法,利用内部图像和外部大规模图像信息分别作为不同阶段的训练数据。首先将引入的大量数据用于模型的初步训练,学习外部大规模数据的公共特征,然后通过元学习模型MAML进行多任务训练,为快速适应小样本无监督任务寻找一个适合图像内部学习的初始参数,提高模型的泛化能力,最后将预训练参数迁移至改进的ZSSR中进行自监督学习。在DIV2K、Set5、BSD100和太阳能电池板电致发光成像数据集上进行训练,实验结果表明,与传统的CARN,RCAN,IKC,ZSSR方法相比,该方法具有更高的峰值信噪比,最高达到36.66,参数量更小,相比ZSSR降低了70 000,图像重建时间更短,相比CARN降低了0.51 s,具有更好的重建效果,更高的重建效率。
基于空洞卷积和多特征融合的混凝土路面裂缝检测
瞿中, 陈雯
计算机科学. 2022, 49 (3): 192-196.  doi:10.11896/jsjkx.210100164
摘要 ( 482 )   PDF(2804KB) ( 694 )   
参考文献 | 相关文章 | 多维度评价
混凝土路面的裂缝检测是确保道路安全的重要基础任务。针对混凝土路面的复杂背景和裂缝本身复杂的拓扑结构,提出了一种基于空洞卷积和多特征融合的混凝土路面裂缝检测网络,该网络采用基于U-Net的编码-解码结构。在编码阶段,使用改进的残差网络Res2Net提高特征提取能力;在网络的中间部分,使用串联和并联相结合的不同空洞率的空洞卷积,从而在增加特征点的感受野的同时不会降低特征图的分辨率;在解码阶段,融合了从低层卷积到高层卷积的多尺度和多级特征,提高了裂缝检测的准确性。为证明所提算法的有效性和准确性,将其与现有的部分检测方法进行了比较并使用F-score来评估检测性能。在多个混凝土路面数据集上的实验结果表明,该算法提高了裂缝检测的准确性,具有较好的鲁棒性。
基于图像分块与特征融合的户外图像天气识别
左杰格, 柳晓鸣, 蔡兵
计算机科学. 2022, 49 (3): 197-203.  doi:10.11896/jsjkx.201200263
摘要 ( 701 )   PDF(2574KB) ( 834 )   
参考文献 | 相关文章 | 多维度评价
在视频监控及智能交通等领域,雾、雨、雪等恶劣天气会严重影响视频图像能见度,因此快速识别出当前的天气情况,并自适应地对监控视频进行清晰化处理极为重要。针对传统天气识别方法效果差以及天气图像数据集缺乏的问题,构建了一个多类别天气图像分块数据集,并提出了一种基于图像分块与特征融合的天气识别算法。该算法基于传统方法提取平均梯度、对比度、饱和度、暗通道4种特征作为天气图像的浅层特征,基于迁移学习对VGG16预训练模型进行微调,提取微调模型的全连接层特征作为天气图像的深层特征,将天气图像浅层特征与深层特征融合作为最终特征用于训练Softmax分类器,实现对雾、雨、雪、晴4类天气图像的识别。实验结果表明,所提算法能达到99.26%的识别准确率,并且可作为天气识别模块应用于自适应视频图像清晰化处理系统。
基于眼前节相干光断层扫描成像的核性白内障分类算法
章晓庆, 方建生, 肖尊杰, 陈浜, RisaHIGASHITA, 陈婉, 袁进, 刘江
计算机科学. 2022, 49 (3): 204-210.  doi:10.11896/jsjkx.201100085
摘要 ( 521 )   PDF(1889KB) ( 779 )   
参考文献 | 相关文章 | 多维度评价
白内障是导致视觉损害和致盲的主要眼病,眼前节光学相干断层成像技术(Anterior Segment Optical Coherence Tomography,AS-OCT)具有非接触、高分辨率、检查快速、客观定量化测量等特点,在临床上已经被广泛应用于眼病的诊断。目前缺乏基于眼前节OCT图像的核性白内障分类研究工作,为此提出了一种基于眼前节OCT图像的核性白内障分类算法。首先,利用自适应阈值方法、边缘检测 Canny 算法和手工校正相结合的方式从眼前节OCT图像中提取晶状体的核性区域;然后,基于图像强度和直方图的特征统计方法提取18个像素特征,并应用皮尔逊相关系数方法分析提取像素特征与核性白内障严重程度之间的相关性;最后,利用随机森林算法构建分类模型,从而得到核性白内障分类结果。在一个眼前节OCT图像数据集上的实验结果表明,所提算法对核性白内障严重程度的分类准确率和召回率分别达到了75.53%和74.04%,具有作为核性白内障临床诊断的定量分析参考工具的潜力。
基于改进卷积注意力模块与残差结构的SSD网络
张侣, 周博文, 吴亮红
计算机科学. 2022, 49 (3): 211-217.  doi:10.11896/jsjkx.201200019
摘要 ( 572 )   PDF(3575KB) ( 948 )   
参考文献 | 相关文章 | 多维度评价
SSD(Single Shot Multibox Detector) 是一种基于卷积神经网络的单阶检测算法,相比双阶检测算法,它在保证一定精度的同时显著提高了检测速度,但仍难以满足很多实际应用,尤其是在小目标检测任务中,检测精度更是难以满足需求。针对该不足,文中提出了一种基于改进残差结构与卷积注意力模块的特征提取网络Res-Am CNN (Residual with Attention Module Convolutional Neural Networks),大幅提高了网络的特征提取能力,并在原始SSD金字塔结构中引入上采样加法融合 (Additive Fusion with Upsample,AFU) 来进行特征融合,增强了浅层特征的表征能力。在 PASCAL VOC数据集上的实验结果表明,相比原始SSD网络和主流的检测网络,Res-Am&AFU SSD (SSD with Res-Am CNN and AFU) 网络在VOC测试集上的平均精度均值(mean Average Precision,mAP) 达到69.1%,在精度上领先单阶网络,接近双阶网络,在检测速度上远快于双阶网络。在小目标测试集上的实验结果表明,Res-Am&AFU SSD网络的mAP为67.2%,比原始SSD提高了9.4%,且该方法具有更加灵活、无需预训练等优点。
人工智能
跨领域文本的可迁移情绪分析方法
张舒萌, 余增, 李天瑞
计算机科学. 2022, 49 (3): 218-224.  doi:10.11896/jsjkx.210400034
摘要 ( 377 )   PDF(1662KB) ( 989 )   
参考文献 | 相关文章 | 多维度评价
随着移动互联网的迅猛发展,社交网络平台充斥着大量带有情绪色彩的文本数据,对此类文本中的情绪进行分析研究不仅有助于了解网民的态度和情感,而且对科研机构和政府掌握社会的情绪变化及走向有着重要作用。传统的情感分析主要对情感倾向进行分析,无法精确、多维度地描述出文本的情绪,为了解决这个问题,文中对文本的情绪分析进行研究。首先针对不同领域文本数据集中情绪标签缺乏的问题,提出了一个基于深度学习的可迁移情绪分类的情感分析模型FMRo-BLA,该模型对通用领域文本进行预训练,然后通过基于参数的迁移学习、特征融合和FGM对抗学习,将预训练模型应用于特定领域的下游情感分析任务中,最后在微博的公开数据集上进行对比实验。结果表明,该方法相比于目前性能最好的RoBERTa预训练语言模型,在目标领域数据集上F1值有5.93%的提升,进一步加入迁移学习后F1值有12.38%的提升。
基于变分贝叶斯的纤维丛元学习算法
刘洋, 李凡长
计算机科学. 2022, 49 (3): 225-231.  doi:10.11896/jsjkx.201100111
摘要 ( 491 )   PDF(2368KB) ( 710 )   
参考文献 | 相关文章 | 多维度评价
以神经网络为基础的深度学习在大量领域取得优异成果,但其难以处理相似或未经训练的任务。深度学习在对新任务的学习和适应过程中存在困难,且对训练样本规模要求很高,造成泛化性和扩展性不佳的问题。元学习是一种新的学习框架,旨在解决传统学习方法难以解决的快速学习和适应新任务的问题。针对图像分类的元学习问题,文中提出了一种基于贝叶斯理论的纤维丛元学习算法(Fiber Bundle Meta-learning Algorithm,FBBML)。首先通过卷积神经网络提取支持数据集的图片信息,以得到图片的表示。然后构建数据特征的流形结构和数据特征到标签的纤维丛。最后输入查询集选取当前新任务的流形截面,从而获得适合新任务的纤维,得到图片的正确标签。实验结果表明,基于所提算法实现的模型(FBBML)在公共数据集(mini-ImageNet)上相比标准四层卷积神经网络的模型取得了最佳的准确率性能。同时将纤维丛理论引入元学习,使得算法本身具备更高的可解释性。
一种会话理解模型的问题生成方法
时雨涛, 孙晓
计算机科学. 2022, 49 (3): 232-238.  doi:10.11896/jsjkx.210200153
摘要 ( 650 )   PDF(2328KB) ( 697 )   
参考文献 | 相关文章 | 多维度评价
会话问题生成(Conversational Question Generation,CQG)不同于根据段落和答案生成单轮问题的问题生成任务,CQG额外考虑由历史问答对构成的会话信息,生成的问题承接会话历史内容,保持较高的一致性。针对这一特性,文中提出了字级别和句级别注意力机制模块来增强对会话历史信息的提取能力,确保当前轮次的问题融合会话历史中每个词和句子的特征,从而生成连贯的、高质量的问题。疑问词的正确性较重要,生成的问题需要和数据集中原始问题对应的答案类型相互匹配,在疑问词预测模块中构造额外的损失函数作为疑问词类型的限制。综合各个模块得到会话理解模型(Conversational Comprehension Network,CCNet),实验结果表明,该模型在大部分评测指标上高于基线模型,在CoQA数据集上Bleu1和Bleu2分别达到39.70和23.76,生成的问题质量更高。在消融实验和跨数据集实验中该模型被证明是有效的,说明CCNet模型具有较强的通用能力。
基于逐次超松弛技术的Double Speedy Q-Learning算法
周琴, 罗飞, 丁炜超, 顾春华, 郑帅
计算机科学. 2022, 49 (3): 239-245.  doi:10.11896/jsjkx.201200173
摘要 ( 383 )   PDF(1770KB) ( 563 )   
参考文献 | 相关文章 | 多维度评价
Q-Learning是目前一种主流的强化学习算法,但其在随机环境中收敛速度不佳,之前的研究针对Speedy Q-Learning存在的过估计问题进行改进,提出了Double Speedy Q-Learning算法。但Double Speedy Q-Learning算法并未考虑随机环境中存在的自循环结构,即代理执行动作时,存在进入当前状态的概率,这将不利于代理在随机环境中学习,从而影响算法的收敛速度。针对Double Speedy Q-Learning中存在的自循环结构,利用逐次超松弛技术对Double Speedy Q-Learning算法的Bellman算子进行改进,提出基于逐次超松弛技术的Double Speedy Q-Learning算法(Double Speedy Q-Learning based on Successive Over Relaxation,DSQL-SOR),进一步提升了 Double Speedy Q-Learning算法的收敛速度。通过数值实验将DSQL-SOR与其他算法的实际奖励和期望奖励之间的误差进行对比,实验结果表明,所提算法比现有主流的算法SQL的误差低0.6,比逐次超松弛算法GSQL低0.5,这表明DSQL-SOR算法的性能较其他算法更优。实验同时对DSQL-SOR算法的可拓展性进行测试,当状态空间从10增加到1 000时,每次迭代的平均时间增长缓慢,始终维持在10-4数量级上,表明DSQL-SOR的可拓展性较强。
融合双重权重机制和图卷积神经网络的微博细粒度情感分类
李浩, 张兰, 杨兵, 杨海潇, 寇勇奇, 王飞, 康雁
计算机科学. 2022, 49 (3): 246-254.  doi:10.11896/jsjkx.201200073
摘要 ( 614 )   PDF(2706KB) ( 634 )   
参考文献 | 相关文章 | 多维度评价
利用深度学习模型和注意力机制对微博文本进行细粒度情感分类,已成为研究的热点,但是现有注意力机制只考虑单词对单词的影响,对单词本身的多种维度特性(如词义、词性、语义等特征信息)缺乏有效的融合。为了解决这个问题,文中提出了一种双重权重机制WDWM(Word and Dimension Weight Mechanism),并将其与基于解析依赖树的GCN模型相结合,通过选择每条微博中含有关键信息的单词,来抽取单词的重要维度特性,对单词的多种维度特性进行有效融合,从而捕获更加丰富的特征信息。在针对微博细粒度情感分类的实验中,融合双重权重机制和图卷积神经网络的微博细粒度情感分类模型(WDWM-GCN)的F测度达到了84.02%,比2020年提出的最新的算法高出1.7%,这进一步证明,WDWM-GCN能对单词的多维度特性进行有效的融合,能够捕获丰富的特征信息。在对搜狗新闻数据集进行分类的实验中,BERT模型在加入WDWM后,其分类效果得到了进一步提升,这充分证明 WDWM对所提分类模型有明显的改进效果。
带标记的不完备双论域模糊概率粗糙集中近似集动态更新方法
薛占熬, 侯昊东, 孙冰心, 姚守倩
计算机科学. 2022, 49 (3): 255-262.  doi:10.11896/jsjkx.201200042
摘要 ( 284 )   PDF(2198KB) ( 466 )   
参考文献 | 相关文章 | 多维度评价
当不完备双论域模糊概率粗糙集获取缺省值时,传统的静态算法更新近似集的时间效率较低,为了解决这个问题,对带标记不完备双论域模糊概率粗糙集的近似集动态更新方法进行了研究。首先,给出了带标记的不完备双论域信息系统的相关定义,运用矩阵提出了带标记的不完备双论域模糊概率粗糙集的模型,证明了其相关定理,给出了一种带标记的不完备双论域模糊概率粗糙集的近似集计算方法,并对其进行了讨论分析。其次,当不完备双论域模糊概率粗糙集获取缺省值时,给出了动态更新其近似集的相关定理,并进行了证明,进而设计了一种带标记的不完备双论域模糊概率粗糙集中近似集动态更新算法,并分析讨论了其算法复杂度。最后,在6个UCI数据集和3个人工数据集上进行仿真实验,实验结果表明,该动态更新算法提高了更新近似集的时间效率,并结合实例证明了该动态算法更新近似集时不影响结果的正确性,验证了该动态更新算法的有效性。
广义粗糙近似算子的拓扑性质
李妍妍, 秦克云
计算机科学. 2022, 49 (3): 263-268.  doi:10.11896/jsjkx.210100204
摘要 ( 711 )   PDF(1388KB) ( 603 )   
参考文献 | 相关文章 | 多维度评价
粗糙集理论是一种处理不确定性问题的数学工具。粗糙近似算子是粗糙集理论中的核心概念,基于等价关系的Pawlak粗糙近似算子可以推广为基于一般二元关系的广义粗糙近似算子。近似算子的拓扑结构是粗糙集理论的重点研究方向。文中主要研究基于一般二元关系的广义粗糙近似算子诱导拓扑的性质,给出了基于粒和基于子系统的广义粗糙近似算子诱导的4种拓扑,研究了它们之间的关系;通过对象的右邻域系统给出了基于粒的广义近似算子诱导的拓扑的基,研究了相应拓扑的正规性与正则性;通过分析基于子系统的广义上近似算子的性质,证明了基于子系统的广义上近似算子诱导的拓扑可以转化为基于对象的广义下近似算子诱导的拓扑。
基于A-DLSTM夹层网络结构的电能消耗预测方法
高堰泸, 徐圆, 朱群雄
计算机科学. 2022, 49 (3): 269-275.  doi:10.11896/jsjkx.210100006
摘要 ( 322 )   PDF(2825KB) ( 573 )   
参考文献 | 相关文章 | 多维度评价
全球人口的快速增长和技术进步极大地提高了世界的总发电量,电能消耗预测对于电力系统调度和发电量管理发挥着重要的作用,为了提高电能消耗的预测精度,针对能耗数据的复杂时序特性,文中提出了一种将注意力机制(Attention)放置于双层长短期记忆人工神经网络(Double layer Long Short-Term Memory,DLSTM)中的新颖夹层结构,即A-DLSTM。该网络结构利用夹层中的注意力机制自适应地关注单个时间单元中不同的特征量,通过双层LSTM网络对序列中的时间信息进行抓取,以对序列数据进行预测。文中的实验数据为UCI机器学习数据集上某家庭近5年的用电量,采用网格搜索法进行调参,实验对比了A-DLSTM与现有的模型在能耗数据上的预测性能,文中的网络结构在均方误差、均方根误差、平均绝对误差、平均绝对百分比误差上均达到了最优,且通过热力图对注意力层进行了分析,确定了对用电量预测影响最大的因素。
基于事件动作方向的隐式因果关系抽取方法
缪峰, 王萍, 李太勇
计算机科学. 2022, 49 (3): 276-280.  doi:10.11896/jsjkx.211100249
摘要 ( 537 )   PDF(722KB) ( 853 )   
参考文献 | 相关文章 | 多维度评价
抽取事件之间的因果关系能够应用于自动问答、知识提取、常识推理等方面。隐式因果关系由于缺乏明显的词汇特征和中文复杂的句法结构,使得其抽取极为困难,已成为当前研究的难点。相比而言,显示因果关系的抽取比较容易、准确率高,且因果关系事件之间的逻辑关系稳定。为此,文中提出了一种原创的方法,首先通过对抽取的显示因果事件对进行事件动作的归一化处理后形成事件方向,然后对事件主体进行泛化处理,最终形成标准的匹配因果事件对集合。利用此集合根据事件相似度从语句中抽取隐式因果事件对。为了识别更多的隐式因果关系,文中同时提出了一种因果连接词发现算法。在网易财经、腾讯财经和新浪财经上爬取的实验数据验证,对事件动作进行归一化处理后形成事件方向相比传统方法抽取准确率提高了1.02%。
FMNN:融合多神经网络的文本分类模型
邓维斌, 朱坤, 李云波, 胡峰
计算机科学. 2022, 49 (3): 281-287.  doi:10.11896/jsjkx.210200090
摘要 ( 654 )   PDF(2193KB) ( 922 )   
参考文献 | 相关文章 | 多维度评价
文本分类是自然语言处理中一项基本且重要的任务。基于深度学习的文本分类方法大多只针对单一的模型结构进行深入研究,这种单一的结构缺乏同时捕获并利用全局语义特征与局部语义特征的能力,且网络的加深会损失更多的语义信息。对此,提出了一种融合多神经网络的文本分类模型FMNN(A Text Classification Model Fused with Multiple Neural Network),FMNN在最大限度减小网络深度的同时,融合了BERT,RNN,CNN和Attention等神经网络模型的特性。用BERT作为嵌入层获得文本的矩阵表示,用BiLSTM和Attention联合提取文本的全局语义特征,用CNN提取文本多个粒度下的局部语义特征,将全局语义特征和局部语义特征分别作用于softmax分类器,最后采用算术平均的方式对结果进行融合。在3个公开数据集和1个司法数据集上的实验结果表明,FMNN模型实现了更高的文本分类准确率,其中在司法数据集上的准确率达到了90.31%,证明了该模型具有较好的实用价值。
基于混合样本自动数据增强技术的半监督学习方法
许华杰, 陈育, 杨洋, 秦远卓
计算机科学. 2022, 49 (3): 288-293.  doi:10.11896/jsjkx.210100156
摘要 ( 418 )   PDF(1659KB) ( 1294 )   
参考文献 | 相关文章 | 多维度评价
基于一致性的半监督学习方法通常使用简单的数据增强方法来实现对原始输入和扰动输入的一致性预测。在有标签数据的比例较低的情况下,该方法的效果难以得到保证。将监督学习中一些先进的数据增强方法扩展到半监督学习环境中,是解决该问题的思路之一。基于一致性的半监督学习方法MixMatch,提出了基于混合样本自动数据增强技术的半监督学习方法AutoMixMatch,在数据增强阶段采用自动数据增强技术,并在样本混合阶段提出了一种混合样本算法,用于提升对无标签样本的利用效果。通过图像分类方面的实验来测试所提方法的性能,在图像分类基准数据集中,所提方法在3种有标签样本比例下的分类效果均优于对比的几个主流半监督分类方法,验证了所提方法的有效性。此外,所提方法在有标签数据占训练数据比例极低(仅为0.05%)的情况下表现更好,在SVHN数据集上的实验结果表明,所提方法的分类错误率比MixMatch低30.17%。
基于交互注意力图卷积网络的方面情感分类
潘志豪, 曾碧, 廖文雄, 魏鹏飞, 文松
计算机科学. 2022, 49 (3): 294-300.  doi:10.11896/jsjkx.210100180
摘要 ( 573 )   PDF(2149KB) ( 831 )   
参考文献 | 相关文章 | 多维度评价
基于方面的情感分类任务旨在识别句子中给定方面词的情感倾向性。以往的方法大多基于长短时记忆网络和注意力机制,这种做法在很大程度上仅依赖于建模句子中的方面词与其上下文的语义相关性,但忽略了句中的语法信息。针对这种缺陷,提出了一种交互注意力的图卷积网络,同时建模了句中单词的语义相关性和语法相关性。首先使用双向长短时记忆网络来学习句子的词序关系,捕捉句中上下文的语义信息;其次引入位置信息后,通过图卷积网络来学习句中的语法信息;然后通过一种掩码机制提取方面词;最后使用交互注意力机制,交互计算特定方面的上下文表示,并将其作为最后的分类特征。通过这种优势互补的设计,该模型可以很好地获得聚合了目标方面信息的上下文表示,并有助于情感分类。实验结果表明,该模型在多个数据集上都获得了优秀的效果。与未考虑语法信息的Bi-IAN模型相比,该模型在所有数据集上的结果均优于Bi-IAN模型,尤其在餐厅领域的REST14,REST15和REST16数据集上,该模型的F1值较Bi-IAN模型分别提高了4.17%,7.98%和8.03%;与同样考虑了语义信息和语法信息的ASGCN模型相比,该模型的F1值在除了LAP14数据集外的其他数据集上均优于ASGCN模型,尤其在餐厅领域的REST14,REST15和REST16数据集上,该模型的F1值较ASGCN模型分别提高了2.05%,1.66%和2.77%。
信息安全
基于DTMC的工业串行协议状态检测算法
刘凯祥, 谢永芳, 陈新, 吕飞, 刘俊矫
计算机科学. 2022, 49 (3): 301-307.  doi:10.11896/jsjkx.210200078
摘要 ( 327 )   PDF(1968KB) ( 517 )   
参考文献 | 相关文章 | 多维度评价
针对现有工业信息安全研究主要集中在工业以太网方面,缺少对串行链路协议防护的研究等问题,提出一种基于离散时间马尔可夫链(Discrete Time Markov Chain,DTMC)的工业串行协议状态检测算法。该算法利用工业控制系统(Industrial Control System,ICS)行为有限和状态有限的特征,根据串行链路协议历史流量数据,自动构建ICS正常行为模型——DTMC。模型包含状态事件、状态转移、状态转移概率和状态转移时间间隔等行为信息,使用该模型所包含的状态信息作为状态检测规则集。当检测阶段生成的状态信息与状态检测规则集中的信息不同或偏差超过阈值时,产生告警或拒绝等动作。同时,结合综合包检测(Comprehensive Packet Inspection,CPI)技术来扩大协议载荷数据的可检测范围。实验结果表明,所提算法能有效检测语义攻击,保护串行链路安全,且算法误报率为5.3%,漏报率为0.6%。
基于注意力机制的用户轨迹识别模型
李昊, 曹书瑜, 陈亚青, 张敏
计算机科学. 2022, 49 (3): 308-312.  doi:10.11896/jsjkx.210300231
摘要 ( 621 )   PDF(1809KB) ( 953 )   
参考文献 | 相关文章 | 多维度评价
近年来,基于位置服务的应用逐渐开始普及,它在为人们生活提供便利的同时,也对个人隐私造成了巨大威胁。现有研究表明,在具备大量历史轨迹数据的情况下,攻击者能够从匿名化的轨迹数据集中识别出用户身份与轨迹的链接关系。然而,这些相关研究都面临着数据稀疏和数据质量差这两方面的问题。数据稀疏指用户的轨迹往往只分布在局部区域,同时缺乏与自然语言处理领域一样规模庞大的语料库;数据质量差指轨迹中的位置点往往存在采样率低和噪音大的问题。针对上述问题,文中提出了一种基于注意力机制的用户轨迹识别模型,包括位置嵌入模块、基于注意力的位置转移特征编码模块和轨迹用户识别模块。位置嵌入模块用于将原始轨迹中位置点的空间关系嵌入到位置向量中;基于注意力的位置转移特征编码模块用于提取轨迹中位置点间的转移依赖关系,生成轨迹的表征向量;轨迹用户识别模块用于对轨迹表征向量的用户身份进行预测。最后,在Gowalla和Geolife数据集上进行了实验验证,实验结果表明,所提方案有效缓解了轨迹数据稀疏和数据质量差带来的问题,能够提高轨迹的用户身份识别率。
云环境下基于属性的多关键字可搜索加密方案
高诗尧, 陈燕俐, 许玉岚
计算机科学. 2022, 49 (3): 313-321.  doi:10.11896/jsjkx.201100214
摘要 ( 700 )   PDF(2038KB) ( 1156 )   
参考文献 | 相关文章 | 多维度评价
可搜索加密技术可在不解密数据密文的同时实现密文关键字的检索,很好地保护了数据存储方的隐私。针对目前大多数可搜索加密方案无法支持用户自定义搜索策略的问题,提出了一种安全、高效、可支持任意表达的基于属性可搜索加密方案。该方案首先基于LSSS搜索结构,支持任意合取、析取或单调布尔表达式的多关键字搜索策略,用户使用私钥为LSSS搜索策略生成陷门,云服务器通过陷门可以搜索包含满足特定关键字搜索策略的密文;其次,通过与基于属性加密方案结合,可以实现对云中加密数据的细粒度访问控制;另外,该方案通过将关键字拆分成关键字名和关键字值以及“线性拆分”技术,使得攻击者无法从密文和陷门中推测出关键字值敏感信息;最后,通过将部分解密工作转移到云服务器来降低用户的计算负担。基于DBDH、(q-2)和判定线性假设证明了所提方案的安全性,理论分析和实验结果也表明了该方案的有效性。
混沌子载波调制的无人机安全数据链路
赵耿, 宋鑫宇, 马英杰
计算机科学. 2022, 49 (3): 322-328.  doi:10.11896/jsjkx.210200022
摘要 ( 308 )   PDF(4572KB) ( 542 )   
参考文献 | 相关文章 | 多维度评价
电子与通信等技术的快速发展使得以此为技术支撑的无人机得到了学术界与工业界的广泛关注。为了适应日益复杂的任务和应用领域,无人机安全数据链路成为推进无人机发展的重要因素。围绕无人机数据链路的安全问题,文中首先讨论了正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术的高频谱利用率、抗多径衰落能力等一系列优点,并阐述了其在无人机数据链路中的应用;然后,结合混沌系统具有的长期不可预测特性,提出了一种混沌子载波调制(Chaotic Sub-Carrier Modulation,CSCM)方案,其利用量化分组的混沌序列完成对数据的混沌串并转换及混沌扰乱过程,进而实现无人机数据的加密传输和数据来源可靠性的判断;最后,采用MATLAB对所提方案进行仿真,验证了该方案的可行性和有效性。
适用于物联网环境的无证书广义签密方案
张振超, 刘亚丽, 殷新春
计算机科学. 2022, 49 (3): 329-337.  doi:10.11896/jsjkx.201200256
摘要 ( 583 )   PDF(2039KB) ( 530 )   
参考文献 | 相关文章 | 多维度评价
证书广义签密方案不仅可以解决证书管理和密钥托管问题,而且可以根据实际需求分别作为加密方案、签名方案或签密方案,在资源受限的物联网环境中具有广泛的应用场景。但是,通过具体的攻击方法证明Karati等的方案不能抵抗伪造攻击,文中总结了攻击者成功伪造的原因。针对上述问题,提出了一种无双线性配对的无证书广义签密方案,并在随机预言模型下基于计算性Diffie-Hellman问题和离散对数问题对该方案进行了安全性证明。性能评估结果表明,与现有方案相比,该方案在计算代价及通信开销方面具有优势,适用于资源受限的物联网设备之间数据的安全传输。
基于同态加密的线性系统求解方案
吕由, 吴文渊
计算机科学. 2022, 49 (3): 338-345.  doi:10.11896/jsjkx.201200124
摘要 ( 550 )   PDF(1546KB) ( 829 )   
参考文献 | 相关文章 | 多维度评价
在科学计算、统计分析以及机器学习领域,许多实际问题都可以归结到线性系统Ax=b的求解,如最小二乘估计和机器学习中的回归分析等。而实际中用于计算的数据往往由不同用户拥有且包含用户的敏感信息。当不同的数据拥有者想在合作求解一个模型的同时保护数据的隐私,同态加密可以作为解决方法之一。针对两个用户参与的场景,基于Cheon等提出的HEAAN同态加密技术,设计了一种两方参与、利用Gram-Schmidt正交化方法安全求解线性系统Ax=b的新方案;提出了一种适用于该场景的交互式安全乘法逆协议,解决了同态加密无法高效计算除法的问题,保证在高效计算的同时保护数据的隐私信息;分析了方案的安全性、通信损耗以及计算复杂度;基于HEAAN同态加密库,利用C++实现了该方案;最后通过大量的实验证明,该方案可以安全高效地求解维度不超过17的线性系统,与在明文数据上的计算结果相比,相对误差不超过0.000 1;针对该方案设计的平行编码方法,可以通过SIMD技术并行求解多个线性系统,拓宽了方案的可用性,基本满足特定场景下的实际应用需求,可进一步用于隐私保护数据挖掘算法的设计。
面向金融活动的复合区块链关联事件溯源方法
李素, 宋宝燕, 李冬, 王俊陆
计算机科学. 2022, 49 (3): 346-353.  doi:10.11896/jsjkx.210700068
摘要 ( 380 )   PDF(2320KB) ( 637 )   
参考文献 | 相关文章 | 多维度评价
现有区块链系统多采用平等挖矿模式,所有记账人(实体)将账本记录在单一主链上,数据存储具有随机性,且在复杂或分类金融场景下,主链数据难以关联或规律存储,导致存储及查询效率很低;同时,现有区块链系统中事件溯源大多只查询到源区块,不能判识实体间的隐含关联,查询具有局限性。针对这些问题,提出一种复合区块链关联事件溯源方法。该方法首先构建区块链复合链式存储结构模型,提出私有链和联盟链的概念,实现复杂或分类场景下的自适应数据关联存储;然后,追溯查询时,在获取到事件源实体区块的基础上,建立辅助存储空间,以便对相关数据进行转存,并提出基于Apriori算法的关联实体区块溯源方法,将所得的溯源实体区块用于构造源事件关联图,进而描述事件实体间的关联关系;最后,提出基于强化学习的风险评价体系,实现对溯源实体的风险评估。实验结果表明,复合区块链关联事件溯源方法可降低60%的存储开销,查询准确率和安全性分别提升90%和50%。
面向个性化需求的云制造服务可信评价模型
杨玉丽, 李宇航, 邓岸华
计算机科学. 2022, 49 (3): 354-359.  doi:10.11896/jsjkx.210200116
摘要 ( 293 )   PDF(1540KB) ( 704 )   
参考文献 | 相关文章 | 多维度评价
针对传统的云制造服务可信评价模型中存在的可扩展性弱、难以满足个性化需求等问题,提出一种可扩展性强、可以较好地满足个性化需求的可信评价模型。首先构建多层次的、多粒度的云制造服务可信评价框架;然后基于此框架,提出了基于云模型的云制造服务可信评价方法,在该方法中,引入云模型理论,用于统一表征不同类型的评价指标,以及描述用户的个性化需求,采用标准离差法计算不同评价指标的权重系数;最后通过应用案例检测所提方法的有效性,并通过时间开销的对比实验验证该方法的可行性。实验结果表明,与传统的方法相比,该模型在合理的时间开销范围内,可以根据用户的个性化需求,对不同的云制造服务提供方进行更为准确的可信评价,进而帮助用户选择满意度更高的云制造服务。
基于演化博弈的理性拜占庭容错共识算法
杨昕宇, 彭长根, 杨辉, 丁红发
计算机科学. 2022, 49 (3): 360-370.  doi:10.11896/jsjkx.210900110
摘要 ( 726 )   PDF(2602KB) ( 910 )   
参考文献 | 相关文章 | 多维度评价
拜占庭容错算法(byzantine fault-tolerant)是保证区块链等分布式系统能够达成一致性的重要算法,其性能影响着系统的安全性和稳定性。针对现有共识算法存在效率低下和缺少激励机制等问题,提出了一种基于演化博弈的理性实用拜占庭容错共识算法。首先,通过引入信誉机制来确定节点在共识过程中的可信任度,以信誉值为理性节点共识积极性的依据,基于信誉对共识节点进行划分,采用节点网络分片化的共识方式来提升共识效率;其次,针对共识过程中节点之间链路动态性对信誉值产生的影响建立演化博弈模型,并分析证明信誉稳定策略的存在性,设计基于信誉稳定策略的激励机制,以提升共识节点参与共识的积极性。实验结果表明,所提共识算法可提升40%的吞吐量,且在共识过程中对节点所设计的信誉演化博弈模型有快速收敛的效果。