1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2019年第7期, 刊出日期:2019-07-15
  
综述
互联网域内路由可用性综述
耿海军,张爽,尹霞
计算机科学. 2019, 46 (7): 1-6.  doi:10.11896/j.issn.1002-137X.2019.07.001
摘要 ( 464 )   PDF(1317KB) ( 689 )   
参考文献 | 相关文章 | 多维度评价
路由可用性是指用户能够得到所请求服务的概率。随着互联网的发展,大量实时业务涌现,对网络实时性的要求也越来越高,对互联网的“自我修复能力”也提出了很高的要求。网络故障频繁发生,在修复网络故障的过程中可能会发生路由环路和收敛时间过长等问题,而且修复故障的时间一般在几秒到几十秒之间,已经无法满足实时应用对目前互联网的可用性需求。因此,提高路由可用性已经成为目前亟需解决的问题。文中总结和分析了目前已有的提高路由可用性的方案,并将这些方案主要分为被动恢复方案和路由保护方案两大类;详细介绍了目前国内外的科研成果,对比了各方案的优缺点,总结分析了这些方案的主要贡献及不足,并探讨了进一步的研究方向。
基于深度学习的机器阅读理解综述
李舟军,王昌宝
计算机科学. 2019, 46 (7): 7-12.  doi:10.11896/j.issn.1002-137X.2019.07.002
摘要 ( 600 )   PDF(1292KB) ( 1643 )   
参考文献 | 相关文章 | 多维度评价
阅读理解能力是人类智能中最关键的能力之一,而机器阅读理解作为自然语言处理领域皇冠上的明珠,一直是该领域的研究焦点。近年来,随着深度学习方法的快速发展,机器阅读理解技术获得了长足的进步。首先,对基于深度学习的机器阅读理解技术的研究背景和发展历史进行了概述;然后,详细介绍了词向量、注意力机制以及答案预测这三大关键技术的研究进展;在此基础上,分析了目前机器阅读理解研究所面临的问题;最后,对机器阅读理解技术的未来发展趋势进行了展望。
风格线条画生成技术综述
刘子奇, 刘世光
计算机科学. 2019, 46 (7): 13-21.  doi:10.11896/j.issn.1002-137X.2019.07.003
摘要 ( 597 )   PDF(2570KB) ( 1049 )   
参考文献 | 相关文章 | 多维度评价
线条画作为一种简单而有效的视觉传达手段,通过突出主要的细节特征,使得人们可以快速地获得主要信息;同时,风格线条画作为一种艺术形式,让人们能够快速欣赏和理解其艺术特征。文中对线条画的生成方法进行了综述与分析。线条画生成技术可以分为基于2D图像的方法与基于3D模型的方法。其中,基于2D图像的线条画生成技术包括样本学习方法、非样本学习的数据驱动方法与非数据驱动方法;基于3D模型的线条画生成技术包括图像空间方法、对象空间方法以及两者的混合方法。通过介绍与分析各种方法并对比分析其优缺点,总结了线条画生成技术现阶段存在的问题及其可能的解决方案,并在此基础上对线条画生成的未来发展趋势进行了展望。
帕金森震颤与原发性震颤的计算机辅助诊断方法综述
张雨倩,顾冬云
计算机科学. 2019, 46 (7): 22-29.  doi:10.11896/j.issn.1002-137X.2019.07.004
摘要 ( 252 )   PDF(1489KB) ( 494 )   
参考文献 | 相关文章 | 多维度评价
帕金森型震颤和原发性震颤的诊断一直是临床上的难题,而正确的诊断和用药对病人的治疗和康复尤为重要。随着传感器和人工智能技术的发展,越来越多的学者开始利用新的研究成果对两种疾病进行辅助诊断,并取得了良好的效果。文中总结了目前用于两种疾病诊断的可穿戴设备及其涉及到的相关分类算法,并讨论其优点和局限性;最后分析两种震颤辅助诊断研究当前存在的主要问题,并展望了未来可能的研究方向。
目标形状表达算法综述
吴刚,徐利敏
计算机科学. 2019, 46 (7): 30-37.  doi:10.11896/j.issn.1002-137X.2019.07.005
摘要 ( 259 )   PDF(1318KB) ( 402 )   
参考文献 | 相关文章 | 多维度评价
形状的检索和识别在医疗诊断、目标识别、图像检索和计算机视觉等领域都有重要应用,而高效的形状检索和识别取决于形状表达算法的优劣。给出了形状表达优劣的一般判断标准,对目前的主要形状表达方法进行分类,包括线性组合表达、空间关联关系表达、基于微分和积分的特征表达,以及变形表达等方法。对每一类方法,从使用的数学模型、多分辨率表达能力、不变量、鲁棒性、形状重构、信号噪声分辨性能等方面进行分析和综合评价,指出这些表达方法的优劣,尤其是就这些算法的数学机理进行分析探讨,并给出了未来需要进一步研究的方向和思路。
面向展示广告的点击率预测模型综述
刘梦娟,曾贵川,岳威,仇笠舟,王加昌
计算机科学. 2019, 46 (7): 38-49.  doi:10.11896/j.issn.1002-137X.2019.07.006
摘要 ( 281 )   PDF(3900KB) ( 855 )   
参考文献 | 相关文章 | 多维度评价
点击率预测模型的研究近年来备受学术界和工业界的关注。针对展示广告定向投放的点击率预测模型,研究了样本特征的预处理技术、基于传统机器学习模型的CTR预测方案、基于最新的深度学习模型的CTR预测方案、CTR预测模型的主要性能评价指标等,并基于一个开放数据集对其中的典型方案给出性能对比和量化分析,最后讨论了目前面向展示广告的点击率预测模型研究存在的问题和未来发展趋势。
网络与通信
一种内容中心型车载社交网络路由机制
石峻岭,王兴伟,黄敏
计算机科学. 2019, 46 (7): 50-55.  doi:10.11896/j.issn.1002-137X.2019.07.007
摘要 ( 192 )   PDF(1954KB) ( 271 )   
参考文献 | 相关文章 | 多维度评价
为满足车载社交网络(Vehicular Social Network,VSN)中用户对视频等多媒体内容的需求,基于内容中心网络(Information-Centric Networking,ICN)架构,提出一种内容中心型VSN路由机制(Content-centric routing scheme in VSN,CVSN)。在CVSN中,兴趣路由根据车辆节点的相似内容存储选择兴趣包转发节点;数据路由根据车辆节点间的同行率选择数据包转发节点。同时,基于VSN用户的兴趣偏好进行内容的网络内缓存管理,在缓存达到上限时,首先丢弃用户兴趣偏好低的内容。基于公交车应用场景对所提出的路由机制进行了仿真实验,通过与现有机制在包交付率、平均延迟、平均跳数和网络开销方面的性能对比表明了文中提出的机制是可行且有效的。
基于分层多跳物理层网络编码的超密集网络吞吐量增强方法
冀保峰, 王一丹, 邢冰冰, 李玉琦, 高宏峰, 韩瑽琤
计算机科学. 2019, 46 (7): 56-60.  doi:10.11896/j.issn.1002-137X.2019.07.008
摘要 ( 191 )   PDF(1982KB) ( 308 )   
参考文献 | 相关文章 | 多维度评价
超密集网络通过小小区的密集部署提升了空间的复用增益,成为解决未来5 G数据流量1 000倍及用户体验速率10~100倍提升的有效方案。然而,小小区密集部署带来的干扰问题以及小基站的较小覆盖范围导致的信号衰落,会减小网络容量并降低用户体验。为了同时考虑未来5G超密集组网“覆盖”和“容量”的问题,提出了基于分层多跳物理层网络编码的吞吐量增强方法。该方法利用超密集网络多节点的异构分层特征,结合多跳物理层网络编码的高频谱效率特性,在无需源节点和终端节点直达链路的情况下,有效提升了超密集网络的吞吐量,节省了源到终端节点的时隙开销,且降低了系统的干扰。最后,通过仿真验证了所提方案的有效性和正确性,相比传统方案有效提升了系统性能。
LTE-A网络下能源高效的M2M上行子载波和功率分配问题研究
何英庆,李宁,王聪,陈彦成,徐键卉
计算机科学. 2019, 46 (7): 61-66.  doi:10.11896/j.issn.1002-137X.2019.07.009
摘要 ( 158 )   PDF(2100KB) ( 274 )   
参考文献 | 相关文章 | 多维度评价
在M2M通信中,提高设备的能源效率、延长设备的电池使用寿命是一个关键问题。文中研究了LTE-A网络中M2M上行通信的联合子载波和功率分配的能源效率问题,在保证M2M设备的基本传输时延以及LTE-A上行资源分配约束的前提下,得到资源分配的优化问题;由于直接求解该问题的计算复杂度相当高,因此文中进一步提出一种基于拉格朗日乘数法的子载波和功率分配算法,该算法在降低计算复杂度的同时,能够获得更低的功率消耗以及更高的能源效率。仿真结果表明,所提算法在功率消耗和能源效率方面更接近最优算法。
免声速迭代式TDOA测向研究
侯东升,汪海,崔逊学
计算机科学. 2019, 46 (7): 67-73.  doi:10.11896/j.issn.1002-137X.2019.07.010
摘要 ( 134 )   PDF(2294KB) ( 310 )   
参考文献 | 相关文章 | 多维度评价
针对到达时间差的声源测向问题,如果能够知道声源现场的速度参量,结合线性最小二乘法(Linear Least Squares,LLS)的波达方向(Direction of Arrival,DOA)的估计结果,则可以采用基于最大似然原理的迭代式算法进行求解。但在某些环境下,声信号传播的速度参量无法获得,或测量偏差较大,势必会影响DOA的估计精度。根据LLS无需声速的特点,以及基于最大似然原理的迭代式算法可直接求解声源方位角与俯仰角的特点,文中提出免声速迭代式模型,并采用泰勒级数展开法以及莱温伯格-马夸特法进行求解,该方法无需预先知道声音信号的速度参量。另外,文中推导了泰勒级数展开法、莱温伯格-马夸特法的测向均方差以及免声速迭代式模型的克拉姆-拉奥下界。模拟实验结果表明,在存在声速测量误差的情况下,所提方法明显优于现有方法。
城市车辆自组织网络中基于预测的地理位置路由协议
黄德玲,严余松,彭大芹
计算机科学. 2019, 46 (7): 74-80.  doi:10.11896/j.issn.1002-137X.2019.07.011
摘要 ( 139 )   PDF(2518KB) ( 311 )   
参考文献 | 相关文章 | 多维度评价
车辆自组织网络的拓扑结构变化迅速,使得节点之间的无线连接不稳定,因此基于贪婪转发的地理位置路由协议经常由于连接断开而失败。针对这个问题,提出一种判断连接可靠性的方法。该方法通过计算每个邻居节点的链路稳定性因子和距离衰减因子等来评估传输连接的可靠性,设计的相应路由协议采用可靠性最高的连接形成路由,从而增加包投递成功率。同时,针对路由环路问题,提出一种预测路口节点的算法,使得数据包能选择性地利用交叉路口协调节点来确定数据传输路径,从而有效避免路由环路,提高转发效率。实验结果表明,提出的算法在包投递成功率、端到端时延和包转发次数等方面都取得了较好的路由性能。
多个体切换网络中带有时延通信的分布式次梯度优化算法
王俊雅,李甲地,李德权
计算机科学. 2019, 46 (7): 81-85.  doi:10.11896/j.issn.1002-137X.2019.07.012
摘要 ( 167 )   PDF(1521KB) ( 216 )   
参考文献 | 相关文章 | 多维度评价
在一般的非平衡有向切换网络中,网络中的个体间可能存在通信时延现象。针对该情况,文中提出了多个体切换网络中带有时延通信的分布式次梯度优化算法。在该算法中,通过对通信网络进行扩维,将存在通信时延的无约束凸优化问题转化为无时延的无约束凸优化问题进行解决。利用非二次李雅普诺夫函数法证明了只要非平衡有向切换网络是周期强连通的以及通信时延有上界,那么基于时延通信的分布式次梯度优化算法就是收敛的。由于集中考虑了网络拓扑与通信时延,该算法更贴合实际情况。最后通过仿真实验验证了算法的有效性。
信息安全
基于递归神经网络的恶意程序检测研究
王乐乐,汪斌强,刘建港,张建辉,苗启广
计算机科学. 2019, 46 (7): 86-90.  doi:10.11896/j.issn.1002-137X.2019.07.013
摘要 ( 170 )   PDF(1320KB) ( 308 )   
参考文献 | 相关文章 | 多维度评价
针对传统恶意程序检测判定效率低及自动分析恶意程序能力不足的问题,在深度学习环境下,研究利用递归神经网络进行恶意程序的检测分类的问题。首先,用快速模拟器(Quick Emulator,QEMU)捕获到恶意程序运行时所调用的API及其参数序列,经过行为抽象,形成恶意程序的特征序列。然后使用对数化的双线性模型(Hierarchical Log-bilinear Language Model,HLBL)将特征序列映射成固定长度的词向量,并将这些词向量合成递归神经网络(Recursive Neural Network,RNN)所需要的输入矩阵。通过对递归神经网络模型的训练,建立恶意程序的多层语义聚合模型,完成对恶意程序的分类检测。实验数据表明,递归神经网络模型在恶意程序检测分类中能够有效地检测出恶意程序,与传统机器学习算法相比,其检测率提高了17%。特别是在引入张量(Tensor)的概念,采用递归张量神经网络(Recursive Neural Tensor Network,RNTN)模型后,通过降低整体的参数数量和计算量,使检测率较RNN模型又提高了7%。实验数据充分说明,采用递归神经网络模型完全可以完成大数据环境下恶意程序的检测分类任务。
抗内部关键词猜测攻击的高效公钥可搜索加密方案
王少辉,张彦轩,王化群,肖甫,王汝传
计算机科学. 2019, 46 (7): 91-95.  doi:10.11896/j.issn.1002-137X.2019.07.014
摘要 ( 271 )   PDF(1278KB) ( 544 )   
参考文献 | 相关文章 | 多维度评价
云环境下,如何对用户加密数据实现高效检索是学术界的研究热点。现有大部分公钥可搜索加密方案不能有效抵御由云服务器发起的内部关键词猜测攻击(Inside Keyword Guessing Attack,IKGA),而抗IKGA方案存在效率不高,以及相同关键词对应搜索陷门相同导致的关键词统计信息泄露等问题。鉴于此,提出了一个新的高效抗IKGA的公钥可搜索加密方案,并基于变形DLIN(Decision Linear Problem)假设,以随机预言机模型证明了新方案满足内部关键词猜测攻击下的语义安全。新方案中,搜索陷门包含随机数且相同关键词的搜索陷门不同。与其他PEKS方案相比,新方案减少了双线性对运算的使用次数,因此具有更大的性能优势。
云存储服务中一种高效属性撤销的AB-ACCS方案
乔毛,秦岭
计算机科学. 2019, 46 (7): 96-101.  doi:10.11896/j.issn.1002-137X.2019.07.015
摘要 ( 226 )   PDF(1574KB) ( 376 )   
参考文献 | 相关文章 | 多维度评价
为了提高云存储访问控制(Access Control for Cloud Storage,ACCS)的安全性、高效性,目前国内外云储存服务技术在身份验证、用户授权、数据完整性和加密手段等方面提供了安全性支持,但只是在通信过程中采用https协议对报文进行加密或者引入第三方代理机构对数据文件重加密,导致在跨域共享中存在数据安全隐患,并且在加密过程中存在计算开销大、效率低的问题。为了解决以上问题,提出了云存储服务中一种高效属性撤销的AB-ACCS(Attributes-Based of Access Control for Cloud Storage)方案。该方案通过一种改进的CP-ABE(Ciphertext Policy Attri-bute Based Encryption))进行访问控制,在不引用第三方代理机构的情况下,云服务提供商(Cloud Storage Provider,CSP)执行密文重加密操作,减少了权威机构和用户的通信负担。同时为了提高该方案在访问控制时的效率,在控制算法上加入新文件创建、新用户授权、属性撤销、文件访问的过程设计,并且结合了懒惰重加密技术,实现了云存储服务中一种高效属性撤销的AB-ACCS方案。实验结果验证了此方案在云存储服务中是有效可行的,并且安全性分析表明其具有向前和向后的双向保密性。
基于认知诊断理论的网络安全自适应测试技术
齐斌,王宇,邹红霞,李冀兴
计算机科学. 2019, 46 (7): 102-107.  doi:10.11896/j.issn.1002-137X.2019.07.016
摘要 ( 165 )   PDF(1350KB) ( 385 )   
参考文献 | 相关文章 | 多维度评价
为进一步研究人员的网络安全素养,准确诊断人员网络安全知识和技能的水平,结合心理测量学和计算机测试技术,开发了基于认知诊断的多级属性评分的自适应测试技术。首先,为更好适应多元化复杂的网络安全知识结构且便于测试模型,在网络安全领域设计了复杂的层级网络安全知识库模型;然后,在多级评分认知诊断模型的基础上引入了属性层级的概念进行综合改进,并提出了准确、高效的参数估计方法和同模型相适应的选题策略。实验结果表明,多级属性评分的网络安全自适应测试技术较传统的多级评分模型提高了10.5%的效率,为计算机自适应测试领域的研究提供了参考。
基于N-Gram的SQL注入检测研究
万卓昊,徐冬冬,梁生,黄保华
计算机科学. 2019, 46 (7): 108-113.  doi:10.11896/j.issn.1002-137X.2019.07.017
摘要 ( 206 )   PDF(1482KB) ( 346 )   
参考文献 | 相关文章 | 多维度评价
SQL注入攻击是Web面临的主要安全威胁,文中针对SQL注入难以检测的问题,提出基于N-Gram的SQL注入检测方法。该方法基于N-Gram将SQL语句转换成固定维数的特征向量,并采用改变不同特征子序列权重的方法改进距离,将改进距离和卡方距离通过BP神经网络计算得到的模糊距离作为向量间的距离标准。首先计算安全SQL语句的平均特征向量,然后计算各SQL语句与平均特征向量的距离以确定距离的阈值,接着将据待测SQL语句与平均特征向量的距离与阈值进行对比,以判断待测SQL语句的安全性。实验结果表明,与直接使用单词构成的特征向量相比,所提方法能有效提高检测率、降低误报率。
云计算下可撤销的全外包CP-ABE方案
江泽涛,黄锦,胡硕,徐智
计算机科学. 2019, 46 (7): 114-119.  doi:10.11896/j.issn.1002-137X.2019.07.018
摘要 ( 333 )   PDF(1381KB) ( 256 )   
参考文献 | 相关文章 | 多维度评价
在属性基加密体制(Attribute-Based Encryptionsystem,ABE)中,用户可以通过自身属性进行信息加密和解密,具有灵活性和安全性,因而该机制被广泛应用于云存储的安全数据共享方案。但标准ABE机制具有繁重的计算开销,限制了ABE加密的实际应用,无法满足数据拥有者可以动态、高效地修改用户访问权限的需求。针对以上问题,文中提出一种支持属性撤销的全外包密文策略属性基加密方案。利用计算外包将密钥生成以及加解密过程中的复杂计算交由云服务器完成,减少密钥生成中心(Key Generation Center,KGC)以及用户的计算开销,通过属性密钥密文更新实现对用户属性的细粒度撤销。最后通过理论分析对所提方案的效率和功能进行评估,结果表明其具有良好的安全性及较高的系统效率。
基于Petri网编码的动态图水印技术研究
苏庆,林昊,黄剑锋,何凡,林志毅
计算机科学. 2019, 46 (7): 120-125.  doi:10.11896/j.issn.1002-137X.2019.07.019
摘要 ( 157 )   PDF(1527KB) ( 218 )   
参考文献 | 相关文章 | 多维度评价
针对动态水印数据嵌入率低的问题,提出一种基于Petri网编码的动态图水印算法。首先,将水印信息进行数列转换,然后将其编码至Petri网的运行状态序列中,最后将生成该Petri网结构的代码嵌入至受保护软件的源代码中。利用Petri网中变迁的发生会产生不同标识的特点,应用同一个Petri网结构表达多个数值,使得该水印编码方案在具有较高的数据嵌入率的同时还具有一定的检错能力,能够成功抵抗包括添加结点、删除部分变迁、删除部分库所和删除部分弧等多种典型的攻击。最后通过实验验证了相关算法的可行性和有效性,并进行了扭曲攻击测试,结果表明基于Petri网编码的动态图软件水印技术具有很强的抗扭曲攻击能力以及鲁棒性。
软件与数据库技术
一种基于程序切片相似度匹配的脆弱性发现方法
刘强,况晓辉,陈华,李响,李广轲
计算机科学. 2019, 46 (7): 126-132.  doi:10.11896/j.issn.1002-137X.2019.07.020
摘要 ( 205 )   PDF(1331KB) ( 574 )   
参考文献 | 相关文章 | 多维度评价
基于脆弱性代码的相似度匹配是静态发现脆弱性的有效方法之一,在不降低漏报率的情况下如何降低误报率和提升分析效率是该方法优化的主要目标。针对这一挑战,提出了基于代码切片相似度匹配的脆弱性发现框架。文中研究了基于关键点的代码切片、特征抽取和向量化的方法,主要思想是以脆弱性代码的脆弱性语义上下文切片作为参照物,通过计算被测代码的切片与脆弱性样本切片的相似性来判断存在脆弱性的可能性。文中实现了该方法,并以已知脆弱性的开源项目为分析对象进行了验证。与已有研究的对比实验表明,切片相似度能更准确地刻画脆弱性上下文,通过切片技术优化了基于相似度匹配的脆弱性发现方法,有效降低了脆弱性发现的误报率和漏报率,验证了所提框架和方法的有效性。
基于SEH的漏洞自动检测与测试用例生成
黄钊,黄曙光,邓兆琨,黄晖
计算机科学. 2019, 46 (7): 133-138.  doi:10.11896/j.issn.1002-137X.2019.07.021
摘要 ( 232 )   PDF(1564KB) ( 367 )   
参考文献 | 相关文章 | 多维度评价
SEH即结构化异常处理,是Windows操作系统提供给程序设计者处理程序错误或异常的途径。然而SEH的链式处理方式使得程序中可能存在相应漏洞。针对该问题,为提升程序安全性,提出一种基于SEH的漏洞自动测试用例生成方法。首先判断程序是否存在基于SEH被攻击的漏洞风险性,若存在则构建和调整测试用例约束,并自动求解生成相应测试用例。该方法一方面扩展了当前的自动测试用例生成模式,另一方面可在GS保护开启时仍能生成有效测试用例。最后通过实验验证了该方法的有效性。
基于Coq记录的矩阵形式化方法
马振威,陈钢
计算机科学. 2019, 46 (7): 139-145.  doi:10.11896/j.issn.1002-137X.2019.07.022
摘要 ( 228 )   PDF(1265KB) ( 390 )   
参考文献 | 相关文章 | 多维度评价
矩阵在工程系统中有广泛的应用,矩阵运算的正确性对工程系统的可靠性有重要影响。Coq是一种基于带类型λ演算的功能强大的高阶定理证明器。虽然Coq类型系统能够很好地描述可变大小的动态数据类型,但是对于固定大小的类似向量和矩阵的数据类型,其缺乏满意的描述机制。Coq库中也没有向量库或矩阵库,因此在使用Coq来对涉及矩阵的定理或算法进行形式化验证时十分复杂。针对这些问题,文中提出了一种基于Record类型的矩阵实现方法并定义了一组基本的矩阵函数,证明了它们的基本性质。基于文中提供的矩阵类型和相关引理可以比较轻松地完成飞行控制转换矩阵的验证。同其他矩阵实现方法相比,所提方法不仅在实现上相对简洁,在使用上也更加简单、方便。
基于粒子群优化算法的测试用例生成方法
张娜,滕赛娜,吴彪,包晓安
计算机科学. 2019, 46 (7): 146-150.  doi:10.11896/j.issn.1002-137X.2019.07.023
摘要 ( 219 )   PDF(1397KB) ( 308 )   
参考文献 | 相关文章 | 多维度评价
针对标准粒子群算法(Particle Swarm Optimization,PSO)中存在的早熟收敛、易于陷入局部极值的问题,提出了一种基于反向学习与再次搜索的粒子群优化算法(Reverse-Learning and Search-Again PSO,RSAPSO)用于测试用例生成。首先,通过非线性递减的惯性权重函数对学习因子进行改进,实现对种群的初步搜索,并采用梯度下降法完成对最优解与次优解的再次搜索;其次,以极值点为中心设定禁忌区域,对禁忌区域外的粒子进行反向学习,改善种群多样性;最后,采用分支距离法构造适应度函数,评判测试用例的优劣程度。实验结果表明,提出的改进方法在覆盖率、迭代次数和缺陷检测率指标上均有优势。
人工智能
基于双向注意力机制的问答情感分类方法
沈忱林, 张璐, 吴良庆, 李寿山
计算机科学. 2019, 46 (7): 151-156.  doi:10.11896/j.issn.1002-137X.2019.07.024
摘要 ( 508 )   PDF(1846KB) ( 622 )   
参考文献 | 相关文章 | 多维度评价
情感分类是自然语言处理研究中的一项基本任务,旨在判别文本的情感极性。目前,情感分类相关研究主要针对句子、篇章和微博等文本形式。与以往研究不同的是,文中面向新颖的问答型评论展开情感分类。首先,收集并标注了大规模、高质量的问答型评论语料集;针对问答型评论的特点,提出了一种基于双向注意力机制的神经网络方法。具体而言,该方法首先通过双向LSTM对问题文本和答案文本分别编码,再通过双向注意力机制同时计算问题文本和答案文本的情感权重,最后通过情感权重计算得到问答型评论的情感匹配信息。实验结果表明,提出的方法在问答情感分类任务上达到了75.5%的准确率和61.4%的F1值,相较于其他基准方法有明显的提升。
基于粗糙集和果蝇优化算法的特征选择方法
方波,陈红梅,王生武
计算机科学. 2019, 46 (7): 157-164.  doi:10.11896/j.issn.1002-137X.2019.07.025
摘要 ( 172 )   PDF(1288KB) ( 336 )   
参考文献 | 相关文章 | 多维度评价
特征选择是模式识别领域重要的数据预处理步骤之一,旨在从原始特征集合中选出最有效的特征子集使得给定评价准则达到最优。为此,文中提出了一种基于粗糙集和果蝇优化算法的特征选择方法。该方法基于一种新的双策略进化果蝇优化算法进行特征子集的迭代寻优,并结合粗糙集属性依赖度和属性重要性构造适应度函数对所选特征子集进行评估,既可以在全局范围内尽可能多地搜索出重要的特征,又能选出对决策最具有贡献的有效特征子集。在UCI数据集上的实验结果表明,提出的特征选择方法可以有效地搜索出具有最少信息损失的特征子集,并达到较高的分类精度。
基于定向变异布谷鸟算法的配送路径问题
刘晓珍,刘景森
计算机科学. 2019, 46 (7): 165-171.  doi:10.11896/j.issn.1002-137X.2019.07.026
摘要 ( 183 )   PDF(1987KB) ( 334 )   
参考文献 | 相关文章 | 多维度评价
在货物配送路径规划问题中,为了保持基本布谷鸟算法中莱维飞行机制与偏好随机游动策略的特点,文中提出了基于定向变异的布谷鸟算法和求解配送路径问题的完整有效方法。首先采用快速排序法将实数编码个体的每一维元素映射成问题的城市编号,从而建立算法与问题模型之间的联系;然后运用邻域搜索法决定城市访问的次序,即通过各城市之间的距离寻找当前城市的邻近城市,以增强算法的收敛速度。同时,在算法局部搜索机制中,通过平均适应度函数将算法划分为双子群,然后针对不同的子群体采用相应的定向变异机制,从而使算法搜索具有目的性,以增强算法的局部搜索能力。对标准TSP数据库中测试算例的求解实验结果表明,所提算法在各个算例中的求解偏差率均有明显降低,无论在最优值还是平均值的偏差率上都小于其他几种对比算法,对于路径规划问题的求解效果较优。
基于强化表征学习深度森林的文本情感分类
韩慧,王黎明,柴玉梅,刘箴
计算机科学. 2019, 46 (7): 172-179.  doi:10.11896/j.issn.1002-137X.2019.07.027
摘要 ( 162 )   PDF(1878KB) ( 331 )   
参考文献 | 相关文章 | 多维度评价
为了有效实现评论文本的情感倾向性预测,在深度森林模型的基础上提出一种基于强化表征学习的深度森林算法BFDF(Boosting Feature of Deep Forest)来对文本进行情感分类。首先,提取二元特征与情感语义概率特征;其次,对二元特征中的评价对象做聚类处理以及特征融合;然后,改进深度森林级联层的表征学习能力,避免特征信息逐渐削减;最后,将AdaBoost方法融入到深度森林,使深度森林注意到不同特征的重要性,进而得到改进的模型BFDF。在酒店评论语料集上进行了实验验证,实验结果证明了该方法的有效性。
基于近似牛顿法的分布式卷积神经网络训练
王雅慧, 刘博, 袁晓彤
计算机科学. 2019, 46 (7): 180-185.  doi:10.11896/j.issn.1002-137X.2019.07.028
摘要 ( 186 )   PDF(1552KB) ( 456 )   
参考文献 | 相关文章 | 多维度评价
大多数机器学习问题可以最终归结为最优化问题(模型学习)。它主要运用数学方法研究各种问题的优化途径及方案,在科学计算和工程分析中起着越来越重要的作用。随着深度网络的快速发展,数据和参数规模也日益增长。尽管近些年来GPU硬件、网络架构和训练方法均取得了重大的进步,但单一计算机仍然很难在大型数据集上高效地训练深度网络模型,分布式近似牛顿法作为解决这一问题的有效方法之一被引入到分布式神经网络的研究中。分布式近似牛顿法将总体样本平均分布到多台计算机,减少了每台计算机所需处理的数据量,使计算机之间互相通信,共同协作完成训练任务。文中提出了基于近似牛顿法的分布式深度学习,在相同的网络中利用分布式近似牛顿法训练,随着GPU数目呈2的指数次幂增加,训练时间呈近乎2的指数次幂减少。这与研究的最终目的一致,即在保证估计精度的前提下,利用现有分布式框架实现近似牛顿法,分布式训练神经网络,从而提升训练效率。
带有时间标签的流行社交位置发现
刘长赟,杨宇迪,周丽华,赵丽红
计算机科学. 2019, 46 (7): 186-194.  doi:10.11896/j.issn.1002-137X.2019.07.029
摘要 ( 159 )   PDF(4119KB) ( 257 )   
参考文献 | 相关文章 | 多维度评价
流行社交位置是指大多数人日常生活中经常访问的位置,其广泛应用于推荐系统、定向广告应用等领域。随着基于位置的社交网络(Location-Based Social Network,LBSN)的迅速发展,流行社交位置的挖掘成为时空数据挖掘中的一个研究热点。然而,现有的研究主要是从LBSN中挖掘流行社交位置,忽略了流行社交位置的时间因素,因此,文中提出了带有时间标签的流行社交位置发现算法。该算法首先量化LBSN数据集中的时间信息,得到个体用户带有时间标签的频繁社交位置集合;然后计算这些带时间标签的位置在群体用户中的流行度;最后识别出符合要求的带时间标签的流行社交位置。文中采用约10个月的Foursquare东京用户签到数据对该算法的效率和正确性进行验证,结果表明,该算法能够较为准确地发现带有时间标签的流行社交位置。
多智能体模态逻辑系统KD45n中的知识遗忘
文习明,方良达,余泉,常亮,王驹
计算机科学. 2019, 46 (7): 195-205.  doi:10.11896/j.issn.1002-137X.2019.07.030
摘要 ( 182 )   PDF(1468KB) ( 274 )   
参考文献 | 相关文章 | 多维度评价
遗忘在知识表示与推理领域扮演着非常重要的角色。遗忘在多种逻辑语言中都有大量的研究,被广泛应用于诸多领域。模态逻辑适用于智能体的知识表示与推理。随着多智能体系统研究的发展,多智能体模态逻辑中的知识遗忘也开始被关注。现有研究表明,知识遗忘在不同的多智能体模态逻辑系统中具有不同的性质,且大多无法有效计算。为此,多智能体模态逻辑系统KD45n中的知识遗忘值得进一步研究。首先,基于模型理论给出知识遗忘的定义;接着,分析KD45n中知识遗忘的主要性质;最后,提出KD45n中计算知识遗忘的有效算法。该算法利用人工智能领域解决难求解问题的主要方法之一——知识编译技术,将一般公式编译成交替覆盖析取范式,再利用该范式进行知识遗忘的有效计算。研究结果表明,在KD45n中满足一些很重要的知识遗忘性质,其计算时间复杂度是交替覆盖析取范式公式长度的多项式时间(原公式长度的双重指数时间)。与现有的非初等时间复杂度算法相比,所提算法更高效、更实用。
具有生物真实性的强抗噪性神经元激活函数
麦应潮,陈云华,张灵
计算机科学. 2019, 46 (7): 206-210.  doi:10.11896/j.issn.1002-137X.2019.07.031
摘要 ( 139 )   PDF(3217KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
当前人工神经网络虽然在图像识别等方面媲美人脑,但因其所采用的激活函数ReLU和Softplus等只是对生物神经元输出响应特性的高度简化与模拟,使其在抗噪性、不确定性信息处理及功耗等方面与人脑仍存在巨大差距。通过分析生物神经元仿真实验,以其响应特性为基础,引入反映每个神经元随机性的参数η,构建出一种具有生物真实性的强抗噪性激活函数Rand Softplus。最后将该激活函数应用于深度残差网络,并基于人脸表情数据集对其进行验证。结果表明,在输入无噪声或具有少量噪声时,文中提出的激活函数与当前主流激活函数的识别精度基本持平,当输入包含较大噪声时,文中所提激活函数的识别精度远高于其他激活函数,表现出了良好的抗噪性能。
改进K均值聚类的海洋数据异常检测算法研究
蒋华,武尧,王鑫,王慧娇
计算机科学. 2019, 46 (7): 211-216.  doi:10.11896/j.issn.1002-137X.2019.07.032
摘要 ( 253 )   PDF(1828KB) ( 280 )   
参考文献 | 相关文章 | 多维度评价
针对海洋Argo浮标监测数据中的异常数据挖掘问题,在改进K均值算法的基础上,提出基于距离为准则进行海洋异常数据判定的异常检测算法。该算法重新定义海洋数据邻近度,并根据数据的规模以及分布情况,区块化、自适应地筛选备选初始聚类中心;在算法迭代过程中,运用簇内,数据对象相对于聚类中心的距离均值,全局考量类簇内,符合异常特征的数据对象进行异常检测。通过仿真数据集和真实数据集分别进行实验验证,对比结果表明:该算法在聚类性能以及异常检测方面都优于对比算法。
基于稀疏贝叶斯学习的协同进化时间序列缺失数据预测算法
宋晓祥,郭艳,李宁,余东平
计算机科学. 2019, 46 (7): 217-223.  doi:10.11896/j.issn.1002-137X.2019.07.033
摘要 ( 180 )   PDF(1570KB) ( 358 )   
参考文献 | 相关文章 | 多维度评价
针对大多数已有算法在预测协同进化时间序列中的缺失数据时只适用于缺失数据较少情况的问题,提出了一种高效的缺失数据预测算法。首先,应用压缩感知理论,将协同进化时间序列中的缺失数据预测问题建模成多稀疏向量恢复问题;其次,从稀疏表示向量是否足够稀疏和感知矩阵是否满足有限等距特性两个方面分析了模型的性能;最后,针对协同进化时间序列的特点设计了一种基于稀疏贝叶斯学习的高效恢复算法,该算法可以通过学习得到部分支持信息,从而同时解决多个稀疏向量的恢复问题。仿真结果表明,所提算法可以同时有效地预测出多个时间序列中的缺失数据。
模糊自适应排序变异多目标差分进化算法
董明刚,刘宝,敬超
计算机科学. 2019, 46 (7): 224-232.  doi:10.11896/j.issn.1002-137X.2019.07.034
摘要 ( 187 )   PDF(2417KB) ( 257 )   
参考文献 | 相关文章 | 多维度评价
为提高多目标差分进化算法在求解问题时的收敛性和多样性,提出了一种模糊自适应排序变异多目标差分进化算法。首先,采用模糊系统自适应调节排序变异参数,均衡了算法的局部搜索能力和全局探索能力,在加快算法收敛速度的同时,减小了陷入局部最优的可能性;其次,采用均匀种群初始化方法,在算法开始阶段获得了一个分布均匀的初始种群,提高了算法的稳定性和多样性;最后,增加一个临时的种群以存储被丢弃的个体,用于每一代优化后的最终选择,提高了种群进化过程中的多样性。采用7个标准测试函数和3个具有偏好特征的测试函数进行仿真实验,并将所提算法与其他4种多目标进化算法进行对比。实验结果表明,所提算法在收敛性和多样性方面整体上优于其他几种对比算法,可以有效地逼近真实Pareto前沿。同时,实验也验证了所提算法中模糊自适应排序变异策略的有效性。
图形图像与模式识别
面向行车视频目标实时检测的轻量级SSD网络
张琳娜,陈建强,陈晓玲,岑翼刚,阚世超
计算机科学. 2019, 46 (7): 233-237.  doi:10.11896/j.issn.1002-137X.2019.07.035
摘要 ( 221 )   PDF(1631KB) ( 412 )   
参考文献 | 相关文章 | 多维度评价
车辆和行人检测是高级辅助驾驶(ADAS)中最基本也是研究最广泛的内容,而深度学习算法是当前性能最好的目标检测算法。然而,深度学习算法的计算量非常大,通常需要高性能的GPU显卡才能快速运行。在实际使用中,目标检测算法一般要求集成到车辆硬件系统中,因此算法对硬件资源的要求不能太高。基于SSD网络,提出一种轻量级的SSD网络,用于实时目标检测。通过减小输入图像的大小以及全连接层节点数量,减少网络复杂度,提升目标实时检测速度。计算量减少将导致检测车辆和行人的准确率下降,因此提出多级损失函数监督训练方法,来解决输入图像缩小而引发的图像损失及在反向传播过程中不能有效更新VGG中浅层卷积层参数等问题。此外,提出一种基于多尺度图像分块的训练数据集扩充方法,以解决图像缩放产生的形变及图像缩小后目标可能消失的问题。实验结果表明,采用所提出的轻量级SSD网络,不但实现了笔记本电脑上的车辆和行人检测的实时性,也保持了检测准确率。对比其他目标检测算法,优化后的网络对行车视频中车辆和行人的检测速度优于其他算法,且在获得相同准确率的同时消耗的电量更少。
基于联合图像块聚类自适应字典学习的多模态医学图像融合
王丽芳, 史超宇, 蔺素珍, 秦品乐, 高媛
计算机科学. 2019, 46 (7): 238-245.  doi:10.11896/j.issn.1002-137X.2019.07.036
摘要 ( 680 )   PDF(3179KB) ( 502 )   
参考文献 | 相关文章 | 多维度评价
针对多模态医学图像融合中过完备自适应字典存在的大量冗余信息会导致图像重建质量不佳的问题,文中提出了基于联合图像块聚类自适应字典学习的多模态医学图像融合方法(JCPD)。该方法首先计算图像块的欧氏距离,通过比较设定的阈值和图像块的最小距离来剔除冗余图像块,减少冗余图像块的数量。然后,使用局部调制核回归(SKR)提取图像块的局部梯度信息作为聚类中心,将具有相同局部梯度信息的两种模态的图像块进行联合图像块聚类。在联合图像块聚类的基础上使用改进的K-SVD算法对图像块聚类形成的类簇进行训练得到子字典,并将子字典合并成自适应字典。最后,在自适应字典的作用下用正交匹配追踪算法(OMP)计算得到稀疏表示系数,再使用“2范数最大”的规则融合稀疏系数,之后通过重建得到融合图像。实验表明,与2种基于多尺度变换的方法和6种基于稀疏表示的方法相比,所提方法在保证字典信息的完整性和字典的紧凑性基础上使得融合的图像清晰度更高、对比度更强,便于临床诊断和辅助治疗。
基于主题融合和关联规则挖掘的图像标注
张蕾,蔡明
计算机科学. 2019, 46 (7): 246-251.  doi:10.11896/j.issn.1002-137X.2019.07.037
摘要 ( 167 )   PDF(1441KB) ( 347 )   
参考文献 | 相关文章 | 多维度评价
为减小“语义鸿沟”,在LDA主题模型的基础上,提出了一种主题融合和关联规则挖掘的图像标注方法。首先,针对视觉和文本信息的关联度不高的问题,引入基于向量机的多类别分类得到图像的类别信息。其次,通过文本模态的语义主题分布和类别信息,计算出图像类的文本主题分布。未知图像将其所属类的文本主题分布与其视觉主题分布进行加权融合,并以此概率模型计算初始标签集。最后依据初始标注词概率,利用关联规则挖掘和词间相关性挖掘文本关联度,从而得到精确化语义标注。在Corel5K图像数据集上进行对比实验,实验结果证明了方法的有效性。
融合多层卷积特征的相关滤波运动目标跟踪算法
李健鹏, 尚振宏, 刘辉
计算机科学. 2019, 46 (7): 252-257.  doi:10.11896/j.issn.1002-137X.2019.07.038
摘要 ( 208 )   PDF(3035KB) ( 304 )   
参考文献 | 相关文章 | 多维度评价
在目标跟踪算法中,相关滤波算法近几年来发展迅速,成为了该领域的研究热点。相关滤波跟踪算法具有速度快、效果好等优点,但受限于传统手工特征对目标表达能力不足,仍然难以应对诸如形变、遮挡、模糊等情形。最近,卷积神经网络在诸多领域取得了极大的成功,研究人员将相关滤波与卷积特征相结合,克服了传统手工特征缺少目标语义信息的缺点。为了有效处理目标外观变化,文中提出一种融合多层卷积特征的相关滤波运动目标跟踪算法。该算法将目标跟踪分为预测位置和估计尺度两个步骤:提取多层卷积特征并在每个卷积层上估计目标位置,通过固定权重将所有卷积层的结果融合以确定目标的最终位置;确定位置后通过提取目标多个尺度的方向梯度直方图特征来估计目标的最佳尺度。在公开数据集中选取20段视频来验证所提算法,并将该算法与4种运动目标跟踪算法进行比较。实验数据表明,与次优的基于传统手工特征的DSST算法相比,所提算法的距离精度提高了48.9%,重叠精度提高了51.9%;与同样使用卷积特征的HCFT算法相比,其距离精度提高了19.1%,重叠精度提高了25.2%。文中提出的算法较好地克服了传统手工特征表达能力弱的缺点,其性能优于使用手工特征的传统相关滤波跟踪算法,相比同样使用卷积特征的相关滤波算法也有所提高。在目标发生遮挡、模糊等复杂情况下,该算法仍然能够准确跟踪目标。
基于改进脉冲耦合神经网络的图像分割方法
王燕, 许宪法
计算机科学. 2019, 46 (7): 258-262.  doi:10.11896/j.issn.1002-137X.2019.07.039
摘要 ( 180 )   PDF(2976KB) ( 285 )   
参考文献 | 相关文章 | 多维度评价
为了实现对多目标图像和灰度不均匀图像的分割,文中提出了基于区域生长的局部脉冲耦合神经网络(RG-LPCNN)图像分割方法。首先,利用显著性检测方法提取出原始图像的显著性图。然后,根据直方图阈值法对显著性图进行粗分割,得出目标与背景,并将目标的质心作为RG-LPCNN的初始种子点。其次,将高斯核与原始图像的卷积结果作为放大系数,使得动态阈值具有了局部特性。最后,利用RG-LPCNN对图像进行分割,实现对多目标图像以及灰度不均匀图像的分割。将RG-LPCNN和其他阈值分割方法在自然图像、灰度不均匀图像上进行了对比,结果表明:RG-LPCNN在分割多目标图像和灰度不均匀图像方面具有较好的分割效果,验证了RG-LPCNN的有效性。
增强旋转不变LBP算法及其在图像检索中的应用
孙伟, 赵玉普
计算机科学. 2019, 46 (7): 263-267.  doi:10.11896/j.issn.1002-137X.2019.07.040
摘要 ( 137 )   PDF(2964KB) ( 422 )   
参考文献 | 相关文章 | 多维度评价
基于内容的图像检索是目前图像检索领域的研究重点。LBP纹理特征是基于内容的图像检索领域常用的特征。传统的LBP算法应用于图像检索系统时检索效率低,且不具有旋转不变性。旋转不变LBP(rotation invariant LBP,LBPri)算法虽然具备旋转不变性,但检索精度不高。为了提高基于内容的图像检索的精度和效率,在传统LBP算法的基础上提出一种增强旋转不变LBP描述符(Enhanced rotation invariant LBP,ELBPri)。ELBPri描述符首先对原始图像提取Harris角点,以角点为中心采样;其次用旋转不变LBP算法的编码方式对采样后的图像编码;然后统计各图像的LBP直方图;最后计算各图像LBP直方图之间的欧氏距离,并根据相似性排序。实验结果表明,相比LBPri描述符,CBIR系统应用ELBPri描述符检索一般纹理图像集时的平均查准率提高了5.64%,平均检索用时缩短了0.4ms;检索旋转纹理图像集时的平均查准率提高了5.94%,平均检索用时缩短了0.12ms。
基于四通道不可分加性小波的多聚焦图像融合
刘斌,谌文江,辛迦楠
计算机科学. 2019, 46 (7): 268-273.  doi:10.11896/j.issn.1002-137X.2019.07.041
摘要 ( 168 )   PDF(9250KB) ( 190 )   
参考文献 | 相关文章 | 多维度评价
针对张量积小波不具有对称性,在图像融合中难以获得高空间分辨率图像的问题,文中利用伸缩矩阵为[2,0;0,2]的不可分小波的构造方法构造四通道6×6对称的不可分小波滤波器组,并把它应用于多聚焦图像的融合中。利用此类滤波器组中的低通滤波器对多聚焦图像进行加性小波分解,得到小波平面组,然后利用融合规则对分解后的小波平面进行融合。实验结果表明,该方法有较好的融合效果,融合结果图像具有较高的清晰度和空间分辨率,其融合性能优于拉普拉斯金字塔融合方法(基于LP的融合方法)、基于小波分解的融合方法(基于DWT的融合方法)和基于三通道不可分对称小波的融合方法(基于3-NSDWT的融合方法)。
基于深度学习的几何特征匹配方法
李健, 杨祥如, 何斌
计算机科学. 2019, 46 (7): 274-279.  doi:10.11896/j.issn.1002-137X.2019.07.042
摘要 ( 353 )   PDF(3843KB) ( 520 )   
参考文献 | 相关文章 | 多维度评价
Kinect等深度相机采集的三维数据往往存在噪音、低分辨率等问题,导致两帧点云的局部几何特征匹配一直面临挑战。目前多采用基于特征直方图的方法解决这一问题,但其计算量较大,且对场景旋转平移的要求较为严格。文中提出了一种基于数据驱动的方法,首先从大量重建好的RGB-D数据集中,通过自监督的深度学习方法构建能够描述三维数据几何特征的模型;然后利用基于KD-Tree的K近邻算法(KNN)得到两部分点云的特征对应点,通过RANSAC剔除误匹配点对;最后通过得到的较准确的位置关系估计两帧点云的几何变换,从而完成配准。基于斯坦福大学点云库中的模型以及真实环境下Kinect采集到的大卫石膏像模型的配准和比较实验表明,所提方法不仅可以提取未知物体的局部几何特征进行配准,还可以较好地应对空间角度变换大的情况。
基于单视图三维重建的凹凸制造特征识别
苗绘翠, 王吉华, 张全英
计算机科学. 2019, 46 (7): 280-285.  doi:10.11896/j.issn.1002-137X.2019.07.043
摘要 ( 146 )   PDF(4728KB) ( 423 )   
参考文献 | 相关文章 | 多维度评价
为实现凹凸制造特征机器人的自动识别,文中提出了一种不依赖于CAD设计模型的自动特征识别新方法。该方法以零件的单幅图像为识别线索,首先采用改进的SFS算法对零件表面进行三维曲面重建;然后对重建模型表面的形状指数进行分析以计算特征分割线,利用特征线将曲面进行分割以获得相应的特征区域;最后基于特征识别规则实现对零件凹凸制造特征的有效识别。该方法能够在缺少CAD模型时有效地实现制造特征的自动识别,从而为来料加工以及二次装配过程中机器人的自动特征识别提供重要的方法。通过实例零件验证了该方法的有效性和准确性。
基于SIFT算法的大场景视频拼接算法及优化
杨思燕,贺国旗,刘如意
计算机科学. 2019, 46 (7): 286-291.  doi:10.11896/j.issn.1002-137X.2019.07.044
摘要 ( 283 )   PDF(1853KB) ( 377 )   
参考文献 | 相关文章 | 多维度评价
目前大量的由独立视频设备获取的小场景视频信息难以满足大场景下信息处理的要求,而通过多设备人工查阅的方式又存在效率低下、信息冗余和碎片化等问题。文中研究了大场景视频拼接技术,利用SIFT算法的尺度不变特性对关键点进行特征匹配,通过仿射矩阵变形完成对图像的拼接工作。在此过程中,对传统的SIFT拼接算法进行进一步的优化,主要是基于距离的优化算法来完善视频拼接的效果;对SIFT特征点匹配、加权优化算法、关键帧提取的技术等进行并行加速,以提高拼接效率。实验结果表明,提出的优化方法能更好地提取视频中的关键信息,以实现更好的视频拼接效果。在视觉效果上,所提方法得到的拼接结果中不存在传统方法出现的两幅图像的交接线。此外,在MATLAB环境下分别对关键点检测和拼接部分进行了加速优化,优化后的关键点检测效率提高了约20%,拼接部分的效率提高了将近57%。在C++环境下,关键点的检测效率提升了14%,拼接部分的检测效率提升了40%。
交叉与前沿
基于时空特征的地铁客流预测
张和杰,马维华
计算机科学. 2019, 46 (7): 292-299.  doi:10.11896/j.issn.1002-137X.2019.07.045
摘要 ( 284 )   PDF(2581KB) ( 958 )   
参考文献 | 相关文章 | 多维度评价
随着城市轨道交通的迅速发展,地铁短期断面客流的预测有利于运营部门观测客流的实时变化,从而调整调度策略。客流具有时空特征,在10min粒度时间片下,客流变化存在周期性,在空间上客流波形存在差异性。使用凝聚层次聚类算法对不同站点在一周内的客流进行聚类分析,得到贴近站点特征的客流分类结果。根据分类结果,对不同类别客流时间片分别进行相关性分析,提出一种基于SVM的预测模型,将强相关性的时间片序列作为模型输入。同时,提出一种基于协同自适应调整的双种群萤火虫算法以寻优模型参数,算法中引入混沌吸引度来提高算法的全局搜索能力,避免由于初始值陷入局部最优;加入自适应搜索步长,以加快算法的收敛速度并提高求解精度。与其他模型和优化算法的对比表明,本模型具有较好的预测精度、稳定性和鲁棒性。
相关性和相似度联合的癌症分类预测
张学扶, 曾攀, 金敏
计算机科学. 2019, 46 (7): 300-307.  doi:10.11896/j.issn.1002-137X.2019.07.046
摘要 ( 170 )   PDF(2285KB) ( 461 )   
参考文献 | 相关文章 | 多维度评价
基于经验型组织病理学的癌症诊断往往误诊率很高。从基因层次对癌症进行分析和研究是现阶段提高癌症分类预测精度的重要途径之一。生物学研究表明,同种癌症的关联基因有着共同的功能特点。基于此,文中提出相关性和相似度联合的癌症分类预测集成方法。首先,一方面,从统计学角度分析基因的差异化表达,利用互信息方法对基因表达谱数据进行相关性计算;另一方面,从生物机理上进行基因间的相似性分析,结合拓扑相似性和语义相似性分别对蛋白质互作网络和GO数据进行基因间的功能相似度计算。以上两者结合,即通过同时最大化目标集合的相关性和相似度筛选出特征基因集。然后,通过Bootstrap方法对数据集进行多样性采样,在前面所选特征基因集的基础上利用多种机器学习算法训练得到多个差异化较大的分类预测模型。最后,利用得到的多模型对测试样本进行分类预测,通过决策模型得到最终的分类结果。对GEO中4种不同癌症数据集进行分类预测研究,并将所提方法与最近的研究方法进行综合对比,结果所提方法在各数据集上的分类预测精度均提高5%左右,相比IG/SGA方法最高能达到10%的精度提升。实验结果表明,相关性和相似度联合的方法有效提高了癌症的分类预测精度,选择得到的特征基因有利于揭示生物学意义,且将多种算法优势互补,可解决单个分类算法适用范围受限的问题。
基于速度控制的自动化码头AGV无冲突路径规划
仲美稣, 杨勇生, 周亚民
计算机科学. 2019, 46 (7): 308-314.  doi:10.11896/j.issn.1002-137X.2019.07.047
摘要 ( 175 )   PDF(2264KB) ( 370 )   
参考文献 | 相关文章 | 多维度评价
随着劳动力成本的上升,提高码头效率成为港口发展的关键。自动引导车(AGV)是自动化码头水平运输的主要设备,但其作业过程中的冲突、拥堵、等待等问题日益突出,降低了码头的运作效率。以最小化AGV在岸桥和场桥之间的行驶距离为目标建模,选择最优行驶路径。通过检测AGV的重叠率和冲突时间,遵循先到先服务的原则,采用速度控制策略,实现AGV无冲突路径规划。仿真实验表明,该方法能有效降低 AGV 冲突的概率,减少岸桥和场桥设备的等待时间,提高AGV 的作业效率,实现作业成本的最小化。
基于流程切的过程模型挖掘方法
宋健,方贤文,王丽丽
计算机科学. 2019, 46 (7): 315-321.  doi:10.11896/j.issn.1002-137X.2019.07.048
摘要 ( 125 )   PDF(1793KB) ( 175 )   
参考文献 | 相关文章 | 多维度评价
在业务流程挖掘过程中,过程挖掘的目的是从事件日志中挖掘出满足人们需要的模型,以此来改善和优化过程模型。以往的研究都是从频繁日志中挖掘模型,将低频日志直接删除,该类方法使得挖掘的模型不完整,且在行为上会引发死锁或其他异常情况。文中提出基于流程切的过程模型挖掘方法,该方法从事件日志中挖掘过程模型,对事件日志采用流程切的形式进行分割,不仅考虑到频繁行为,还考虑了低频模式下的行为;尤其针对异常的环状结构会引起流程图的边缘结构发生异常的问题,流程切可以很好地进行处理。利用这种方法得到的模型比较全面完善,能够提高有效性和精确度。利用评价指标对构建的模型进行优化,从而得出最优模型。最后,通过具体事例验证了所提方法的有效性。
基于时空特征挖掘的交通流量预测方法
孔繁钰, 周愉峰, 陈纲
计算机科学. 2019, 46 (7): 322-326.  doi:10.11896/j.issn.1002-137X.2019.07.049
摘要 ( 250 )   PDF(1880KB) ( 775 )   
参考文献 | 相关文章 | 多维度评价
基于神经网络和大数据的交通流量预测方法层出不穷,但对交通流量预测的精度仍有待进一步提高。为了解决该问题,提出一种基于时空特征挖掘的交通流量预测方法。该方法使用改进的CNN来挖掘交通流量的空间特征,使用递归神经网络来挖掘交通流量的时间特征,能够充分利用交通流量的每周/每天的周期性和时空特征。此外,在该方法中还使用了一种基于相关性的模型,它可以根据过去的交通流量实现自动学习。实验结果表明,相比于其他几种较新的预测方法,所提方法具有较高的交通流量预测精度。
光照度聚类和支持向量机在路灯节能控制策略中的应用
文俊浩,万园,曾骏,王喜宾,梁冠中
计算机科学. 2019, 46 (7): 327-332.  doi:10.11896/j.issn.1002-137X.2019.07.050
摘要 ( 124 )   PDF(1998KB) ( 411 )   
参考文献 | 相关文章 | 多维度评价
传统路灯行业主要采用时间、经纬度、光照度等策略控制路灯开关。其中,光照度控制的理论节能效果最佳,但受采集数据误差、安装角度等环境因素影响,节能效果没有达到最大化。针对该问题,提出一种融合光照度聚类和支持向量机算法的路灯节能控制策略。该方法收集光照度、时间、安装角度数据,并使用K-means算法对光照度数据进行聚类,把原本变化剧烈的光照度数据变为5个等级(1-5),然后通过SVM对数据进行学习训练,在不考虑其他外在因素的情况下预测路灯的开关时间。实验研究结果表明,该算法可有效降低路灯的用电量。
动态阈值结合全局优化的船舶AIS轨迹在线压缩算法
宋鑫,朱宗良,高银萍,苌道方
计算机科学. 2019, 46 (7): 333-338.  doi:10.11896/j.issn.1002-137X.2019.07.051
摘要 ( 208 )   PDF(1992KB) ( 383 )   
参考文献 | 相关文章 | 多维度评价
随着船舶定位技术的进一步发展,大量船舶安装了船舶定位识别系统,该系统生成了海量的船舶轨迹数据。船舶轨迹数据经过压缩处理后能有效提高处理、应用数据的工作效率。针对现有轨迹在线压缩算法处理压缩率高、耗时长等问题,提出了一种动态阈值结合全局优化的两阶段在线压缩算法(DTGO)。该算法在第一阶段对原始轨迹进行分段处理,动态更新各项阈值,从而获得简化轨迹;在第二阶段使用改进的SPM算法对简化轨迹进行全局优化。通过对原始轨迹进行两阶段的处理,将原始轨迹分段成若干个子轨迹段,对子轨迹段进行局部处理,最后使用全局处理算法对所有子轨迹段进行全局优化。实验结果表明,该算法在提高压缩效率的同时取得了良好的压缩效果。