1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2019年第8期, 刊出日期:2019-08-15
  
大数据与数据科学*
多智能体强化学习综述
杜威, 丁世飞
计算机科学. 2019, 46 (8): 1-8.  doi:10.11896/j.issn.1002-137X.2019.08.001
摘要 ( 647 )   PDF(1381KB) ( 954 )   
参考文献 | 相关文章 | 多维度评价
多智能体系统是一种分布式计算技术,可用于解决各种领域的问题,包括机器人系统、分布式决策、交通控制和商业管理等。多智能体强化学习是多智能体系统研究领域中的一个重要分支,它将强化学习技术、博弈论等应用到多智能体系统,使得多个智能体能在更高维且动态的真实场景中通过交互和决策完成更错综复杂的任务。文中综述了多智能体强化学习的最新研究进展与发展动态,首先介绍了多智能体强化学习的基础理论背景,回顾了文献中提出的多智能体强化学习的学习目标和经典算法,其被分别应用于完全合作、完全竞争和更一般(不合作也不竞争)的任务。其次,综述了多智能体强化学习的最新进展,近年来随着深度学习技术的成熟,在越来越多的复杂现实场景任务中,研究人员利用深度学习技术来自动学习海量输入数据的抽象特征,并以此来优化强化学习问题中智能体的决策。近期,研究人员结合深度学习等技术,从可扩展性、智能体意图、奖励机制、环境框架等不同方面对算法进行了改进和创新。最后,对多智能体强化学习的应用前景和发展趋势进行了总结与展望。目前多智能体强化学习在机器人系统、人机博弈、自动驾驶等领域取得了不错的进展,未来将被更广泛地应用于资源管理、交通系统、医疗、金融等各个领域。
元事件抽取研究综述
高李政, 周刚, 罗军勇, 兰明敬
计算机科学. 2019, 46 (8): 9-15.  doi:10.11896/j.issn.1002-137X.2019.08.002
摘要 ( 166 )   PDF(1308KB) ( 485 )   
参考文献 | 相关文章 | 多维度评价
事件抽取是信息抽取领域的一个重要研究方向,在情报收集、知识提取、文档摘要、知识问答等领域有着广泛应用。对当前事件抽取领域研究得较多的元事件抽取进行了综述。首先,简要介绍了元事件和元事件抽取的基本概念,以及元事件抽取的主要实现方法。然后,重点阐述了元事件抽取的主要任务,详细介绍了元事件检测过程,并对其他相关任务进行了概述。最后,总结了元事件抽取面临的问题,在此基础上展望了元事件抽取的发展趋势。
面向城市热点区域的不平衡数据聚类挖掘研究
蔡莉, 李英姿, 江芳, 梁宇
计算机科学. 2019, 46 (8): 16-22.  doi:10.11896/j.issn.1002-137X.2019.08.003
摘要 ( 178 )   PDF(3223KB) ( 329 )   
参考文献 | 相关文章 | 多维度评价
在大数据时代,数据来源众多,因此多源数据的融合成为数据挖掘领域的一个研究热点。现有的多源数据融合研究主要聚焦于相同领域内平衡数据集的融合模型和算法,对来自不同领域的非平衡数据集的聚类挖掘关注较少。DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法是挖掘热点区域的主要算法,但其无法处理不平衡的融合数据,少数类数据形成的聚类结果很难被发现。针对不平衡数据的融合,文中提出了一种基于时空特征的位置数据融合模型;同时,从数据层面和算法层面提出新颖的方法来解决不平衡数据的挖掘问题。鉴于目前的聚类算法的评价指标并不适用于不平衡数据的聚类结果评估,提出了一种新的综合评价指标来反映聚类质量。将来自交通领域的GPS轨迹数据(多数类数据)和社交领域的微博签到数据(少数类数据)进行融合,然后采用所提方法来挖掘热点区域。实验结果表明:基于多源数据融合的热点区域挖掘结果优于单源挖掘结果,所发现的热点区域位置、分布和数量与实际情况一致。文中所提出的融合模型、改进算法和评估指标法是有效且可行的,还可用于其他来源的位置数据的融合与分析。
基于轨迹划分与密度聚类的移动用户重要地点识别方法
杨震, 王红军
计算机科学. 2019, 46 (8): 23-27.  doi:10.11896/j.issn.1002-137X.2019.08.004
摘要 ( 128 )   PDF(1834KB) ( 177 )   
参考文献 | 相关文章 | 多维度评价
移动用户轨迹数据作为新兴的空间轨迹数据,可用于分析个体或群体的行为特征、兴趣爱好,在智慧城市、交通规划和反恐维稳等领域应用广泛。为了从庞大的数据集中识别出移动用户的重要地点,提出了一种基于转角偏移度与距离偏移量的轨迹划分算法。该算法首先通过轨迹划分提取出用户的重要地点候选集,然后采用一种改进的密度聚类算法进一步对用户的候选重要地点实现聚类,从而识别出用户的最终重要地点。在Geolife轨迹数据集与Foursquare用户签到数据集上的实验表明,采用轨迹划分与密度聚类相结合的重要地点识别方法具有比现有的重要地点识别方法更高的准确率,证明了所提方法的可行性与优越性。
融合动态协同过滤和深度学习的推荐算法
邓存彬, 虞慧群, 范贵生
计算机科学. 2019, 46 (8): 28-34.  doi:10.11896/j.issn.1002-137X.2019.08.005
摘要 ( 217 )   PDF(1806KB) ( 266 )   
参考文献 | 相关文章 | 多维度评价
在信息爆炸的时代,推荐系统在减轻信息过载方面发挥了巨大的作用。目前,推荐系统普遍使用传统的协同过滤算法学习用户商品行为矩阵中的隐向量,但是其存在数据稀疏性和冷启动问题,同时未考虑用户的兴趣偏好以及商品的受欢迎程度会随时间发生改变,这极大地限制了推荐的准确性。已有学者利用深度学习模型学习辅助信息的特征来扩充协同过滤算法的特征,取得了一定的成果,但并未充分有效地解决全部问题。以电影推荐为研究对象,提出了融合动态协同过滤和深度学习的推荐算法。首先,利用动态协同过滤算法融入时间特征;然后,利用深度学习模型来学习用户和电影特征信息,以形成高维潜在空间的用户特征和电影特征的隐向量;最后,将其融入到动态协同过滤算法中。以MovieLens为实验数据集对电影的评分进行预测,实验结果表明所提算法提高了电影评分预测的准确性。
异构分布式存储系统再生码数据修复的节点选择方案
钟凤艳, 王艳, 李念爽
计算机科学. 2019, 46 (8): 35-41.  doi:10.11896/j.issn.1002-137X.2019.08.006
摘要 ( 91 )   PDF(1632KB) ( 118 )   
参考文献 | 相关文章 | 多维度评价
近年来,海量数据的增长给现有的存储系统带来了严峻的挑战,包括存储成本和数据可靠性要求等。纠删码由于在相同的存储开销下可以提供更高的数据可靠性,得到了学术界和工业界的广泛关注。但由于纠删码的编码特性,让使用纠删码的存储系统在数据修复过程中增加了许多其他方面的额外开销,如计算、调度、传输、磁盘读写等。近年来对纠删码数据修复的研究都基于这样一个假定:分布式存储系统中各个节点是无差别的。然而,实际情况是,在大规模的数据中心中,设备替换、硬件故障等原因不仅会导致数据丢失,还会导致数据中心的各个存储节点的存储成本不同,从而使每个存储节点上所存储的数据量并不总是相等,这种现象被称为存储容量异构。存储容量异构场景下的修复过程面临供应节点的选择问题,需要设计一个节点选择策略来降低修复开销,提高存储系统的可靠性和可用性。鉴于实际数据修复过程中参与修复的节点对数据的传输成本不同,提出节点选择策略——树形拓扑修复算法,以降低整个修复过程中的修复成本。仿真结果表明,相对IFR码的固定节点选择策略,文中提出的树形选择策略在平均情况下可以进一步降低数据修复成本。
基于地理标签的推文话题时空演变的可视分析方法
孙国道, 周志秀, 李思, 刘义鹏, 梁荣华
计算机科学. 2019, 46 (8): 42-49.  doi:10.11896/j.issn.1002-137X.2019.08.007
摘要 ( 87 )   PDF(3747KB) ( 147 )   
参考文献 | 相关文章 | 多维度评价
社交媒体中,用户所发布的推文内容记录了与用户相关的各种信息。文字信息中涵盖了推文中包含的各种话题,以及时间和空间信息,从这些信息中分析出话题的时空演变情况具有十分重要的研究意义。针对推文数据,设计了一套可视分析流程来挖掘推文信息,通过用户交互的方式多角度地展示了推文话题的时空演变过程。首先,基于部分历史推文数据,通过DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法,结合泰森多边形对全球地理空间进行区域划分;然后,针对用户查询搜索的兴趣话题,索引找到所有相关的推文内容,并将信息与聚类中心绑定;最后,通过设计的多个结合时序聚类算法和自适应算法的可视化视图来展示话题的时空演变过程。通过推特官网提供的API抓取存储的推文数据,并进行实验和分析,结果表明:改进的可视化视图自适应布局算法有效地解决了图形遮挡问题,完整展现了推文的时空演变模式;地理区域的划分以及可视化组件能够有效帮助研究人员分析推文的时空演变以及全球关注的热点话题分布。
基于主题分析的用户评论聚类方法
张会兵, 钟昊, 胡晓丽
计算机科学. 2019, 46 (8): 50-55.  doi:10.11896/j.issn.1002-137X.2019.08.008
摘要 ( 72 )   PDF(1997KB) ( 134 )   
参考文献 | 相关文章 | 多维度评价
在社会化商务中对用户评论进行合理的聚类分析有利于商家提供精准服务或推荐信息,文中提出了一种基于主题分析的用户评论聚类方法。根据主题词在用户评论中的互信息强度以及主题词之间的相似度计算主题词权重,并依此构建用户评论主题向量。在此基础上,提出了一种基于用户评论相似度自动选择canopy聚类算法初始阈值的自适应canopy+kmeans聚类算法,对主题向量进行聚类分析。在亚马逊的评论数据上进行测试,结果表明:该方法充分描述了用户评论中不同主题词对用户观点的突出程度不同,并改善了K-means聚类算法易陷入局部最优的缺点,与传统的LDA+K-means算法相比,取得了更好的效果。
一种可指定分布的海量数据生成方法
李博嘉, 张仰森, 陈若愚
计算机科学. 2019, 46 (8): 56-63.  doi:10.11896/j.issn.1002-137X.2019.08.009
摘要 ( 78 )   PDF(2253KB) ( 98 )   
参考文献 | 相关文章 | 多维度评价
受到隐私保护等因素的影响,企业和政府数据公开缓慢;同时,由于网络带宽的限制,科研机构下载使用海量公开数据存在困难。现有的数据生成工具很少能在生成数据的分布形态、相关关系、准确性以及系统的可伸缩性等方面同时满足科研工作的要求。针对海量数据生成问题,提出了一种分布式数据生成模型,根据用户配置中指定的数据分布形态及相关关系,利用蓄水池抽样或随机采样算法对Web信息知识库进行采样、相关关系计算以及拼接等操作,生成数据属性符合用户配置的数据。通过在Apache Spark分布式计算引擎上进行数据生成实验,结果表明,生成数据符合指定的数据分布及相关关系要求,数据生成速度与数据规模、集群规模呈线性关系,从而证明该方法生成的数据具有较高的准确性和分布多样性,相应的系统具有较好的可伸缩性。
基于改进FP growth的告警关联算法
鲁显光, 杜学绘, 王文娟
计算机科学. 2019, 46 (8): 64-70.  doi:10.11896/j.issn.1002-137X.2019.08.010
摘要 ( 110 )   PDF(2158KB) ( 140 )   
参考文献 | 相关文章 | 多维度评价
入侵检测系统产生的原始告警存在层次较低、相互孤立、没有关联性等不足,使得安全管理人员难以从中发现未知的、高层次的安全威胁,从而无法了解目标网络的整体安全态势。为了利用低级别告警构建攻击场景,通过分析现有的告警关联知识,针对基于数据挖掘的告警关联算法处理稀疏数据时性能较差的不足,提出了一种新的基于数据挖掘的告警关联算法。首先对现有的告警关联算法进行了分析比较;然后阐述了经典的Apriori算法和FP growth算法的机制及优缺点,并基于二维表对FP growth算法进行了改进;最后使用改进算法挖掘告警之间的关联规则,继而进行告警关联。为了验证所提方法的可行性和性能,使用Darpa数据集进行了相关的仿真测试,实验结果表明该方案可以较好地实现告警关联。
日志诱导下的形态学片段流程聚类方法
孙书亚, 方欢, 方贤文
计算机科学. 2019, 46 (8): 71-77.  doi:10.11896/j.issn.1002-137X.2019.08.011
摘要 ( 53 )   PDF(1797KB) ( 68 )   
参考文献 | 相关文章 | 多维度评价
在业务流程管理系统中,执行同一目的的任务流可能存在若干事件集的多种不同排列方式,对应在日志上则表现为很多日志存在着诸多变化,同时具有很多业务的共性特征。因此,如何提取日志行为的共性,将多个相似日志的流程进行聚类,实现提取流程簇业务系统的共性,对相似流程的业务融合具有积极意义。文中提出了一种基于日志的流程聚类方法,首先对日志中的低频事件进行过滤,利用日志形态学片段提取公共的高频片段,进而通过形式自动机将提取的公共高频片段转换为相似日志的聚类中心;然后,提出基于形态学片段的业务组合方法产生流程模型共性的频繁执行路径,将相似的等价类形态学片段进行业务组合,得到组合后的Petri网模型,即为流程簇的聚类中心;最后,通过一个实际的案例验证了所提方法的可行性和有效性。
项目多属性模糊联合的多样性视频推荐算法
张艳红, 张春光, 周湘贞, 王怡鸥
计算机科学. 2019, 46 (8): 78-83.  doi:10.11896/j.issn.1002-137X.2019.08.012
摘要 ( 61 )   PDF(2235KB) ( 98 )   
参考文献 | 相关文章 | 多维度评价
针对视频协同过滤推荐算法多样性较低的问题,提出了一种基于多属性联合的多样性视频协同过滤推荐算法。根据用户与推荐系统的互动历史记录,判断用户是否满意系统的推荐项目,如果某个用户过去观看同一个主题的视频节目,并且不关心视频的作者,那么认为该用户对视频作者表现出较高的多样性,对视频节目主题表现出的多样性较低。采用信息熵与用户配置信息长度两个指标来评估项目各个属性的多样性,根据两个指标的组合将用户对每个项目属性的多样性分为4个象限,并且对用户多样性进行模糊化处理,以获得用户多样性对于4个象限的隶属度。在第一个阶段预测未评分项目的评分;在第二个阶段将所有项目重新排序,以提高推荐列表的多样性。最终,基于公开的Movielens 1M数据集进行了对比实验,实验结果证明本算法可实现接近top-N算法的准确率性能,同时具有一定的多样性增强效果。在推荐准确率与多样性平衡的应用场景下,设置合适的参数能够在损失较少推荐准确率的前提下,显著提高个体多样性、总体多样性与新颖性。
2018 全国高性能计算学术年会
基于非结构化网格的高可扩展并行有限体积格子
徐磊, 陈荣亮, 蔡小川
计算机科学. 2019, 46 (8): 84-88.  doi:10.11896/j.issn.1002-137X.2019.08.013
摘要 ( 66 )   PDF(2668KB) ( 148 )   
参考文献 | 相关文章 | 多维度评价
均匀网格格子Boltzmann方法虽然有其优势,但是在模拟大规模流场信息以及复杂几何边界时仍然存在困难。为此,文中给出了非结构化网格下的有限体积格子Boltzmann方法。该方法采用cell-centered方案,使用low-diffusion Roe方案计算对流通量密度,通过最小二乘方法计算粒子分布函数的梯度。为了能够模拟大规模复杂流场情况,文中给出了非结构化网格有限体积格子Boltzmann方法的并行方法。该法通过ParMETIS划分流场的非结构化网格,将网格近似平均地发送给MPI进程,比较了两种不同规模的网格单元的并行性能。文中通过以下两点验证了并行算法的正确性:1)顶盖方腔驱动流,Re=400,1 000,3 200,5 000;2)圆柱绕流,Re=10,20,40。并行数值实验的结果表明所提并行算法在1 920核上仍然拥有良好的可扩展性,在1 920个核上的并行效率可以达到在240核上效率的78.42%。
基于超算暨HPIC-LBM的大时空尺度三维湍流磁重联
颜辉, 朱伯靖, 万文, 钟英, DavidAYune
计算机科学. 2019, 46 (8): 89-94.  doi:10.11896/j.issn.1002-137X.2019.08.014
摘要 ( 44 )   PDF(5112KB) ( 99 )   
参考文献 | 相关文章 | 多维度评价
大时空尺度湍流磁重联(LTSTMR)是空间物理、太阳物理、宇宙学领域中一种普遍存在的爆发现象。磁能转移-释放-耗散、等离子体加热及高能粒子加速是研究该类现象的核心内容,而研究湍流在LTSTMR中如何起作用是解决以上问题的关键所在。2D/2.5D磁重联模型因其在物理图像简化方面忽略了自然界爆发现象的3D属性和本质。文中基于新型HPIC-LBM粒子算法,在天河2号平台上开展了LTSTMR十万核心级别的数值实验工作。首次获得了太阳大气活动磁重联精细演化(0~500 km) 耗散区内oblique不稳定性证据。证明了耗散区内微观集体集合效应宏观表现的3种具体形式:湍流磁场self-generating-organization、湍动等离子体self-feeding-sustaining及磁场与等离子体间的相互作用。该研究为在超算平台上应用三维磁重联模型开展大时空尺度湍流磁重联提供了一种新途径。
一种ARM处理器面向高性能计算的性能评估
王一超, 廖秋承, 左思成, 谢锐, 林新华
计算机科学. 2019, 46 (8): 95-99.  doi:10.11896/j.issn.1002-137X.2019.08.015
摘要 ( 155 )   PDF(2828KB) ( 207 )   
参考文献 | 相关文章 | 多维度评价
为探索ARM架构在高效能“绿色计算”领域中,面向高性能计算的应用价值,对一款ARM指令集处理器进行性能评估,并将其与主流商用处理器Intel Xeon进行性能对比。在微架构上,测试了该处理器的浮点数计算能力、访存带宽及延迟。实验结果显示,该处理器的双精度浮点计算能力约为475 GFLOPS,相较于Xeon E5-2680v3,低了33%,访存带宽约为105GB/s,优于Xeon平台。在应用层面,选取4个高性能计算领域的典型应用,包含Stencil并行计算方法等,在该处理器实现移植和编译,并采用线程绑定的运行方法,提升缓存局部性,优化计算性能。实验结果显示,ARM指令集处理器的应用移植简单,其优化思路与主流商用处理器(如Intel Xeon)类似,但在计算密集和随机访存型应用上存在提升空间,在Stencil应用上性能近似,结合低功耗特点,在“绿色计算”领域具有竞争力。后续将持续基于最新的ARM指令集芯片做相关研究。
基于混合混沌大爆炸算法的三维片上网络低功耗映射
范星冉, 宋国治, 李加正
计算机科学. 2019, 46 (8): 100-105.  doi:10.11896/j.issn.1002-137X.2019.08.016
摘要 ( 65 )   PDF(2029KB) ( 58 )   
参考文献 | 相关文章 | 多维度评价
三维片上网络(3D NoC)被认为是提高多核处理系统性能的一种方式。对于3D NoC的设计,如何将给定应用特征图(APCG)上的IP核适当地分配到3D NoC架构中是IP核映射的关键问题。一种优秀的映射算法及一次合理的映射可以大幅改善片上网络的通信功耗、发热、延时等指标。大爆炸算法(BB-BC)是一种新型的元启发式群体智能优化算法;混合混沌大爆炸(HCBB-BC)算法是在大爆炸算法基础上进行改进的一种算法,它具有参数简单、收敛速度快等优点。文中提出将混合混沌大爆炸算法用于解决三维片上网络映射问题,这是首次用大爆炸算法的相关算法来解决3D NoC映射问题。仿真实验结果证明,与现有的3D NoC映射算法相比,所提方法可以用更少的迭代次数和时间来找到更好的解决方案,同时有效地降低3D NoC的映射功耗。在经典任务图映射条件下,混合混沌大爆炸算法与遗传算法(GA)相比,收敛速度提高了36.73%,与粒子群算法(PSO)相比,收敛速度提高了22.45%;同时,混合混沌大爆炸算法的平均功耗比遗传算法的平均功耗的最大值低5.75%,并且比粒子群算法的平均功耗的最大值低3.90%。在随机任务图映射条件下,混合混沌大爆炸算法仍然能够保持稳定的功耗优化效率和更快的收敛速度。
基于GPU加速和非负矩阵分解的并行协同过滤推荐算法
康林瑶, 唐兵, 夏艳敏, 张黎
计算机科学. 2019, 46 (8): 106-110.  doi:10.11896/j.issn.1002-137X.2019.08.017
摘要 ( 86 )   PDF(1889KB) ( 310 )   
参考文献 | 相关文章 | 多维度评价
协同过滤(CF)已经在推荐系统中得到了广泛的应用。但是随着用户和项目规模的增大,协同过滤算法的运行效率以及结果的正确性会大大降低。针对这一问题,文中提出了一种基于GPU的非负矩阵分解(NMF)的并行协同过滤方法,充分利用NMF数据降维和特征提取的优势以及CUDA的多核并行计算模式,进行维数简化和用户的相似性计算。该算法在提高精确性的同时降低了计算耗费,可以较好地解决协同过滤推荐系统所存在的稀疏性和扩展性等问题,快速产生精确的个性化推荐结果。基于NVIDIA CUDA设备和真实的MovieLens用户评分数据集,将所设计的并行NMF协同过滤算法与传统的基于用户的和基于物品的协同过滤算法进行了比较,实验结果表明,所设计的并行NMF协同过滤算法达到了较快的处理速度以及较高的推荐准确率。
基于用户向量化表示和注意力机制的深度神经网络推荐模型
郭旭, 朱敬华
计算机科学. 2019, 46 (8): 111-115.  doi:10.11896/j.issn.1002-137X.2019.08.018
摘要 ( 119 )   PDF(1953KB) ( 269 )   
参考文献 | 相关文章 | 多维度评价
随着互联网应用的蓬勃发展,推荐系统作为解决信息过载的有效手段,成为了工业界与学术界的研究热点。面向用户隐式反馈的传统推荐算法主要基于协同过滤和排序学习等方法,但这些方法未充分利用用户行为中的隐式反馈特征。文中提出了一种基于神经网络的用户向量化表示模型,其能够充分利用用户的异构的隐式反馈行为特征。同时,借鉴机器翻译中的self-attention机制,设计了一种神经注意力推荐模型,其融合用户向量化表示和用户-项目交互的动态时序特征以提高推荐系统的性能。在公开数据集上进行对比实验,通过召回率、准确率、NDCG 3个指标评价推荐性能。结果表明,与其他面向隐式反馈的推荐模型相比,所提推荐模型具有更好的推荐性能,并且对用户行为特征具有很好的泛化能力。
网络与通信
基于增量最短路径优先的域内高效路由保护算法
耿海军, 尹霞
计算机科学. 2019, 46 (8): 116-120.  doi:10.11896/j.issn.1002-137X.2019.08.019
摘要 ( 84 )   PDF(1870KB) ( 85 )   
参考文献 | 相关文章 | 多维度评价
学术界提出利用LFC(Loop-Free Criterion,LFC)规则来解决网络中所有可能出现的单链路故障情形,但是已有的针对LFC的实现方式的计算开销随着网络节点平均度的增加而增加,给路由器带来了大量的额外负担。针对该问题,文中研究如何降低LFC实现方式的计算开销,提出了一种基于增量最短路径优先(Incremental Shortest Path First,i-SPF)的域内高效路由保护算法(Efficient Intra-domain Routing Protection Algorithm Based on i-SPF,ERPISPF)。理论证明ERPISPF的计算开销远远小于构造一棵最短路径树的计算开销,并且可以为任意源-目的对计算出所有符合LFC规则的下一跳集合。实验结果表明,与LFC方案相比,ERPISPF的计算开销降低了93%左右,并且与LFC拥有相同的故障保护率。
高速移动场景下基于贪婪算法的改进模代数预编码
廖勇, 杨馨怡, 夏茂菡, 王博, 李守智, 沈轩帆
计算机科学. 2019, 46 (8): 121-126.  doi:10.11896/j.issn.1002-137X.2019.08.020
摘要 ( 36 )   PDF(2186KB) ( 92 )   
参考文献 | 相关文章 | 多维度评价
针对高速移动场景下信道时频域选择性衰落特性给多入多出(Multiple Input Multiple Output,MIMO)系统的预编码带来的技术挑战,文中提出了一种基于贪婪算法的用户调度方案,该方案以信道容量最大化为目标对用户进行调度并排序;进而为用户调度提出一种基于贪婪算法的改进模代数预编码(Tomlinson-Harashima Precoding,THP)算法,根据用户调度结果,对信道矩阵进行选择重构,将重构后的信道矩阵应用到THP算法中,以对传统THP进行优化,从而提高预编码精度。仿真结果表明,相比传统预编码,所提预编码具有更优的误码率(Bit Error Ratio,BER)性能和信道容量,并且其鲁棒性能更好,验证了所提算法能有效地适应高速移动场景。
基于绿色能源感知的效用函数异构网络接入算法
方旭愿, 田红心, 孙德春, 杜文丛, 祁婷
计算机科学. 2019, 46 (8): 127-132.  doi:10.11896/j.issn.1002-137X.2019.08.021
摘要 ( 43 )   PDF(2271KB) ( 73 )   
参考文献 | 相关文章 | 多维度评价
在5 G移动通信网络中,大量采用绿色和电网能源混合供电的通信基站可以显著降低运营成本。针对异构网络混合能源供电基站的用户接入问题,文中提出了基于绿色能源感知的综合效用函数接入算法(Green Energy Perception Comprehensive utility function,GEPC)和结合调节的综合效用函数接入算法(Green Energy Perception based Comprehensive unility function Adjustment algorithm,GEPCA)。用户首先根据基站的绿色能源状况、接入信噪比等接入选择参数加权计算出效用值,选择效用值最小的基站接入,用户接入基站后,通过基站对接入用户进行调节来实现降低总能耗费用的效果。MATLAB仿真表明:GEPC算法在低负载时相比于RSRP (基于用户接收信号强度)、SINR(基于用户最大信干噪比)算法可以更有效地降低总能量消耗费用;在高负载时GEPCA算法和NEAT(绿色能源用户感知接入)算法相比显著提高了绿色能源的利用率,使之达到90%,同时有利于实现异构网络的负载均衡。
基于RSSI的混合滤波算法
倪晓军, 高雁, 李凌锋
计算机科学. 2019, 46 (8): 133-137.  doi:10.11896/j.issn.1002-137X.2019.08.022
摘要 ( 45 )   PDF(1934KB) ( 52 )   
参考文献 | 相关文章 | 多维度评价
基于接收信号强度指示(Received Signal Strength Index,RSSI)的测距技术因其低成本及低复杂度被广泛用于无线传感网络(WSN)定位技术中。由于RSSI值易受环境的影响,即使在同一位置采集到的RSSI值也会出现波动、突变,从而导致测距结果误差较大。在分析RSSI测距原理和当前常见的滤波算法的基础上,通过实验比较单一滤波的效果,综合单一滤波的优势,提出了一种基于狄克逊检验法滤波、中位值滤波及高斯滤波的混合滤波算法。实验首先利用线性回归算法优化RSSI测距模型的参数,再通过混合滤波过滤异常RSSI值来获得最优值,以实现准确测距。实验结果显示,与单一的滤波算法相比,混合滤波算法能明显减小RSSI值的波动,更为有效地剔除异常RSSI值,且滤波后的RSSI值更接近理想值,测距误差更小,证明了混合滤波算法是有效且可行的。
复杂加权供应链网络攻击策略和鲁棒性研究
赵志刚, 周根贵, 李虎雄
计算机科学. 2019, 46 (8): 138-144.  doi:10.11896/j.issn.1002-137X.2019.08.023
摘要 ( 81 )   PDF(2949KB) ( 109 )   
参考文献 | 相关文章 | 多维度评价
文中研究在不同攻击策略下,如何提高复杂供应链网络的鲁棒性。首先,调整复杂加权供应链网络的优先连接参数,模拟实际网络的演化过程,分析供应链网络的度分布函数和介数分布函数,证实其具有无标度特征。随后,研究了加权供应链网络的多种攻击策略,统计了供应链网络的最大连通子图的相对规模和网络传输效率指标,并分析了网络的鲁棒性。仿真结果表明,对节点攻击策略而言,节点度攻击和混合攻击破坏性较大;对边攻击策略而言,双点介数攻击破坏性较大。改变网络的演化机制可以提高网络的鲁棒性,这为在实际工作中优化网络设计、保护网络中的少数重要节点和边、提高网络抗毁性能提供了一定的研究思路。
基于分簇和融合补偿策略的多维标度定位算法
王静, 仇晓鹤
计算机科学. 2019, 46 (8): 145-151.  doi:10.11896/j.issn.1002-137X.2019.08.024
摘要 ( 42 )   PDF(1952KB) ( 59 )   
参考文献 | 相关文章 | 多维度评价
针对经典的多维标度(MDS-MAP)定位算法在大规模无线传感器网络中存在的定位功耗大和精度低的问题,改进后的MDS-MAP算法将节点作为簇头时的剩余能量、能耗均衡性与局部密度的综合指标进行评估后再进行分簇,形成的簇具有良好的连接性与较低的能量损耗。针对部分不满足拼合规则的节点,提出了一种利用度量策略来获得节点间未知的欧氏距离的方法,并用角度判别法消除干扰解。在对公共节点进行补偿后,使用改进的规则进行簇间合并。仿真比较结果表明,提出的基于分簇与融合补偿策略的多维标度定位算法具有较低的拼合要求、高定位精度以及强鲁棒性,有利于拓展网络和降低定位功耗。
基于延迟CSIT的非对称双向中继X信道传输方案
刘锋, 葛培新, 曾连荪
计算机科学. 2019, 46 (8): 152-156.  doi:10.11896/j.issn.1002-137X.2019.08.025
摘要 ( 41 )   PDF(1372KB) ( 49 )   
参考文献 | 相关文章 | 多维度评价
在快速衰落信道中,当发送端不具备即时的信道状态信息(CSIT)时,利用延迟信道状态信息能够提高系统的自由度。假设系统每个节点具有延迟CSIT,研究了非对称(即中继两侧用户数不相等)双向中继X信道的自由度。将传输过程分为MAC和BC两个阶段,提出了一种结合干扰对齐与物理层网络编码的多级传输方案,利用延迟CSIT在多个时隙解码期望消息。实验结果表明,本方案可以实现比Vaze提出的上界高21.8%的复用增益,同时,相对于TDMA方案提升了166.7%。分析结果表明,相对于TDMA方案和Vaze界,该方案能够实现一定程度的自由度增益。
基于方位信息的改进LZW前缀编码方案
韩宾, 张红红, 江虹, 丁一
计算机科学. 2019, 46 (8): 157-162.  doi:10.11896/j.issn.1002-137X.2019.08.026
摘要 ( 56 )   PDF(1741KB) ( 54 )   
参考文献 | 相关文章 | 多维度评价
LZW压缩算法在实时采集与无线传输中具有重要应用价值,一般采用采集-压缩-传输的工作模式,该模式下的较高压缩比可极大降低对无线传输的压力。但在采集速度较快、数据传输带宽较低、硬件资源受限的情况下,在对采样点概率分布较均匀的数字信号进行压缩时,易出现压缩率不高或采集速度与压缩速度不匹配的问题。对此,文中提出了基于方位信息的改进LZW前缀编码方案。该改进压缩算法基于压缩比因子对采样点进行映射操作,使其能够标识后面相邻采样点的压缩情况,然后通过采样点间的方位信息,缩短采样点的码长,实现对采样点数据的压缩。实验表明,与原LZW压缩算法相比,该改进算法在不增加算法复杂度和硬件存储空间的条件下,压缩比可提高26.25%,证明了该算法在采集系统中的有效性。
基于无线城域网的微云负载均衡算法
曾金晶, 张建山, 林兵, 张文德
计算机科学. 2019, 46 (8): 163-170.  doi:10.11896/j.issn.1002-137X.2019.08.027
摘要 ( 66 )   PDF(2040KB) ( 93 )   
参考文献 | 相关文章 | 多维度评价
随着无线通信技术的发展,越来越多的商业、娱乐和社交活动建立在便携式移动设备之上。便携式移动设备的尺寸限制了它的计算能力,计算能力的不足与应用程序的高计算需求相矛盾。边缘计算使得计算任务在数据源头附近就能得到及时处理,是减小系统延迟的有效方法。微云技术是边缘计算的重要应用,部署微云是解决上述矛盾的有效方法。多个微云连接在一起形成网络,终端用户可以通过无线城域网(Wireless Metropolitan Area Networks,WMAN)来获得微云服务。如何将任务卸载并调度到合理的微云中,减少系统延迟,是目前面临的重大挑战。文中研究了如何平衡网络中多个微云之间的工作负载,以优化移动应用程序的性能表现。首先,引入一个系统模型来获取卸载任务的响应时间,并制定一个在微云之间寻找卸载任务调度的最佳方案,以最小化微云上任务的平均响应时间。其次,提出了一种快速且可扩展的启发式算法来缩短用户任务的响应时间。最后,通过仿真实验来评估所提算法的性能特征。实验结果表明,该算法在缩短用户任务响应时间方面有着积极作用。
网络编码与多路径传输在互联网视频直播中的应用研究
张锦辉, 邓茜, 李振宇
计算机科学. 2019, 46 (8): 171-177.  doi:10.11896/j.issn.1002-137X.2019.08.028
摘要 ( 65 )   PDF(2125KB) ( 110 )   
参考文献 | 相关文章 | 多维度评价
互联网视频直播的普通用户可以实时上传视频,其他用户可以实时在线观看。这种模式使其无法根据流行度提前将视频推送到各CDN节点缓存,而且要求视频从产生到分发到用户观看的延迟尽量低。视频上传的性能对互联网视频直播观看体验的影响最大,上传流的停顿常常造成下载流中无数据可发,在停顿现象中的占比达87.6%。针对这一问题,文中提出了一种将网络编码与多路径传输结合后应用到互联网视频直播上传中的方法。首先,通过网络编码对实时产生的视频数据进行冗余编码,增强抗丢包性;其次,对上传终端到CDN的多条链路测速,利用效用函数评估每条链路的性能;最后,根据不同链路的效用值将编码后的数据分配到各链路上进行传输,到达接收端后还原。理论分析和实验表明,与目前普遍采用的TCP传输方式相比,在2%丢包率、50 ms时延的网络条件下,所提方法的传输速率是TCP的7.6倍。实验结果表明,将网络编码与多路径传输结合后应用到互联网视频直播上传中,可以显著提升上传速率,快速感知网络的变化情况,增强对多变的网络环境的适应性。
信息安全
一种基于小波分析的网络流量异常检测方法
杜臻, 马立鹏, 孙国梓
计算机科学. 2019, 46 (8): 178-182.  doi:10.11896/j.issn.1002-137X.2019.08.029
摘要 ( 75 )   PDF(1310KB) ( 109 )   
参考文献 | 相关文章 | 多维度评价
对大量网络流量数据进行高质量特征提取与异常识别是做好网络取证的重要基础。文中重点研究并实现了网络取证中的数据处理并建立了模型库。对一种基于小波分析的网络流量异常检测方法进行了研究,用于检测包含两种不同注入攻击的pcap文件。文中的研究在Windows系统上进行,采用Python语言完成功能代码编写。首先从大量数据中提取需要的训练数据,然后使用小波分析提取特征,最后使用支持向量机进行分类器训练,从而可以利用该分类器识别出包含正常流量和异常流量的混合流量中的异常。定性和定量实验结果表明该方法对两种类型的异常流量实现了较高的分类精度,以期从特征提取和分类分析两个角度为网络取证的完善提供一种途径。
基于DC-CNN的电子伪装语音还原研究
王永全, 施正昱, 张晓
计算机科学. 2019, 46 (8): 183-188.  doi:10.11896/j.issn.1002-137X.2019.08.030
摘要 ( 70 )   PDF(2530KB) ( 103 )   
参考文献 | 相关文章 | 多维度评价
针对电子伪装语音还原研究在还原模型的构建方面并无突破性进展的状况,提出了一种基于扩大的因果卷积神经网络(Dilated Casual-Convolution Neural Network,DC-CNN)的电子伪装语音还原模型。该还原模型以DC-CNN为框架,对电子伪装语音历史采样点的声学信息与还原因子进行卷积和非线性映射运算。同时模型的神经网络采用跃层连接技术以优化深层传递,再经过压扩转换后输出还原语音。该模型具有非线性映射性、扩展性、多适应性与条件性、并发性等明显特点。在实验分析中,以3个基本变声功能:音调(pitch)、节拍(tempo)和速度(rate)对钢琴曲和英文语音分别进行电子伪装变声处理,再经模型还原,将还原语音与原始语音进行声纹特征比对、LPC数据分析和语音同一性的人耳测听辨识,结果表明,还原语音与原始语音的声纹特征十分吻合,且实现了高质量的共振峰波形复原,钢琴曲和英文语音的共振峰参数总体还原拟合率分别达到79.03%和79.06%,远超电子伪装语音与原始语音35%的相似比例,这说明该模型能有效削减语音中的电子伪装特征,较好地实现了电子伪装的钢琴曲和英文语音的还原。
电子数据取证中LED加密系统的积分故障分析
王弈
计算机科学. 2019, 46 (8): 189-193.  doi:10.11896/j.issn.1002-137X.2019.08.031
摘要 ( 47 )   PDF(1566KB) ( 82 )   
参考文献 | 相关文章 | 多维度评价
在电子数据取证领域,取证与反取证技术的较量不断升级。数据加密技术是反取证技术的一个重要研究分支。为了在这场较量中占有先机,文中重点研究了物联网领域中所采用的LED轻量级密码算法,通过分析LED算法的加、解密过程,引入积分故障分析对其进行安全性分析,提出了一种破解LED密码算法的积分故障分析方法。积分故障分析主要利用同一明文正常加密输出的密文与注入故障后产生的密文之间的差异,通过在加密过程中注入随机故障获得故障密文;并通过一个积分故障识别器,恢复最后一轮的子密钥值,进而获得最后一轮的加密输入,它是倒数第二轮的输出。重复上述过程,直到加密密钥可以通过密钥生成算法获得。在上述推导的基础上进行实验仿真测试,从精确度、可靠性和时间复杂度3个方面证明了积分故障分析方法可以在有效时间内通过构造一个基于半字节故障模型的3轮故障识别器来实现破解过程。该方法可以为破解AES类轻量级加密算法提供参考与借鉴。
面向物联网搜索技术的高效访问控制方案
章园园, 秦岭
计算机科学. 2019, 46 (8): 194-200.  doi:10.11896/j.issn.1002-137X.2019.08.032
摘要 ( 56 )   PDF(1601KB) ( 62 )   
参考文献 | 相关文章 | 多维度评价
物联网搜索技术在日常生活中有着广泛应用,但由于物联网搜索引擎的开放性和搜索后台的不完全可信性,存储于搜索后台的信息存在严重的安全问题。针对该问题,提出一种安全、高效的支持密文搜索的属性基访问控制方案。在数据保护方面,为了确保用户属性信息和数据的安全,使用了访问策略部分隐藏和属性授权机构去中心化等方法,并且使用密文定长的方式提高算法效率和节约存储空间。同时,提出一种支持策略对比的属性撤销方案,降低了传统撤销方案中的计算复杂度,提高了重加密效率。在密文搜索方面,引入超级节点并使用混合索引的方式提高了检索效率。实验分析表明,该方案高效地解决了物联网搜索技术中的安全问题。
差分隐私模型中隐私参数ε的选取研究
李兰, 杨晨, 王安福
计算机科学. 2019, 46 (8): 201-205.  doi:10.11896/j.issn.1002-137X.2019.08.033
摘要 ( 62 )   PDF(1454KB) ( 79 )   
参考文献 | 相关文章 | 多维度评价
差分隐私与传统的隐私保护方法不同,差分隐私可以对隐私保护强度进行量化分析,正是由于这一特点,使得差分隐私在数据发布、数据挖掘等方面得到了广泛的研究和应用。隐私预算因子ε是影响隐私保护强度的重要因素之一,如何选取一个合理的ε值,使数据的可用性达到最大化,并能够定量分析出隐私保护强度是亟待解决的一个问题。因此,通过分析满足Laplace分布噪音的概率密度函数与分布函数之间的关系,得到在噪音选取时,噪音可能落在的3种区间,从而建立隐私参数ε与落点概率之间的数学关系表达式,并利用函数图像模型对参数ε的选取计算式进行定量分析,最后结合攻击概率对隐私参数ε的取值上界进行了探讨。
基于概率模型的云辅助的轻量级无证书认证协议的形式化验证
夏奴奴, 杨晋吉, 赵淦森, 莫晓珊
计算机科学. 2019, 46 (8): 206-211.  doi:10.11896/j.issn.1002-137X.2019.08.034
摘要 ( 57 )   PDF(2343KB) ( 62 )   
参考文献 | 相关文章 | 多维度评价
匿名WBANs通信技术是保护互联网用户和服务器间隐私的最有力手段之一,但匿名WBANs无证书认证协议的形式化验证仍是亟待解决的难题。采用概率模型检测的方法对一种基于云辅助的匿名WBANs的轻量级无证书认证协议建立离散时间马尔科夫链模型,在协议建模的状态迁移中加入了攻击率,重点对攻击率进行定量分析,用概率计算树逻辑对协议属性进行描述,利用PRISM概率模型检验工具对协议进行定量分析和验证,并且与SIP协议进行性能方面的对比。验证结果表明:在匿名WBANs通信环境下,云辅助的轻量级无证书认证协议各实体间所受攻击率对协议的不可否认性、时延性和有效性有不同程度的影响,控制好攻击率可以提高协议安全性,这对医疗服务质量和实时监测效率的提高以及远程医学的基本需求有着极大的意义。
基于GeoHash的近邻查询位置隐私保护方法
周艺华, 李广辉, 杨宇光, 侍伟敏
计算机科学. 2019, 46 (8): 212-216.  doi:10.11896/j.issn.1002-137X.2019.08.035
摘要 ( 47 )   PDF(1626KB) ( 57 )   
参考文献 | 相关文章 | 多维度评价
随着移动应用和定位技术的不断发展,基于位置的服务(Location-Based Services,LBS)得到了越来越广泛的应用。LBS在为人们提供便利的同时也带来了隐私泄露的风险。近年来,位置服务中的隐私保护问题得到了研究者的持续关注,特别是近邻查询中的位置隐私保护问题得到了广泛的研究。针对第三方匿名服务器缺乏可信性以及容易成为系统瓶颈的问题,提出了一种自适应位置隐私保护强度的不依赖于第三方匿名服务器的基于GeoHash的近邻查询位置隐私保护方法。该方法利用GeoHash算法对用户精确的位置坐标进行字符串编码,将二维经纬坐标转换为一维字符串;LBS服务器通过构建Trie前缀树对GeoHash编码的字符串进行匹配并将查询结果返回给用户。理论分析和实验结果表明,该算法降低了查询通讯开销,同时能够有效保护用户的位置隐私信息。
软件与数据库技术
一种结合AADL与Z的嵌入式软件可靠性建模与评估方法
李蜜, 庄毅, 胡镡文
计算机科学. 2019, 46 (8): 217-223.  doi:10.11896/j.issn.1002-137X.2019.08.036
摘要 ( 66 )   PDF(1358KB) ( 125 )   
参考文献 | 相关文章 | 多维度评价
在嵌入式软件开发早期,为其建立可靠性模型能够尽早发现软件设计中存在的问题,从而节约嵌入式软件开发成本。AADL从软件结构和故障传播两个角度来建立软件可靠性模型,但是AADL的半形式化性质使得基于AADL建立的可靠性模型难以对可靠性、安全性等非功能属性进行严格的分析与验证。形式规格说明语言Z语言具有很强的逻辑描述能力,能够精确表达软件中的各种约束,这使得基于Z语言建立的可靠性模型能够很好地进行严格的分析和验证。因此,考虑到AADL和Z的特征,文中提出了一种将AADL与Z相结合的形式化可靠性模型(embedded software Reliability Model combined with Z and AADL,ZARM),该模型具有AADL的描述能力和Z的精确性。文中给出了ZARM故障模型、结构模型和行为模型的建模方法,并在谓词中描述了与可靠性相关的数据约束。在ZARM模型的基础上,文中提出了一种面向概率的基于DTMC的可靠性评估方法,来对ZARM模型进行可靠性定量评估和分析。最后,通过一个飞行管理系统对应用ZARM模型进行可靠性建模的过程进行了说明,并采用所提评估方法对其进行了可靠性评估。评估结果与文献[19]结果的对比说明了所提方法的正确性和有效性。
基于软件演化历史识别并推荐重构克隆的方法
折蓉蓉, 张丽萍
计算机科学. 2019, 46 (8): 224-232.  doi:10.11896/j.issn.1002-137X.2019.08.037
摘要 ( 73 )   PDF(3458KB) ( 67 )   
参考文献 | 相关文章 | 多维度评价
现有克隆代码重构研究局限于单一版本的静态分析,忽略了克隆代码的演化过程,这导致在克隆代码重构决策方面缺乏有效的方法。因此文中首先从克隆检测、克隆映射、克隆家系以及软件维护日志管理系统中提取与克隆代码密切相关的演化历史信息;其次识别出需要重构的克隆代码,同时识别出跟踪的克隆代码,然后提取与重构相关的静态特征和演化特征,并构建特征样本数据库;最后对比多种机器学习的方法对,选出效果最佳的分类器推荐重构克隆。在7款软件近170个版本上进行的实验表明,推荐重构克隆代码的准确度达到90%以上,这为软件开发和维护人员提供了更加准确、合理的代码重构建议。
基于AHP的回归测试用例优先级排序方法
冯沈峰, 高建华
计算机科学. 2019, 46 (8): 233-238.  doi:10.11896/j.issn.1002-137X.2019.08.038
摘要 ( 59 )   PDF(1595KB) ( 84 )   
参考文献 | 相关文章 | 多维度评价
测试用例优先级排序方法是基于特定准则对测试用例进行排序以提高回归测试效率。现有方法局限于单目标或少数影响因素,影响了其对测试用例的综合分析和评价,对此,文中提出了一种基于层次分析法的回归测试用例优先级排序方法。该方法以优化测试用例序列为目标,以影响因素为准则,以测试用例为方案,建立了层次结构模型,构造了对比矩阵,进行了排序与一致性检验,优化了影响因素比例。实验采用Matlab软件环境,以平均故障检测率为评估指标。结果表明,与已有几种优先级方法相比,该方法能达到更高的平均故障检测率85%,提高了测试效率,此外可根据实际需求扩充影响因素数量,具有灵活性。
基于故障定位的测试用例优先排序方法
陈静, 舒强, 谢昊飞
计算机科学. 2019, 46 (8): 239-243.  doi:10.11896/j.issn.1002-137X.2019.08.039
摘要 ( 84 )   PDF(1765KB) ( 67 )   
参考文献 | 相关文章 | 多维度评价
协议一致性测试是检验被测实现是否与标准协议规范相一致的方法,可确保符合协议的设备或者系统互联与互通。在被测设备调试、升级和修复等过程中,往往需要重新执行所有测试案例,以确保协议一致性测试的完备性。在协议实现的过程中,需要频繁地进行测试和修复,直至被测设备的协议完全符合协议的标准规范。而在每次的回归过程中,没有策略地执行测试案例集中所有的测试案例会增加测试的工作量。只有所有的测试案例执行结束,才能确定测试故障是否被正确修复,或者检测出其他新出现的故障。这导致了某些可以检测到故障的测试案例不能尽早执行,无法将测试重点放在易出错的部分,测试执行开销较大,会影响测试效率。因此在协议一致性测试过程中,如何对庞大的测试案例集进行优化并减少测试成本?在保证测试需求的前提下,使用尽可能少的测试案例尽快检测出系统中存在的故障以提高测试的故障检测率,成为了亟待解决的问题。文中在对现有的测试用例优先排序方法进行研究的基础上,对基于故障定位的测试用例优先排序算法进行了改进,以提高故障检测效率。该方法结合测试需求间的依赖关系、执行序列进行动态调整,对检错概率高的测试案例进行动态选取。在搭建的无线传感器网络的协议一致性测试系统上,对该算法进行了有效性验证。相较于Additional和FTP算法,所提方法的故障检测平均百分比APFD和测试效率TCFD分别至少提高了9.2%和7.6%。
人工智能
基于自注意力机制的事件时序关系分类方法
张义杰, 李培峰, 朱巧明
计算机科学. 2019, 46 (8): 244-248.  doi:10.11896/j.issn.1002-137X.2019.08.040
摘要 ( 120 )   PDF(1635KB) ( 295 )   
参考文献 | 相关文章 | 多维度评价
事件时序关系分类是事件抽取的重要后续任务。随着深度学习技术的发展,神经网络在事件时序关系分类任务中发挥着重要作用。但是,对于传统的循环神经网络或卷积神经网络而言,处理结构信息和捕获长距离依赖关系仍然是一个重大挑战。针对这个问题,文中提出了一种基于自注意力机制的事件时序关系分类模型架构,它可以直接捕获句子中任意两个词例之间的关系。将该机制与非线性网络层结合,可以使事件时序关系分类的性能得到显著提高。在TimeBank-Dense和Richer Event Description数据集上的对比实验证明:所提方法优于现有的大多数神经网络方法。
基于阴影集的截集式可能性C-均值聚类截集门限的选取
雒僖, 范九伦, 于海燕, 梁丹
计算机科学. 2019, 46 (8): 249-254.  doi:10.11896/j.issn.1002-137X.2019.08.041
摘要 ( 48 )   PDF(2522KB) ( 73 )   
参考文献 | 相关文章 | 多维度评价
截集式可能性C-均值聚类算法通过引入截集门限,修改典型性值,克服了可能性C-均值聚类算法的最关键问题:一致性聚类。针对算法中截集门限的选取问题,采用阴影集理论,提出了一种新的截集门限的选取方法。该算法利用最优化方法为每一个类确定一个阴影集阈值,并将该阈值作为截集门限;通过分析该选取方法对典型性值和中心偏移量的影响来改进典型性值的修改方式。最后,通过人工数据分析了新的截集门限选取方式对聚类算法性能的影响,利用实际UCI数据分析算法的迭代次数和聚类正确率。实验结果表明,给出的截集门限选取方法能够有效减少迭代次数,提高聚类正确率。
命题逻辑中单元子句及其负文字和冗余子句
刘婷, 徐扬, 陈秀兰
计算机科学. 2019, 46 (8): 255-259.  doi:10.11896/j.issn.1002-137X.2019.08.042
摘要 ( 44 )   PDF(1238KB) ( 65 )   
参考文献 | 相关文章 | 多维度评价
针对命题逻辑中逻辑公式的某个单元子句及其负文字和冗余子句,给出了含单元子句的子句集的等价条件,同时刻画了子句集中文字和子句的冗余性,得到了一些冗余文字和冗余子句的判定方法,还提出了与子句集可满足性的等价条件。所提方法可以使命题逻辑的逻辑公式更简单,为命题逻辑中逻辑公式的简化提供一定的理论支撑。
基于动态权重的LDA算法
居亚亚, 杨璐, 严建峰
计算机科学. 2019, 46 (8): 260-265.  doi:10.11896/j.issn.1002-137X.2019.08.043
摘要 ( 105 )   PDF(2333KB) ( 183 )   
参考文献 | 相关文章 | 多维度评价
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的三层概率主题模型,其实现了文本与文本中的单词在主题层次上的聚类。该模型以词袋(Bag of Words,BOW)模型为假设,所有单词的重要性相同,简化了建模的复杂度,但使得主题分布倾向于高频词,影响了主题模型的语义连贯性。针对此问题,提出了一种基于动态权重的LDA算法,该算法的基本思想是每个单词在建模中具有不同的重要性,在迭代过程中根据单词的主题分布动态生成相应的权重并反作用于主题建模,降低了高频词对建模的影响,提高了关键词的重要性。在4个公开数据集上的实验表明,基于动态权重的LDA算法在主题语义连贯性、文本分类准确率、泛化性能和精度方面比目前流行的LDA推理算法表现得更加优越。
基于MQHOA优化算法的尺度变化行为
周岩, 王鹏, 辛罡, 李波
计算机科学. 2019, 46 (8): 266-271.  doi:10.11896/j.issn.1002-137X.2019.08.044
摘要 ( 40 )   PDF(2576KB) ( 94 )   
参考文献 | 相关文章 | 多维度评价
尺度收敛是智能优化算法求解过程的重要环节,不确定性原理和量子隧道效应佐证了这一重要性。在多尺度量子谐振子算法(Multi-scale Quantum Harmonic Oscillator Algorithm,MQHOA)的优化迭代过程中,通过调整尺度收敛幅度,能够影响算法的求解效果和运算性能。对尺度变化进行研究,定义函数在2维状态下对应的最佳尺度收敛参数为该函数的尺度系数(Scale Factor,SF)。尺度系数可以作为衡量函数尺度结构复杂程度的定性判据参考,能够协助算法针对不同函数采用最合适的收敛尺度来寻求最优解。
基于外部语义知识补全的自然语言查询
冯雪
计算机科学. 2019, 46 (8): 272-276.  doi:10.11896/j.issn.1002-137X.2019.08.045
摘要 ( 51 )   PDF(1577KB) ( 86 )   
参考文献 | 相关文章 | 多维度评价
语义网是依托互联网技术而产生的一类非常重要的资源。目前,语义网中的用户查询仅支持形式化的查询方式,因此需要严格地遵循某种特定的语法规范,从而导致只有熟悉语义网系统和形式语言的专业人士才能正确进行查询操作。为了弥补这一缺陷,提出了一个无指导的自然语言查询系统,它能自动地将自然语言的句子转换成语义网查询支持的形式语言语句,从而方便非专业用户(即普通用户)使用。该系统首先根据语义网自动抽取给定句子中的所有实体和属性,然后将这些实体和属性关联起来形成一个语义关联图,最后通过启发式的方式从图中搜索出一条最优路径,并将这条路径转换成SPARQL语句。该系统最关键的部分在于语义网中的实体和属性覆盖度,它能直接决定语义关联图的好坏,从而影响系统的最终性能。为了提升系统的实用性,进一步利用外部语义网的知识来补全和丰富自然语言句子中所蕴含的信息,优化中间生成的语义关联度,得到更准确的SPARQL语句。最后采用美国地理问题集进行实验以验证该系统以及提出的改进方法,该数据集共包含了880个问句的人工SPARQL语句,是自然语言查询相关工作中一个被广泛认可的数据集。最终实验结果表明:提出的基准系统能够正确回答77.6%的问题,显著优于当前最好的无指导系统;当采用外部语义知识补全后,回答正确率达到78.5%。
基于多注意力机制的事件同指消解方法
方杰, 李培峰, 朱巧明
计算机科学. 2019, 46 (8): 277-281.  doi:10.11896/j.issn.1002-137X.2019.08.046
摘要 ( 109 )   PDF(1489KB) ( 95 )   
参考文献 | 相关文章 | 多维度评价
事件同指消解是信息抽取的一项重要任务,在信息融合、问答系统、阅读理解中都有着重要的作用。文中提出了一种基于多种注意力机制的卷积神经网络的CorefNet方法,用于消解文档级事件同指。该方法通过深层卷积网络抽取事件特征,并使用多种注意力机制获取重要信息。相比过去大部分建立在概率模型和图模型上的传统方法,所提方法仅使用了少量特征;与目前主流的神经网络模型相比,文中方法可以提取深层的事件特征,明显提高了事件同指消解的准确率。在ACE2005数据集上的实验验证了CorefNet优于目前最优的基准系统。
基于动态轨迹的眼动跟踪隐式标定方法
程时伟, 齐文杰
计算机科学. 2019, 46 (8): 282-291.  doi:10.11896/j.issn.1002-137X.2019.08.047
摘要 ( 71 )   PDF(4040KB) ( 110 )   
参考文献 | 相关文章 | 多维度评价
针对现有多点标定方案耗时长和简化标定方案注视精度较差的局限,提出一种眼动跟踪隐式标定方法,使得眼动跟踪系统只需采集少量样本即可建立准确的映射关系。该方法分为3个步骤:首先,标定数据采集,让用户视线跟随动态轨迹运动,记录这一过程中用户眼部图像特征和标定点之间的映射点对。然后,提出合理化的异常值去除方法以自动消除样本噪声,并选择最佳点对集合建立映射模型。对眼动跟踪数据的采集进行延时处理,减少了运动轨迹产生的误差。进一步对样本进行降噪时,排除瞳孔误差数据,并采用随机采样一致算法进一步筛选样本。最后,结合免标定和单点标定这两种方法,在后续标定过程中进一步简化隐式标定过程,并测试了隐式标定的最佳参数。实验表明,在视距为60 cm时,该方法的标定时间为8 s,平均精度为2.0°;在隐式标定原型系统中,对于已标定的用户,通过读取其映射模型,即可免标定地快速获取注视点坐标,所需时间为2 s,平均标定精度为2.47°;对于进行眼动跟踪的新用户,通过单点标定方法计算个体差异补偿模型,获取注视点坐标,所需时间为3 s,平均标定精度为2.49°,进一步提高了该方法的实用性。
图形图像与模式识别
基于改进蚁群算法的轨道缺陷图像分类
曹义亲, 武丹, 黄晓生
计算机科学. 2019, 46 (8): 292-297.  doi:10.11896/j.issn.1002-137X.2019.08.048
摘要 ( 86 )   PDF(2081KB) ( 139 )   
参考文献 | 相关文章 | 多维度评价
针对传统方法分类准确性低、分类速度慢且不同轨道缺陷类型的识别准确性有很大差异的弊端,提出一种新的基于改进蚁群算法的轨道缺陷图像分类方法。对轨道缺陷图像进行预处理,利用竖直投影法对轨道表面区域进行提取,将模糊理论和超熵理论结合在一起获取最佳分割阈值,完成图像分割。结合自适应阈值Canny边缘检测算子和Hough转换法,确定轨道缺陷部分。对缺陷部分的边缘细节进行改进,使轨道缺陷部分的轮廓更加显著。对轨道缺陷特征进行提取,在此基础上分析了基本蚁群算法,针对基本蚁群算法容易陷入局部最优的弊端进行改进,将与特征相似性最高作为判别函数,采用改进蚁群算法对轨道缺陷图像进行分类。实验结果表明,所提方法的分类准确度高,且分类速度快。
基于层级聚类回归模型的人脸超分辨率重建算法
王淑云, 干宗良, 刘峰
计算机科学. 2019, 46 (8): 298-302.  doi:10.11896/j.issn.1002-137X.2019.08.049
摘要 ( 54 )   PDF(6466KB) ( 85 )   
参考文献 | 相关文章 | 多维度评价
人脸超分辨率重建是指从一幅低分辨率人脸图像重建出相应的高分辨率图像的过程。大部分的人脸超分辨率重建算法都假设输入图像是对齐且不含噪声的。当输入的人脸图像为非对齐时,超分辨率重建的性能将降低。为此,提出一种基于学习的层级聚类回归算法,其主要针对非对齐的单帧人脸图像的超分辨率重建。该算法分为两部分:聚类和回归。聚类阶段,将训练样本的尺寸统一成某个小尺寸的人脸图像,用于训练人脸图像字典。该字典的字典原子为聚类中心,对原始的人脸图像进行聚类,得到各个子空间的人脸图像簇。该算法充分利用了人脸结构的先验信息,能获得更准确的聚类结果。在回归阶段,仅需要训练一个全局字典,各个子空间的人脸图像共享这些字典原子。在每个簇内,搜索各个驻点的邻域,以生成对应的邻域子空间。然后,学习低分辨率与高分辨率样本特征之间的映射关系,以得到每个子空间的回归模型。该算法的核心是所有的人脸图像类共享一个全局字典,但对于同一个驻点,在不同的人脸图像簇内,邻域样本各不相同,这样能够更准确地学习局部映射关系。该算法不仅可以缩短训练时间,还可以提高人脸超分辨率重建的质量。对比实验的结果表明,该算法的PSNR至少可以提升0.39dB,SSIM可以提升0.01~0.18。
时空约束下的三维动态模型一致性对应
程志豪, 潘翔, 郑河荣
计算机科学. 2019, 46 (8): 303-309.  doi:10.11896/j.issn.1002-137X.2019.08.050
摘要 ( 46 )   PDF(5063KB) ( 77 )   
参考文献 | 相关文章 | 多维度评价
已有对应算法由于局部几何特征不稳定而存在错误映射。文中针对三维动态数据,提出了时空约束下的一致性对应算法。首先,算法以相邻帧数据的时空一致性为约束条件,结合非刚性变形理论构建能量最小化方程。其次,通过能量方程约束求解得到稀疏对应关系。最后,针对变形跟踪所导致的对应丢失问题,所提算法结合曲面采样和等距映射完成紧密对应。针对不同的三维动态数据进行实验分析和量化比较,结果所提算法明显优于类似的算法。
基于小波与分形相结合的图像压缩编码
张晶晶, 张爱华, 纪海峰
计算机科学. 2019, 46 (8): 310-314.  doi:10.11896/j.issn.1002-137X.2019.08.051
摘要 ( 54 )   PDF(2730KB) ( 125 )   
参考文献 | 相关文章 | 多维度评价
分形图像编码在较高的压缩比下,可以保持较好的重构图质量;但也存在计算复杂度高和编解码时间长的缺点。因此,在定义一种新的子块特征——框点和的基础上,结合连续小波变换的平滑特性,提出了基于小波与分形相结合的图像压缩编码。该算法充分利用子带的相关性来提高重构图像的质量,将全局搜索转换为近邻搜索,缩小了搜索范围,从而减少了编解码时间。仿真实验结果表明,与基本分形算法和其他算法相比,新算法的性能更优,不仅缩短了编解码时间,而且提高了重构图像的质量。
适于移动终端字符识别环境的自适应多阈值二值化方法
朱德利, 杨德刚, 胡蓉, 万辉
计算机科学. 2019, 46 (8): 315-320.  doi:10.11896/j.issn.1002-137X.2019.08.052
摘要 ( 61 )   PDF(2338KB) ( 94 )   
参考文献 | 相关文章 | 多维度评价
为了解决移动终端字符识别应用中光照不均匀、环境不可控而导致的图像二值化效果不佳的问题,提出一种基于积分图快速计算的多阈值自适应二值化方法。该方法首先以待求点为中心设置一个特定尺寸的滑窗,计算该滑窗内所有点的均值,再根据高斯函数加权计算当前滑窗的两个前置滑窗的均值。设置均值松弛因子来衡量当前点的光照情况。像素点的松弛阈值依据该点的松弛因子和光照情况的评价综合计算获得。以Lenovo ZUK Z2 Pro作为实验设备,在Android操作系统中编写程序,进行文字识别精度的测试。所提算法对前景划分的平均召回率为95.5%,平均准确率为91%。调用Tesseract 4.0的原生OCR识别引擎进行验证,在不规则阴影、多层次光照、线性光线变化等环境下,算法的文字识别准确率分别为96.8%,98.2%和93.2%,高于其他预处理算法。所提算法具有较强的鲁棒性和自适应能力,能满足移动终端字符识别应用的图像预处理要求。
一种医学肾动态显像自动化定量评估方法
柴锐, 薛凡, 曾建潮, 秦品乐
计算机科学. 2019, 46 (8): 321-326.  doi:10.11896/j.issn.1002-137X.2019.08.053
摘要 ( 54 )   PDF(2555KB) ( 48 )   
参考文献 | 相关文章 | 多维度评价
目前,临床上肾动态显像评估肾功能的方法过多依赖于手动获取感兴趣区域(Region of Interest,ROI),时间效率较低。针对这一问题,提出一种肾动态显像自动化定量评估的方法。首先,对肾动态显像不同阶段的图像进行预处理;其次,利用改进水平集模型获取肾功能成像中肾脏的ROI,并通过形态学方法得到本底ROI,再对肾血流灌注成像中主动脉的ROI进行定位和获取;最后,结合Gates法计算分肾、总肾的肾小球滤过率(Glomerular Filtration Rate,GFR),根据ROI区域内的放射性计数绘制时间-放射性曲线,实现一体化、自动化的肾功能评估。临床实验结果表明,所提自动化评估方法能够在较短的时间内提升自动化水平,并提高评估精度,该方法可以为临床诊断和辅助治疗提供有效帮助。
Retinex自适应反射分量估计和对数图像处理减法后处理的
潘卫琼, 涂娟娟, 干宗良, 刘峰
计算机科学. 2019, 46 (8): 327-331.  doi:10.11896/j.issn.1002-137X.2019.08.054
摘要 ( 76 )   PDF(3091KB) ( 70 )   
参考文献 | 相关文章 | 多维度评价
在夜间采集到的图像由于受强灯光的影响,对比度较大,白天采集到的背光图像也是如此。对比度增强算法是常用的获得良好对比度图像的方法,但是这往往会造成亮区域过度增强的现象。为了解决对比度较大的这部分图像过度增强的问题,提出了一种基于Retinex自适应反射分量估计和对数图像处理减法后处理的低照度图像增强算法,该算法分为两部分:反射分量估计,基于对数图像处理减法(LIPS)模型的对比度增强。首先,用自适应双边滤波器代替传统的高斯滤波器来获得更精准的照明层。然后,根据最小可觉差(JND)阈值得到一个自适应因子来为对数域的照明分量加权,从而估计出图像的反射分量。这种方法可以有效防止高亮度区域的过度增强。最后,将基于标准偏差最大化的LIPS方法作用在反射层以增强图像的对比度,其中LIPS的参数范围由反射图像的累积分布函数(CDF)来确定。实验结果表明,文中所提算法在主观评价以及客观评价方面都优于其他对比算法。
基于改进YOLO v2的船舶目标检测方法
于洋, 李世杰, 陈亮, 刘韵婷
计算机科学. 2019, 46 (8): 332-336.  doi:10.11896/j.issn.1002-137X.2019.08.055
摘要 ( 155 )   PDF(1909KB) ( 120 )   
参考文献 | 相关文章 | 多维度评价
针对船舶图像目标检测中存在的小目标检测准确率低、系统鲁棒性差的问题,提出一种改进的YOLO v2算法对船舶图像目标进行检测。通过目标框维度聚类、网络结构改进、输入图像多尺度变换等方法对传统YOLO v2算法进行改进,使其能够更好地适应船舶目标检测任务。测试结果表明,在输入图像尺寸为416×416时,该算法的平均精确率(mean Average Precision,mAP)达到79.1%,检测速度为64帧/s(Frames Per Second,FPS)。所提方法可满足实时检测的需要,且具有小目标检测精度高、鲁棒性强的特点。
基于免疫平衡机制的故障检测方法
肖振华, 梁意文, 谭成予, 周雯
计算机科学. 2019, 46 (8): 337-341.  doi:10.11896/j.issn.1002-137X.2019.08.056
摘要 ( 45 )   PDF(1408KB) ( 48 )   
参考文献 | 相关文章 | 多维度评价
针对现有的树突状细胞算法(Dendritic Cell Algorithm,DCA)在故障检测的应用中严重依赖领域知识和人工经验定义抗原信号,且单个抗原的异常评价方式无法反映系统的整体健康状况的问题,提出了一种基于免疫平衡机制的故障检测方法——IHDC-FD。首先,引入机体免疫平衡机制,将打破平衡的变化认为是系统危险的产生源,解决在实际应用中危险信号定义不明确的问题,通过数值微分方法从系统状态变化中提取抗原信号,实现DC抗原信号的自适应提取。然后,机体组织内特定细胞的浓度才是能够反映身体是否健康的关键因素,为了保证身体健康就必须维持机体免疫平衡,因此,通过借鉴机体免疫平衡的激活机制和抑制机制,将维持免疫平衡的Th和Ts细胞浓度作为系统是否失衡的评判指标,一旦系统失衡就判定有故障产生。最后,在TE基准仿真平台上采用阶跃、随机和慢漂移故障进行性能测试,并与原DCA算法进行比较。实验结果表明,IHDC-FD不仅提高了原DCA算法的适应性,而且将3种类型故障的平均检测率提高了9.93%,误报率降低了230.4%,检测延时减少了101.2%。因此,基于免疫平衡机制的IHDC-FD方法在检测性能和适应性上比原DCA有很大的提升,具有可行性和一般性。