计算机科学

吴雨茜, 王俊丽, 杨丽, 余淼淼

计算机科学. 2019, 46 (5): 1-12. doi:10.11896/j.issn.1002-137X.2019.05.001

摘要 ( 1561 )

PDF(1632KB) ( 4724 )

参考文献 | 相关文章 | 多维度评价

代价敏感(cost-sensitive)学习方法能够有效缓解分类任务中的数据不平衡问题,已经被成功应用于各种传统机器学习技术中。随着深度学习技术的不断发展,代价敏感方法重新成为了研究热点。将深度学习与代价敏感方法相结合,不仅能够突破传统机器学习技术的限制,同时能够提高模型对数据的敏感性和分类的准确性,尤其是当数据中存在一定的不平衡性时。然而,如何有效地将两者进行结合成为了研究的重点和难点。研究学者从网络结构、损失函数和训练方法等多方面入手,不断提高深度学习结合代价敏感方法模型的性能。文中针对深度学习与代价敏感方法相结合的发展历程进行详细阐述,对几种具有创新性的模型进行了分析,并对比了模型的分类性能,最后对深度学习与代价敏感方法相结合的发展趋势进行了探讨。

并发缺陷检测技术研究进展

薄莉莉, 姜淑娟, 张艳梅, 王兴亚, 于巧

计算机科学. 2019, 46 (5): 13-20. doi:10.11896/j.issn.1002-137X.2019.05.002

摘要 ( 1245 )

PDF(1342KB) ( 1961 )

参考文献 | 相关文章 | 多维度评价

多核时代的到来使得并发程序的设计备受人们关注。然而,并发程序的并发性和不确定性容易引发并发缺陷。因此,快速且有效地检测出这些并发缺陷尤为重要。首先,将目前常见的并发缺陷分为五大类(并发类型状态缺陷、死锁、数据竞争、原子性违背和顺序违背);随后,从软件运行的角度,将现有的并发缺陷检测技术分为静态分析、动态分析和动静结合分析,并对每一类进行详细的分析、比较和总结;接着,对并发缺陷检测技术的通用性进行分析和总结;最后,从通用准确的并发缺陷检测、软硬件相结合的并发缺陷检测、并发缺陷检测修复一体化、适用于松散内存模型的并发缺陷检测、安卓等其他应用平台的并发缺陷检测和分布式系统非确定性并发缺陷研究等方面,对并发缺陷检测技术的未来研究进行了探讨。

同步数据流语言可信编译器的研究进展

杨萍, 王生原

计算机科学. 2019, 46 (5): 21-28. doi:10.11896/j.issn.1002-137X.2019.05.003

摘要 ( 806 )

PDF(1478KB) ( 1764 )

参考文献 | 相关文章 | 多维度评价

同步数据流语言(如Lustre,Signal)近年来在航空、高铁、核电等安全关键领域得到了广泛应用,因此与这类语言相关的开发工具本身的安全性问题受到高度关注。同步数据流语言到串行命令式语言的可信编译器是此类工具的典型代表(如Scade)。构造可信编译器的途径可分为两大类:一类是传统的方法,例如通过大量测试和严格的过程管理等手段来实现;另一类是通过形式化方法,例如直接对编译器本身进行形式化证明,采用翻译确认的方法等。近年来,形式化方法作为构造和验证可信编译器的关键途径而得到广泛的重视,有望最大限度地解决“误编译”问题,因而成为新的研究热点。文章在介绍可信编译器的形式化构造和验证方法的基础上,特别聚焦于同步数据流语言可信编译器的相关研究工作,对其现状进行综述和分析。

区块链应用中的隐私保护策略研究

董贵山, 陈宇翔, 范佳, 郝尧, 李枫

计算机科学. 2019, 46 (5): 29-35. doi:10.11896/j.issn.1002-137X.2019.05.004

摘要 ( 960 )

PDF(2040KB) ( 2612 )

参考文献 | 相关文章 | 多维度评价

近年来,人们对身份管理系统和以用户为中心的自主权身份提出了越来越多的隐私保护需求。区块链作为解决数据隐私安全问题的重要手段,被越来越多的应用所使用。本文针对区块链应用中的隐私保护问题,首先研究了当前主流加密代币使用的隐私保护策略,包括匿名处理发送方、接收方和内容等环节,设置区块链的访问权限,创新侧链和支付通道等方法,分类存储数据等;然后分析了各隐私保护策略的效率、侧重点及应用前景,并重点分析了零知识证明对基于区块链的分布式应用的重要性;最后对智能合约、身份管理、供应链等实践领域的隐私保护策略进行介绍分析,并提出对未来方向的展望。

高通量测序中序列拼接算法的研究进展

周卫星, 石海鹤

计算机科学. 2019, 46 (5): 36-43. doi:10.11896/j.issn.1002-137X.2019.05.005

摘要 ( 610 )

PDF(1445KB) ( 2669 )

参考文献 | 相关文章 | 多维度评价

高通量测序(High-throughput Sequencing,HTS)技术是继第一代测序技术之后发展起来的一种新型测序方式,又被称为下一代测序技术。与第一代测序技术中采用基于Sanger方法的自动、半自动毛细管测序方法不同,高通量测序技术采用了基于焦磷酸测序的并行测序技术,是对传统测序技术的一项重要技术突破,它不仅克服了第一代测序技术高成本、低通量、低速度的缺点,而且能满足现代分子生物学和基因组学快速发展的需求,达到低成本、高通量以及快速的目的。相较于第一代测序数据,高通量测序数据具有典型的长度短、覆盖度不均匀以及准确率低的特点,同时第三代测序技术虽保持了高通量测序技术边测序边合成的思想,但采用了更为高效的单分子实时测序技术和纳米孔测序技术,具有高通量、低成本和测序数据长的优势。因此,要获得完整的全基因组基因序列,生物学家就需要使用一种技术将短测序reads拼装成一条完整的基因单链序列。在这种情况下,序列拼接算法应运而生。首先,介绍了序列拼接算法的发展背景以及高通量测序技术的相关概念,分析了高通量测序技术在序列拼接算法中所具有的优势;其次,通过总结序列拼接算法的发展成果,按基于greedy策略、基于Overlap-Layout-Consensus (OLC)策略和基于De Bruijn Graph (DBG)策略的分类对序列拼接算法进行阐述;最后,探讨了序列拼接算法的相关研究方向和发展趋势。

无线传感器节点工作模式转换策略优化模型

赵宁博, 刘伟, 罗嵘, 胡顺仁

计算机科学. 2019, 46 (5): 44-49. doi:10.11896/j.issn.1002-137X.2019.05.006

摘要 ( 472 )

PDF(1900KB) ( 1071 )

参考文献 | 相关文章 | 多维度评价

控制无线传感器节点的工作模式转换可提高能效,但现有控制策略人工干预较多,且缺少评估能效的指标。结合有限状态机和强化学习算法建立了对模式转换进行控制决策的模型;在此基础上,使用能耗、单位能耗的数据吞吐量两个量化指标,构建了收益差分矩阵以评价转换策略的优劣,构造特征函数并描述其能效,建立了优化模型。通过同样数量的工作模式组合和不同数量的工作模式组合两个层次,对不同转换策略进行了评价。与一般控制策略相比,该模型在降低约57%能耗的同时,只损失了约14%的数据吞吐量,相对于其他研究,其降低了更多能耗,能够延长节点寿命,为节点工作模式控制提供模型支持和理论指导。

基于压缩感知的两阶段多目标定位算法

李秀琴, 王天荆, 白光伟, 沈航

计算机科学. 2019, 46 (5): 50-56. doi:10.11896/j.issn.1002-137X.2019.05.007

摘要 ( 541 )

PDF(2873KB) ( 1421 )

参考文献 | 相关文章 | 多维度评价

针对传感器网络中基于接收信号强度(Received Signal Strength,RSS)的多目标定位具有天然稀疏性的问题,提出了基于压缩感知的两阶段多目标定位算法,该算法将基于网格的多目标定位问题分解为粗定位和细定位两个阶段。粗定位阶段,根据序贯压缩感知原理确定最优观测次数,然后利用l_p最优化问题重构出目标所在的初始候选网格;细定位阶段,由四分法不断划分候选网格,根据最小残差原则估计目标在候选网格中的确切位置。仿真结果表明,相较于传统的基于l₁最优化的多目标定位算法,基于压缩感知的两阶段多目标定位算法在目标个数未知的场景下具有更优的定位性能,且明显减少了定位时间。

机会网络中基于节点相遇间隔的缓存管理策略

张峰

计算机科学. 2019, 46 (5): 57-61. doi:10.11896/j.issn.1002-137X.2019.05.008

摘要 ( 442 )

PDF(1851KB) ( 1036 )

参考文献 | 相关文章 | 多维度评价

采用存储-携带-转发方式的机会网络不考虑消息在传递过程中经历节点与目的节点的相遇概率,对消息传播状态的估计结果存在较大误差。文中提出一种基于节点相遇间隔的缓存管理策略,利用节点相遇间隔服从指数分布的特性,结合消息在网络中的副本数量,估计出消息的平均投递概率。在节点缓存溢出时,根据估算的消息投递概率对缓存中的消息进行排序,优先删除投递概率低的消息,达到缓存管理的目的。仿真结果表明,使用该方法对节点缓存进行管理,在提高网络中消息投递成功率的同时,有效降低了消息的平均投递延迟和网络负荷。

H2H/M2M共存场景下基于图论的干扰协调机制

随楠楠, 徐友云, 王聪, 谢威, 朱赟

计算机科学. 2019, 46 (5): 62-66. doi:10.11896/j.issn.1002-137X.2019.05.009

摘要 ( 644 )

PDF(2328KB) ( 1113 )

参考文献 | 相关文章 | 多维度评价

针对H2H/M2M共存的LTE-A全频复用异构蜂窝网络,提出基于最大独立集的干扰协调和RB扩展分配算法(CGMMIS算法),以在保证RB分配连续性的前提下优化系统和速率。首先,基于节点之间的相对干扰强度构建干扰图。然后,CGMMIS算法将存在强干扰的节点分到不同的独立集中,同时最大化独立集内各节点的信道增益之和。最后,利用RB扩展分配算法保证RB分配连续性,使得节点仅选择使其可达速率最大的独立集。仿真结果表明,在M2M设备密集部署的场景下,CGMMIS算法的系统和速率明显优于非协同算法和基于着色的最大独立集随机搜索算法。

基于不规则划分的K级区域覆盖增强算法

蒋一波, 何成龙, 梅佳东, 汪念华

计算机科学. 2019, 46 (5): 67-72. doi:10.11896/j.issn.1002-137X.2019.05.010

摘要 ( 657 )

PDF(4737KB) ( 1230 )

参考文献 | 相关文章 | 多维度评价

在深入分析和比较现有的减少传感器节点启动数量的K级区域覆盖算法的基础上,利用节点感应区域边界来划分整个监控区域,引入扫描法来快速判断节点感应区域内的基本分割单元集合,设计了节点权重函数用于判别启动的先后顺序,基于环境变量和随机分布策略等因素选择一个节点优先启动,随后该节点带动周围邻居节点启动,从而实现整个监控区域的K级覆盖。在此分析的基础上,进一步提出了不规则划分区域覆盖增强算法。一系列仿真实验结果表明:该算法可以减少传感器节点的启动数量,实现监控区域的K级覆盖。

一种基于超立方体网络的高效故障诊断并行算法

郭杨, 梁家荣, 刘峰, 谢敏

计算机科学. 2019, 46 (5): 73-76. doi:10.11896/j.issn.1002-137X.2019.05.011

摘要 ( 687 )

PDF(1397KB) ( 1210 )

参考文献 | 相关文章 | 多维度评价

超立方网络是一种重要的网络拓扑结构。针对现有的超立方网络故障诊断算法复杂度高的问题,引入故障扇的概念,采用并行深度优先搜索策略设计算法,通过算法寻找超立方体网络中的故障扇,确定该网络的故障节点,以便替换或修复,为增强网络的可靠性提供了一条重要的新途径。最后对所提算法的复杂性进行了分析,证明了该算法的时间复杂度不超过O(N),远优于现有复杂度超过平方级的算法。

基于自适应调整策略灰狼算法的DV-Hop定位算法

孙博文, 韦素媛

计算机科学. 2019, 46 (5): 77-82. doi:10.11896/j.issn.1002-137X.2019.05.012

摘要 ( 644 )

PDF(1547KB) ( 1046 )

参考文献 | 相关文章 | 多维度评价

针对无线传感器网络传统距离-矢量(DV-Hop)算法中最小二乘法估计误差过大的问题,提出了一种改进灰狼优化(Grey Wolf Optimization,GWO)算法与DV-Hop融合的算法。首先,利用传统的DV-Hop算法估算出信标节点与各未知节点间的距离。其次,用具有自适应策略的改进GWO算法代替最小二乘法来估算未知节点的位置,所做改进包括初始化狼群个体时引入佳点集,以提高初始种群的遍历性;为了加快种群位置的更新速度,对控制参数a采取自适应调整策略,并根据α,β和σ的适应度值加权更新种群位置。最后,采取镜像策略对估算出的越界节点进行处理。实验结果表明,相比于传统DV-Hop算法、文献[1]的算法和文献[2]的算法,所提算法的定位精度更高,稳定性更好。

面向Android第三方库的共谋行为检测

张婧, 李瑞轩, 汤俊伟, 韩洪木, 辜希武

计算机科学. 2019, 46 (5): 83-91. doi:10.11896/j.issn.1002-137X.2019.05.013

摘要 ( 711 )

PDF(1795KB) ( 1432 )

参考文献 | 相关文章 | 多维度评价

第三方库是安卓应用重要的组成部分,应用开发者往往会引入一些具有特定功能的第三方库进行快速开发。针对Android第三方库中存在的共谋风险,提出了面向Android第三方库的共谋行为检测的研究。Android第三方库与应用属于不同的利益体,隐藏在第三方库中的通信行为可以视为应用共谋的一种特殊情况,同样会引发权限提升、组件劫持、性能消耗等恶意行为,这些行为可以引起过多的系统消耗,甚至是引发安全威胁。文中对近些年来国内外学者在该研究领域取得的成果进行了系统总结,给出了研究的共谋定义,并对Android第三方库共谋行为可能产生的风险威胁进行了分析。然后详细介绍了安卓第三方库共谋行为检测的设计方案。针对测试集中的29个第三方库的实验表明,所提设计方案的精确率达到了100%,召回率为89.66%,F-measure值为0.945;同时,本实验还对下载的1207个第三方库进行了分析,对41个国内著名的第三方库非敏感信息共谋行为导致的资源消耗情况进行了验证。最后,对工作进行了总结,并对未来研究进行了展望。

一种改进主动学习的恶意代码检测算法

李翼宏, 刘方正, 杜镇宇

计算机科学. 2019, 46 (5): 92-99. doi:10.11896/j.issn.1002-137X.2019.05.014

摘要 ( 542 )

PDF(3084KB) ( 1548 )

参考文献 | 相关文章 | 多维度评价

传统的恶意代码检测技术依赖于大量的已标记样本,然而新出现的恶意代码的标记数量往往较少,使得传统的机器学习检测方法难以取得较好的检测效果。针对该问题,研究了一种改进主动学习的恶意代码检测算法,提出了基于最大距离(Maximum Distance)的样本选择策略和基于最小估计风险(Minimum Risk Estimate)的样本标记策略,实现了已标记样本较少情况下的恶意代码检测。实验结果显示,相比于未使用主动学习的方法,该算法的总体检测效果更好,在已标记样本数量占比为10%的情况下,其比随机选择策略的主动学习的效果更好,在时间性能上比人工标记策略的主动学习效果更好。

D2D通信链路中基于时间反演的反窃听物理层传输方案

李方伟, 周嘉维, 张海波

计算机科学. 2019, 46 (5): 100-104. doi:10.11896/j.issn.1002-137X.2019.05.015

摘要 ( 630 )

PDF(1662KB) ( 1002 )

参考文献 | 相关文章 | 多维度评价

针对D2D用户间通信信息容易被窃听的物理层安全问题,提出了一种基于时间反演(Time-Reversal,TR)技术提升安全速率的传输方案。首先,创建了多输入单输出(Multiple Input Single Output,MISO)窃听信道模型,在D2D通信链路上运用TR技术,利用其时空聚焦特性,提高了通信链路的安全速率。然后,设计了一种干扰协作机制来保障系统的安全速率,在该机制中建立了Stackelberg博弈拍卖模型,以保障干扰用户对D2D用户提供帮助,并证明了该博弈模型纳什均衡(NE)的存在性。最后,通过仿真表明,与已有的物理层传输方案相比,所提安全传输方案有效地提高了安全速率性能。

基于状态事件故障树的信息物理融合系统风险建模

徐丙凤, 何高峰, 张黎宁

计算机科学. 2019, 46 (5): 105-110. doi:10.11896/j.issn.1002-137X.2019.05.016

摘要 ( 448 )

PDF(1586KB) ( 1216 )

参考文献 | 相关文章 | 多维度评价

信息物理融合系统(Cyber-physical Systems)中嵌入式系统网络的应用使其容易遭受网络攻击,攻击者可能会利用软件和通信组件中的漏洞获取系统的控制权,从而导致系统失效。现有的信息物理融合系统安全风险建模方法主要基于静态故障树进行,不考虑软件控制系统特有的动态性和时序依赖性,无法推导出网络攻击所导致的最终影响。因此,文中基于状态事件故障树提出一种信息物理融合系统风险建模方法。首先,针对状态事件故障树(Stata/Event Fault Trees,SEFTs)模型进行攻击步骤集成,提出Attack-SEFTs模型;在此基础上,给出信息物理融合系统的常见漏洞模式,并基于Attack-SEFTs对各种漏洞模式进行建模;接着,给出Attack-SEFTs模型的失效路径分析方法;最后通过一个案例说明了所提方法的可行性。

采用深度学习的DGA域名检测模型比较

裴兰珍, 赵英俊, 王哲, 罗赟骞

计算机科学. 2019, 46 (5): 111-115. doi:10.11896/j.issn.1002-137X.2019.05.017

摘要 ( 878 )

PDF(1273KB) ( 1812 )

参考文献 | 相关文章 | 多维度评价

针对DGA域名难以检测的问题,构建了一种面向字符的采用深度学习的DGA域名检测模型,模型由字符嵌入层、特征检测层和分类预测层组成。字符嵌入层实现对输入DGA域名的数字编码;特征检测层采用深度学习模型自动提取特征;分类预测层采用全连接网络进行分类预测。为了选取最优的特征提取模型,分析比较了采用Bidirectional机制、Stack机制和Attention机制的LSTM模型与GRU模型,CNN模型,以及将CNN模型分别与LSTM模型和GRU模型相组合的模型。结果表明,与LSTM和GRU模型相比,采用Stack机制、前向Attention机制结合Bidirectional机制的LSTM和GRU模型,CNN模型,CNN模型与LSTM和GRU相组合的模型可提升模型的检测效果,但采用CNN和Bi-GRU组合构建的DGA域名检测模型可获得最优的检测效果。

高性能网络安全告警信息的关联分析方法

付泽强, 王晓锋, 孔军

计算机科学. 2019, 46 (5): 116-121. doi:10.11896/j.issn.1002-137X.2019.05.018

摘要 ( 687 )

PDF(1895KB) ( 1296 )

参考文献 | 相关文章 | 多维度评价

在网络安全防御体系中,入侵检测系统会实时产生海量冗余、错误的网络安全告警信息,因此有必要对告警信息的关联规则和序列模式进行频繁项模式挖掘,分辨正常的行为模式,筛选出真正的攻击信息。相对于Apriori和FP-growth等算法,COFI-tree算法虽然具有较大的性能优势,但仍无法满足大规模网络安全信息快速分析的需求。为此,基于COFI-tree算法,提出了一种改进的网络安全告警信息关联分析算法。该算法通过基于倒序链表的头表节点寻址方式和基于新的SD结构的频繁项处理方法,提升了COFI-tree算法的性能。基于Kddcup99数据集的实验结果表明,与传统的Cofi算法相比,该方法在基本保证准确率的同时,能大量降低计算开销,使处理时间平均缩短21%以上,解决了在海量网络告警信息下进行关联分析时速率不高的问题。

基于预先缓存的连续查询隐私保护机制

顾一鸣, 白光伟, 沈航, 胡煜家

计算机科学. 2019, 46 (5): 122-128. doi:10.11896/j.issn.1002-137X.2019.05.019

摘要 ( 529 )

PDF(1778KB) ( 1140 )

参考文献 | 相关文章 | 多维度评价

位置数据带来了巨大的经济效益,但位置隐私泄露的问题也随之而来。针对连续R-range查询中遭到的最大移动边界(Maximum Movement Boundary,MMB)攻击问题,提出一种基于预先缓存的隐私保护机制。首先,提出伪随机泛化方法,以在保证位置隐私的基础上控制快照查询的泛化区域;接着,在该泛化查询区域内预测即将到达的路口,利用路口位置计算并预先缓存下一泛化查询区域。预先缓存的方法降低了连续查询间的时间关联,并提高了隐私保护水平。性能分析和实验结果表明,所提隐私保护机制能有效地减少最大移动边界攻击带来的隐私泄露问题。

基于拓扑扩展的在线社交网络恶意信息源定位算法

袁得嵛, 高见, 叶萌熙, 王小娟

计算机科学. 2019, 46 (5): 129-134. doi:10.11896/j.issn.1002-137X.2019.05.020

摘要 ( 446 )

PDF(2086KB) ( 1346 )

参考文献 | 相关文章 | 多维度评价

随着在线社交网络的飞速发展,社交媒体成为网络用户参与的主要平台。恶意信息常常隐藏于在线社交网络的海量数据中,加之拓扑结构的局部性、恶意信息的伪装性,定位和溯源恶意信息面临着很大困难。一方面,仅仅通过人工标注的方式难以实现全局监控,即使借助语义分析、信息搜索等方式也只能在识别热点后获取当前网络中的信息“碎片”;另外,信息在演变过程中的变异,使得一条传播链条会中断分裂为多条,不加以识别和区分会增加信息源头数目,大大增加溯源定位的算法复杂度。另一方面,恶意信息常采用伪装手法,如提供虚假的要素、制造热点吸引用户、水军炒作干扰视线等,使得信息拓扑和网络关系拓扑并不一致。原有的定位算法依赖于当前感染节点的分布和当前拓扑,感染状态从单一化向随机化的变化,使得统计推断框架更复杂,需要改进非观测节点的状态推断方法。在线社交网络的信息传播过程中,信息的传播关系常常附加在信息本身中,可以根据当前网络节点的状态挖掘隐藏信息。结合当前网络节点的状态,提出关系拓扑和信息拓扑的概念,并设计基于信息拓扑的候选源点扩展算法。在此基础上,文中提出基于Jordan中心的恶意信息溯源算法。在模型网络和实际网络上的实验表明,相对于对比算法,所提算法能够有效识别出恶意信息源。

基于语义的特征模型重构方法

张力生, 张悦, 雷大江

计算机科学. 2019, 46 (5): 135-142. doi:10.11896/j.issn.1002-137X.2019.05.021

摘要 ( 520 )

PDF(1816KB) ( 1016 )

参考文献 | 相关文章 | 多维度评价

在软件产品线的领域工程开发中,特征模型被广泛用于捕获和组织领域的可复用需求。目前,构建特征模型大多依赖于建模人员的分析,而随着领域需求的日益复杂,构建满足需求的特征模型不仅会增加建模人员的工作量,还会使特征模型的正确性降低。为解决不同特征模型之间建模词汇不统一的问题,提出一种分析特征语义并为语义定义术语的方法。为有效地重构特征模型,提出一种采用描述逻辑语言定义半自动化的重构方法,该重构方法可以推理模型的一致性。基于两个特征模型实例对提出的方法进行验证,实验结果表明该方法可以重构特征模型,并且可以检验重构的特征模型的一致性。

基于RDD非序列化本地存储的Spark存储性能优化

赵俊先, 喻剑

计算机科学. 2019, 46 (5): 143-149. doi:10.11896/j.issn.1002-137X.2019.05.022

摘要 ( 505 )

PDF(1501KB) ( 1334 )

参考文献 | 相关文章 | 多维度评价

Spark框架被越来越多的企业用作大数据的计算框架,但随着现有服务器的可用内存资源增加,Spark并不能与新环境相匹配。Spark运行在Java虚拟机上,随着堆空间内存被大量使用,Java虚拟机通过回收内存来为新对象提供空间(垃圾回收机制,GC)的时间开销占Spark作业总耗时的比例显著增加,但Spark作业的效率并未随着可用内存的增加而保持一定比例的提升。在使用非堆(本地)内存存储模式后,GC开销问题得以缓解,但缓存数据的序列化开销成为新的矛盾点。文中利用本地存储方式解决GC问题,同时通过减少序列化开销以加快作业速度,提出并修改了Spark的存储结构,改进了RDD的淘汰机制和缓存方式,将去序列化的数据引入到本地内存中,在保持较低的垃圾回收开销的同时,降低了序列化的开销。实验结果表明,与原Spark的堆上存储方式相比,非序列化的本地存储方法在单结点、大内存的服务器上的GC时间缩短到5%~30%,同时,序列化开销显著降低,吞吐量得到提升,作业耗时缩短8%以上。

DFTS:面向大数据集的Top-k Skyline查询算法

魏亮, 林子雨, 赖永炫

计算机科学. 2019, 46 (5): 150-156. doi:10.11896/j.issn.1002-137X.2019.05.023

摘要 ( 677 )

PDF(1524KB) ( 1169 )

参考文献 | 相关文章 | 多维度评价

Top-k Skyline查询结合了Top-k与Skyline的特性,可以在数据集中找到最好的点。但是,现有的算法在大数据环境下具有较高的时间开销。文中提出一种新的算法DFTS,其可以高效地在大数据集中进行Top-k Skyline查询。DFTS包括3个步骤:首先,利用度值评价函数对数据集进行排序,快速过滤掉大量的点,仅保留足够少的候选集;然后,对候选集进行Skyline查询计算,进一步排除掉Skyline集合外的点;最后,筛选出Top-k的数据点作为最终结果。通过这种方式,DFTS有效减少了算法的运行时间。从理论上证明了DFTS查询的最终结果符合Top-k Skyline查询的要求。基于大数据集的大量实验表明,DFTS具有比现有算法更好的性能。

基于DTW相似判定的周期性时间序列预测方法

李文海, 程佳宇, 谢晨阳

计算机科学. 2019, 46 (5): 157-162. doi:10.11896/j.issn.1002-137X.2019.05.024

摘要 ( 644 )

PDF(1819KB) ( 1943 )

参考文献 | 相关文章 | 多维度评价

针对大样本下周期性时间序列预测的问题,文中给出了一种基于DTW距离的相似样本度量方法。首先,给出周期性时间序列预测问题的定义,并基于支持向量回归方法分析大量噪声点对预测误差的影响。然后,通过对时间序列周期分段来构建相似性度量,在给定预测样本容量下确定给定预测条件的相似样本子集。同时,基于误差调谐函数对SVM的核函数进行调整,以进一步提升预测精度。最后,基于常用的周期性时间序列,在预测精度上将所提方法与已有算法进行实验比较,并分析该模型的参数敏感性。实验结果验证了所提方法的有效性。

多输出直觉模糊最小二乘支持向量回归算法

王定成, 陆一祎, 邹勇杰

计算机科学. 2019, 46 (5): 163-168. doi:10.11896/j.issn.1002-137X.2019.05.025

摘要 ( 425 )

PDF(2071KB) ( 1043 )

参考文献 | 相关文章 | 多维度评价

支持向量机回归是一种重要的机器学习算法,虽然已成功应用于多个领域,但针对复杂系统,单输出支持向量回归算法的训练时间过长并且缺乏实用性。多输出直觉模糊最小二乘支持向量回归(Intuitionistic Fuzzy Least Squares Support Vector Regression,IFLS-SVR)在多输出支持向量机的基础上引入了直觉模糊,解决了不确定多输出复杂系统问题,减少了训练时间。生活中复杂的多输出模型更为常见,文中在传统支持向量回归的基础上对其进行改进,提出多输出IFLS-SVR模型。多输出IFLS-SVR采用直觉模糊算法将实际数据转化为模糊数据,将二次规划优化问题转化为求解一系列线性方程组。与现有的模糊支持向量回归相比,多输出IFLS-SVR采用直觉模糊方法来计算隶属度函数,采用最小二乘法提高了算法的训练效率,减少了训练时间,获得了更精确的解。仿真结果表明,与其他方法相比,多输出IFLS-SVR取得了较好的效果。最后将多输出IFLS-SVR模型应用于复杂的风速风向预测,也取得了较好的效果。

基于视觉注意力机制的异步优势行动者-评论家算法

李杰, 凌兴宏, 伏玉琛, 刘全

计算机科学. 2019, 46 (5): 169-174. doi:10.11896/j.issn.1002-137X.2019.05.026

摘要 ( 534 )

PDF(1552KB) ( 1286 )

参考文献 | 相关文章 | 多维度评价

异步深度强化学习能够通过多线程技术极大地减少学习模型所需要的训练时间。然而作为异步深度强化学习的一种经典算法,异步优势行动者-评论家算法没有充分利用某些具有重要价值的区域信息,网络模型的学习效率不够理想。针对此问题,文中提出一种基于视觉注意力机制的异步优势行动者-评论家模型。该模型在传统异步优势行动者-评论家算法的基础上引入了视觉注意力机制,通过计算图像各区域点的视觉重要性值,利用回归、加权等操作得到注意力机制的上下文向量,从而使Agent将注意力集中于面积较小但更具丰富价值的图像区域,加快网络模型解码速度,更高效地学习近似最优策略。实验结果表明,与传统的异步优势行动者-评论家算法相比,该模型在基于视觉感知的决策任务上具有更好的性能表现。

基于改进卷积神经网络的短时公交客流预测

陈深进, 薛洋

计算机科学. 2019, 46 (5): 175-184. doi:10.11896/j.issn.1002-137X.2019.05.027

摘要 ( 620 )

PDF(1515KB) ( 1964 )

参考文献 | 相关文章 | 多维度评价

针对城市公交客流存在随机性、时变性和不确定性的问题,文中提出了一种基于无监督特征学习理论和改进卷积神经网络的短时公交站点客流预测模型,以为市民提供实时、准确、有效的公交出行服务。运用无监督学习的方法对公交客流出行特征表达进行提取,利用大量已有数据集描述不同日期、不同时间段的短时客流的特征表达。为了防止和减少过拟合现象,运用改进卷积神经网络 DropSample训练方法构造一个高效且高可信度的模型预测系统。在训练过程中,使用Adam算法的优化器对模型进行优化,更新网络模型参数,为自适应性学习率设置不同的参数。利用公交客流算法模型对广州实际公交站点的客流进行预测,实验结果表明:改进CNN网络模型的均方根误差为229.539,平均绝对百分比误差为0.117,相比于CNN网络模型、多元线性回归模型、卡尔曼滤波模型和BP神经网络模型,该模型的预测精度和可靠性更高。实例证明所提方法的预测误差更小,改进模型和算法具有实用性和可靠性。

融合深度学习和因子分解机的兴趣点签到预测研究

苏畅, 彭劭闻, 谢显中, 刘宁宁

计算机科学. 2019, 46 (5): 185-190. doi:10.11896/j.issn.1002-137X.2019.05.028

摘要 ( 488 )

PDF(2406KB) ( 1319 )

参考文献 | 相关文章 | 多维度评价

基于位置的社交网络(Location-Based Social Networks,LBSN)为用户提供基于位置的服务,允许移动用户在社交网络中共享各自的位置以及与位置相关的信息。签到预测研究已经成为LBSN的重要且非常具有挑战性的任务。目前的预测技术大部分集中在以用户为中心的签到预测研究,而针对兴趣点签到预测的研究很少。文中主要研究以特定兴趣点为中心的签到预测。由于数据存在极端稀疏性的问题,运用传统的模型很难从数据中挖掘出用户的潜在签到规律。针对以特定兴趣点为中心的签到预测问题,提出了一种结合因子分解机和深度学习的新型网络模型(TSWNN),该模型融合了时间特征、空间特征、天气特征,基于因子分解机的思想处理高维稀疏向量,并采用全连接的隐藏层以挖掘用户在兴趣点的潜在签到行为模式,预测特定兴趣点的签到情况。在两个经典的LBSN数据集Gowalla和Brightkite上的实验结果表明了所提模型的优越性能。

一种基于新型邻域更新策略的MOEA/D算法

耿焕同, 韩伟民, 周山胜, 丁洋洋

计算机科学. 2019, 46 (5): 191-197. doi:10.11896/j.issn.1002-137X.2019.05.029

摘要 ( 612 )

PDF(2358KB) ( 1806 )

参考文献 | 相关文章 | 多维度评价

针对MOEA/D算法求解复杂优化问题时,邻域更新策略的无限制替换易造成种群多样性缺失的问题,提出了一种基于新型邻域更新策略的MOEA/D算法(MOEA/D-ENU)。该算法在进化过程中对解的信息进行充分挖掘,按照邻域更新能力对产生的新解进行分类,并针对不同类型的新解,自适应地采取不同的邻域更新策略,在保证种群收敛速度的同时,又兼顾了种群的多样性。实验中,选取ZDT,UF,CF等9个函数作为标准测试集,将改进后的算法MOEA/D-ENU与其他5种算法进行对比实验,并以IGD和HV为评估指标。实验结果表明新算法具有更好的收敛性和分布性。

倾向近邻关联的神经机器翻译

王坤, 段湘煜

计算机科学. 2019, 46 (5): 198-202. doi:10.11896/j.issn.1002-137X.2019.05.030

摘要 ( 407 )

PDF(1501KB) ( 1192 )

参考文献 | 相关文章 | 多维度评价

现有神经机器翻译模型在对序列建模时,仅考虑目标端对应源端的关联性,未对源端关联性及目标端关联性建模。文中分别对源端以及目标端关联性建模,并设计合理的损失函数,使得源端隐藏层与其近邻K个单词隐藏层更相关,目标端隐藏层与其历史M个单词隐藏层更相关。在大规模中英数据集上的实验结果表明,相比于神经机器翻译中仅考虑目标端对应源端的关联性,所提方法可以构建更好的近邻关联表示,提升机器翻译系统的译文质量。

基于概率采样和集成学习的不平衡数据分类算法

曹雅茜, 黄海燕

计算机科学. 2019, 46 (5): 203-208. doi:10.11896/j.issn.1002-137X.2019.05.031

摘要 ( 654 )

PDF(1664KB) ( 1574 )

参考文献 | 相关文章 | 多维度评价

集成学习由于泛化能力强,被广泛应用于信息检索、图像处理、生物学等类别不平衡的场景。为了提高算法在不平衡数据上的分类效果,文中提出一种基于采样平衡和特征选择的集成学习算法OBPD-EFSBoost。该算法主要包括3个步骤:首先,依据少数类高斯混合分布得到的概率模型,进行过采样构造平衡数集,扩大少数类的潜在决策域;其次,每轮训练个体分类器时,根据上一轮的错分样本综合考虑样本和特征的加权,过滤冗余噪声特征;最后,通过个体分类器的加权投票得到最终的集成分类器。8组UCI数据分类结果表明,该算法不仅有效提高了少数类的分类精度,同时还弥补了Boosting类算法对噪声特征敏感的缺陷,具有较强的鲁棒性。

基于覆盖的多重代价粗糙决策分析方法

骆公志, 许鑫鑫

计算机科学. 2019, 46 (5): 209-213. doi:10.11896/j.issn.1002-137X.2019.05.032

摘要 ( 537 )

PDF(1233KB) ( 905 )

参考文献 | 相关文章 | 多维度评价

为弥补传统决策粗糙模型要求概念间无交叉且忽略了多重代价矩阵的重要性的不足,文中提出了基于覆盖的加权多重代价决策粗糙集模型。首先,分析了基于等价关系的多重代价决策粗糙模型中存在粒度分类过细的问题,综合考虑了代价矩阵的数量关系和相对重要程度,引入了覆盖和代价矩阵权重对其进行改进,定义了新模型的上、下近似;然后,针对4种基于覆盖的多重代价决策粗糙集,讨论了其相互关系,并对相关性质和定理进行证明;最后,通过医疗诊断的实例验证了模型的有效性和实用性。

基于BiLSTM并结合自注意力机制和句法信息的隐式篇章关系分类

凡子威, 张民, 李正华

计算机科学. 2019, 46 (5): 214-220. doi:10.11896/j.issn.1002-137X.2019.05.033

摘要 ( 704 )

PDF(1627KB) ( 1795 )

参考文献 | 相关文章 | 多维度评价

隐式篇章关系分类是浅层篇章结构分析(Shallow Discourse Parsing)中的子任务,也是自然语言处理(Natural Language Processing,NLP)中的一项重要任务。隐式篇章关系是由篇章关系中的论元对推理出来的逻辑语义关系。隐式篇章关系的分析结果可以应用于许多自然语言处理任务中,如机器翻译、自动文档摘要、问答系统等。针对隐式篇章关系分类任务,提出一种基于自注意力机制和句法信息的方法。通过双向长短时记忆网络(Bidirectional Long Short-Term Memory Network)对输入的结合句法信息的论元对进行建模,将论元对表示成低维稠密的向量;通过自注意力机制对论元对信息进行筛选。在PDTB2.0 数据集上进行实验,结果表明该方法较基准系统获得了更好的效果。

改进型循环生成对抗网络的血管内超声图像增强

姚哲维, 杨丰, 黄靖, 刘娅琴

计算机科学. 2019, 46 (5): 221-227. doi:10.11896/j.issn.1002-137X.2019.05.034

摘要 ( 821 )

PDF(4308KB) ( 1592 )

参考文献 | 相关文章 | 多维度评价

血管内超声(Intravascular Ultrasound,IVUS)图像采集过程中使用的低频或高频超声探头各有其特点,医生在诊断冠脉粥样硬化等疾病过程中需根据临床需求选择频率不同的超声探头。因此,文中提出一种基于Wasserstein距离的循环生成对抗网络(Cycle Generative Adversarial Networks,CycleGANs)用于增强血管内超声图像,其目的是融合高频超声细节信号,克服低频超声图像边缘模糊且分辨率较低等问题,以辅助医生诊断心血管疾病。首先基于心血管的形状特点,使用旋转、缩放和Gamma变换等方法将图像数据训练集增加30倍,降低网络训练过拟合的风险;然后利用对抗网络训练的思想,构建基于对抗损失和循环一致损失的联合函数,在损失函数中引入Wasserstein距离作为正则项,加快网络训练的收敛速度,解决训练不稳定的问题;最后以低频IVUS图像为输入对象,输出含有高频图像细节信息的IVUS增强图像。在实验过程中以国际标准IVUS图像数据库为基础进行算法验证比较;以清晰度、对比度和边缘能量为评价标准进行定量分析。实验结果:所提算法的收敛速度是原始CycleGANs模型的两倍,且3个评价标准数值分别提升了15.8%,11.4%和46.6%。实验结果表明:W-CycleGANs模型能够有效地学习高频图像域的特征信息,并且进一步丰富低频图像边缘细节,增强图像的诊断信息,提高医生判断心血管疾病的敏感性。此外,文中采用100幅临床IVUS图像数据进行推广验证,也获得了较好的增强效果。

基于多重语义交互的递归式场景理解框架

姚拓中, 左文辉, 安鹏, 宋加涛

计算机科学. 2019, 46 (5): 228-234. doi:10.11896/j.issn.1002-137X.2019.05.035

摘要 ( 715 )

PDF(4696KB) ( 1259 )

参考文献 | 相关文章 | 多维度评价

传统基于前馈设计的视觉系统已经非常普遍,但其存在的一大缺陷是某个环节出现的错误无法被及时修正,从而影响系统的最终性能。为此,提出了一种简易的交互式框架,其特点在于场景语义的不确定性能够通过不同的视觉分析过程协同工作实现求解和优化。在该框架中,分别使用了3个经典的场景理解算法作为视觉分析模块,不同模块之间利用彼此输出的表面布局、边界、深度、视点和物体类等上下文语义之间的交互以实现各自性能的渐进式提升。提出的方法不需要人为设置约束条件,可根据需求插入新的模块而无须对原有框架和算法进行大的修改,具有良好的可扩展性。基于Geometric Context数据集的实验结果表明,这种基于本征信息交互的反馈式设计通过多次递归后能够有效弥补前馈式系统存在的不足,其中表面布局、边界和视点估计的平均精度提升了5%以上,而物体类的平均检测精度也提升了6%以上,其可成为未来改进视觉系统性能的途径之一。

基于异构机器学习算法融合的遥感影像分类

田振坤, 傅莺莺, 刘素红

计算机科学. 2019, 46 (5): 235-240. doi:10.11896/j.issn.1002-137X.2019.05.036

摘要 ( 680 )

PDF(3588KB) ( 1332 )

参考文献 | 相关文章 | 多维度评价

针对信息获取与处理过程中的不确定性导致的遥感数据分类精度难以满足土地覆盖变化、环境监测、专题信息提取等应用方面的需求,提出了一种基于机器学习的分类融合算法。采用6种异构分类器,以查准率及查全率矩阵为先验知识,依据分类器差异性指数AD对单分类器进行优化组合,结合三维概率矩阵分别得到抽象级、排序级和度量级的分类融合结果输出,并以北京地区Landsat 8遥感影像的典型区域为研究对象进行分类预测。结果表明,从6个单分类器中选取3个进行组合时的效果较好,其中AD值最大的(NB,KNN,SVM)分类器组合是综合效果最好的分类器组合;所提算法的抽象级输出比单分类的平均精度高12.28%,比分类效果最好的单分类器SVM高2.24%;所提算法对多个“强成员分类器”进行融合仍然能有效提高分类精度,比常用融合算法RF,Bagging和Boosting分别高出11.23%,7.56%和11.36%,对各种地物的分类精度有显著的提高。

基于空间对齐和轮廓匹配的颈动脉多对比MRI三维配准方法

汪晓妍, 刘琪琪, 黄晓洁, 姜娓娓, 夏明

计算机科学. 2019, 46 (5): 241-246. doi:10.11896/j.issn.1002-137X.2019.05.037

摘要 ( 518 )

PDF(2129KB) ( 1058 )

参考文献 | 相关文章 | 多维度评价

多对比高分辨率磁共振成像(Magnetic Resonance Imaging,MRI)技术可以无创显示管壁结构和斑块成分,为分析颈动脉粥样硬化斑块提供了一种有效手段。多对比图像中的血管配准是斑块成分识别的关键任务,由此提出一种基于空间位置对齐和内腔轮廓匹配的颈动脉多对比磁共振图像三维配准算法。基于多对比序列图像,采用由粗到细的策略:首先利用图像的物理坐标进行空间位置的层间对齐;然后运用最大类间方差法和活动轮廓模型实现各序列血管内腔的半自动连续分割;最后以内腔轮廓组成的三维点云进行基于改进迭代最近点算法的三维配准。实验结果表明,配准后TOF序列和T₁Gd序列的三维内腔包含率达到92.79%,T₁WI序列和T₁Gd序列的三维内腔包含率达到94.66%,实现了多对比磁共振图像血管的三维精确配准,为后续易损斑块的成分分析奠定了基础。

基于深层卷积残差网络集成的黑色素瘤分类方法

胡海根, 孔祥勇, 周乾伟, 管秋, 陈胜勇

计算机科学. 2019, 46 (5): 247-253. doi:10.11896/j.issn.1002-137X.2019.05.038

摘要 ( 731 )

PDF(2716KB) ( 1836 )

参考文献 | 相关文章 | 多维度评价

针对黑色素瘤分类识别任务中存在对比度低、肉眼难以区分、信息干扰大、数据量偏少以及数据不均衡等诸多问题,文中提出了一种基于掩盖的数据增强与深度卷积残差网络相结合的集成分类方法。首先根据皮肤病图像的特点,在前人数据增强研究的基础上,提出了两种基于掩盖训练图像部分区域的数据增强方式;其次以这两种数据增强方式为基础,采用深度卷积残差50层(ResNet-50)网络进行特征提取;然后以提取到的特征来构建两个具有一定差异性的分类结构模型,并对其进行集成;最后以国际皮肤影像协作组织(ISIC)2016挑战赛所公布的皮肤病图像数据集为对象,通过一系列实验对提出的方法进行了验证测试。实验结果表明,所提出的集成分类结构模型能弥补单一卷积残差网络在黑色素瘤分类任务中的缺陷,该模型能够在训练样本较少的皮肤病数据集上取得较好的分类结果,多项评估指标均优于ISIC2016挑战赛的前5名。

基于3-D剪切波和广义高斯模型的多模态医学序列图像融合

席新星, 罗晓清, 张战成

计算机科学. 2019, 46 (5): 254-259. doi:10.11896/j.issn.1002-137X.2019.05.039

摘要 ( 623 )

PDF(5893KB) ( 1213 )

参考文献 | 相关文章 | 多维度评价

鉴于大多数传统的多模态医学图像融合算法面临无法处理医学序列图像的局限性,提出了一种基于3-D剪切波(3DST)和广义高斯模型的多模态医学序列图像融合方法。首先,通过3-D剪切波变换获得序列图像的低频部分和高频部分;其次,低频部分采用一种新的基于局部能量的融合方法;然后,高频部分采用基于广义高斯模型(Gene-ralized Gaussian Model,GGD)和模糊逻辑的融合方法;最后,通过3-D剪切波的逆变换获得融合的医学序列图像。通过实验对融合图像的主客观性能进行比较,结果表明所提算法获得了更好的融合效果。

迁移学习模式下基于GoogLeNet网络的风电机组视觉检测

徐一鸣, 张娟, 刘成成, 顾菊平, 潘高超

计算机科学. 2019, 46 (5): 260-265. doi:10.11896/j.issn.1002-137X.2019.05.040

摘要 ( 533 )

PDF(3396KB) ( 1124 )

参考文献 | 相关文章 | 多维度评价

针对无人机航拍环境下拍摄角度变换、特征不显著等干扰问题,提出一种改进的GoogLeNet卷积神经网络对风电机组进行识别和定位,无需人工预选取即可自动提取风电机组类别特征。通过GoogLeNet网络构造风电机组深度特征向量,在网络模型训练过程中引入迁移学习的概念,利用风电机组图像训练已预训练的GoogLeNet网络,在加快模型训练速度的同时,能避免分类网络陷入局部最优解。并在Faster RCNN框架下采用区域建议网络和多任务损失函数将候选区域搜索和边框回归融入到网络中,实现航拍图像中风电机组的自动分类和标注,缩短数据处理时间。实验结果表明,通过迁移学习的手段,利用优化的GoogLeNet网络能改善复杂航拍环境下的目标视觉检测准确率,完成风电机组自动定位任务,基于GoogLeNet的风电机组平均准确率达到了96%以上。

基于图像灰度熵的自适应字典学习算法

杜秀丽, 左思铭, 邱少明

计算机科学. 2019, 46 (5): 266-271. doi:10.11896/j.issn.1002-137X.2019.05.041

摘要 ( 474 )

PDF(1908KB) ( 1268 )

参考文献 | 相关文章 | 多维度评价

针对传统图像稀疏表示字典学习算法仅对图像训练学习单一字典,不能很好地对包含不同图像信息的图像块进行最优稀疏表示的问题,将图像灰度熵的思想引入到字典学习算法中,提出基于图像灰度熵的自适应字典学习算法。该算法将图像库作为训练样本,对图像库图像进行分块,计算各子块的灰度熵大小,依据灰度熵大小对子块进行分类,针对不同类别子块,设定不同K-奇异值分解算法参数,分别进行字典训练,从而得到多个不同的字典。根据灰度熵大小选择训练好的字典对待表示图像子块进行稀疏表示。仿真实验及结果表明,所提算法能够对图像进行较好的稀疏表示,图像的重构效果也得到了明显提升。

光照不均匀的结构光图像的条纹快速提取方法

郑红波, 石豪, 杜轶诚, 张美玉, 秦绪佳

计算机科学. 2019, 46 (5): 272-278. doi:10.11896/j.issn.1002-137X.2019.05.042

摘要 ( 696 )

PDF(3682KB) ( 1636 )

参考文献 | 相关文章 | 多维度评价

结构光图像的条纹提取易受不均匀光照的影响,而提取的条纹精度是后续三维重建精确与否的重要前提,因此,如何消除不均匀光照的影响,准确提取结构光图像的条纹是本文研究的目标。文中提出了一种结合高斯滤波和均值滤波的处理算法,适用于光照不均匀的结构光图像的条纹提取。该算法既可以有效地消除不均匀光照对图像的影响,又保留了原始图像的特征信息,取得了良好的实验效果。为了加速滤波处理过程,文中使用可分离滤波器对算法进行改进,降低了计算复杂度,又使用基于GPU并行计算的CUDA技术对算法进行加速,使处理速度得到较大的提高。

基于CNN的相衬显微图像序列的癌细胞多目标跟踪

胡海根, 周莉莉, 周乾伟, 陈胜勇, 张俊康

计算机科学. 2019, 46 (5): 279-285. doi:10.11896/j.issn.1002-137X.2019.05.043

摘要 ( 666 )

PDF(2280KB) ( 1520 )

参考文献 | 相关文章 | 多维度评价

检测与跟踪相衬显微图像序列下的癌细胞对于分析癌细胞的生命周期以及开发抗癌新药具有非常重要的意义。传统的目标跟踪方法大多应用于刚性目标跟踪或单目标跟踪,而癌细胞是非刚性且不断裂变的多目标,这就大大增加了跟踪的难度。文中以相衬显微图像序列中的膀胱癌细胞为研究对象,提出一种基于卷积神经网络(Convolutional Neural Network,CNN)的癌细胞多目标跟踪方法。该算法采用基于检测的多目标跟踪方法,首先利用深度学习检测框架Faster R-CNN卷积神经网络实现癌细胞的检测,初步获得待跟踪的癌细胞;再利用扫描圆算法(Circle Scanning Algorithm,CSA)实现黏连细胞的检测优化,进一步提高黏连区域的细胞检测精度;最后提取综合特征描述子,对卷积特征、尺寸特征和位置特征进行加权求和,实现跟踪目标的综合描述,从而实现不同帧癌细胞间的高效关联匹配,最终实现癌细胞的多目标跟踪。一系列实验结果表明,相较于传统方法,所提方法不仅在癌细胞的检测和跟踪上性能有较大的提升,而且可以有效处理目标的遮挡问题。

融合CFCC和Teager能量算子倒谱参数的语音识别

史燕燕, 白静

计算机科学. 2019, 46 (5): 286-289. doi:10.11896/j.issn.1002-137X.2019.05.044

摘要 ( 578 )

PDF(1308KB) ( 1480 )

参考文献 | 相关文章 | 多维度评价

针对现有表征语音特性的特征提取不完善的问题,提出了一种耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)和Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC)相互融合的方法。该方法将表征人耳听觉特性的CFCC和体现非线性能量特性的TEOCC的融合特征应用到语音识别系统中,并联合主成分分析(Principal Components Analysis,PCA)对该融合特征进行特征选择和优化,最后通过支持向量机进行语音识别。实验结果表明:该融合特征与单一特征相比具有更佳的语音识别性能,结合PCA后其语音识别的准确率平均提高了3.7%。

一种面向云计算群组优化时效改进的学习模型

简琤峰, 况祥, 张美玉

计算机科学. 2019, 46 (5): 290-297. doi:10.11896/j.issn.1002-137X.2019.05.045

摘要 ( 463 )

PDF(3014KB) ( 889 )

参考文献 | 相关文章 | 多维度评价

针对传统的云计算调度模型对任务调度求解时间长的缺陷,提出一种结合差分进化的改进的新蝙蝠算法(Optimized Novel Bat Algorithm,ONBA)优化算法来获取任务的调度数据。利用该调度数据对改进的改进的深度信念网络(Improved Deep Belief Network,IDBN)模型进行训练,通过对训练学习率和训练次数的自适应调优来实现训练时效的提高,从而实现对云计算调度结果的快速准确预测。实验结果表明,应用该方法训练完成的改进IDBN模型进行调度时,在保证预测群组优化结果准确的前提下,其能够有效缩短云计算的实际调度时间,弥补了传统群组优化模型调度耗时的缺陷。

求解稀疏多元多项式插值问题的分治算法

邓国强, 唐敏, 梁状昌

计算机科学. 2019, 46 (5): 298-303. doi:10.11896/j.issn.1002-137X.2019.05.046

摘要 ( 660 )

PDF(1511KB) ( 1408 )

参考文献 | 相关文章 | 多维度评价

稀疏多元多项式插值被广泛应用在科学和工程领域,目标是利用多项式的稀疏结构及其给定的离散信息恢复目标多项式。目前的主流方法在目标多项式规模较大时均表现出较高的时间复杂度,因其所需的代数操作的规模及个数与多项式的项数和次数相关。鉴于此,提出了一种求解稀疏多元多项式插值问题的有限域上的分治算法,其基本策略是视多项式中的一个变元为主元,其系数为关于其他变元的多元多项式,从而将原问题分解为一系列单变元多项式插值及规模远小于原问题的一系列子多元多项式插值问题,合并这些子多元多项式即得到原问题的解。为实现稀疏多元多项式插值分治算法,设计了4个子算法:基于提前终止策略的单变元多项式插值算法、已知次数的单变元多项式插值算法、多项式项数判定的Hankle矩阵行列式检测法、已知项数的Ben-Or/Tiwari算法。对新算法与Zippel算法、Ben-Or/Tiwari算法、 Javadi/Monagan算法进行了数值实验比较,结果表明所提算法在运行时间上有较大的改进。实验数据充分说明:提前终止策略的运用,消除了必须给定目标多项式的项数界和次数界的限制;分治策略的运用,将大量高阶的代数运算分解为低阶问题,从而有效地解决了大规模多元多项式插值问题的时间性能瓶颈。

面向多数据源的网络爬虫实现技术及应用

曾健荣, 张仰森, 郑佳, 黄改娟, 陈若愚

计算机科学. 2019, 46 (5): 304-309. doi:10.11896/j.issn.1002-137X.2019.05.047

摘要 ( 794 )

PDF(1533KB) ( 2129 )

参考文献 | 相关文章 | 多维度评价

基于大数据技术的社会计算方法是目前学术界研究的热点,如何从网络上快速获取相应的数据资源是相关研究的关键。网络爬虫技术是目前进行网络数据采集的主要手段,针对现有爬虫技术不便于采集多源数据的问题,提出了一种面向多数据源的网络爬虫数据采集技术,在研究新浪微博、人民日报、百度百科、百度贴吧、微信公众号、东方财富股吧等6类媒体平台的数据采集爬虫的基础上,采用Servlet后台调度技术,将面向多数据源的网络爬虫进行融合,解决了面向不同媒体平台的数据采集问题。在实现过程中,首先借助Web应用程序测试工具包selenium实现模拟登录等人工操作,然后采用Xpath元素查询技术来解析网页源码,并提取出数据信息存入数据库,最后将爬取到的数据从数据库中读取出来并展示在前端页面中。实验表明,爬虫在保证数据完整性的前提下实现了采集效率的最大化。

航站楼长期运行态势的评估体系

衡红军, 王瑞

计算机科学. 2019, 46 (5): 310-314. doi:10.11896/j.issn.1002-137X.2019.05.048

摘要 ( 506 )

PDF(1291KB) ( 961 )

参考文献 | 相关文章 | 多维度评价

随着机场建设的高速发展和旅客流量的不断增加,如何高效使用航站楼内的设备设施以及为旅客提供高质量的服务成为机场管理者亟待解决的问题。为了使机场管理者对航站楼每天的运行状态有更直观的了解,文中构建了基于模糊综合评价法的航站楼长期运行态势评价体系。该体系以航站楼每天的运行状态为研究对象,运用模糊综合评价法对航站楼的运行态势进行综合评价,并判定其运行态势等级及相应的特征。实例表明,评价体系的等级特征描述与机场航站楼的实际运行情况相符,进一步证明了航站楼长期运行态势评价体系的适用性和有效性。

基于云模型和改进灰色关联分析模型的网络服务质量综合评估

孙明玮, 齐玉东

计算机科学. 2019, 46 (5): 315-319. doi:10.11896/j.issn.1002-137X.2019.05.049

摘要 ( 428 )

PDF(1372KB) ( 1196 )

参考文献 | 相关文章 | 多维度评价

随着多媒体技术以及高速网络技术的飞速发展,各种对质量要求更高的新型网络不断出现。针对当前的传统计算机网络只能提供“尽力而为”的服务,无法保证提供较高的服务质量以及对突发的新型业务进行快速有效评估的问题,文中通过测量网络服务质量的性能参数,构建基于云-改进的灰色关联分析模型的网络服务质量综合评估模型,以实现对测量数据的实时快速归类。实验表明,该方法能够得到准确的评估结果,对开发综合评估方法有很好的指导意义。

基于突发公共事件的信息传播动力学模型与舆情演化研究

刘小洋, 何道兵

计算机科学. 2019, 46 (5): 320-326. doi:10.11896/j.issn.1002-137X.2019.05.050

摘要 ( 797 )

PDF(2227KB) ( 1910 )

参考文献 | 相关文章 | 多维度评价

针对突发公共事件信息传播传统演化模型未引入动态参数等问题,结合传播动力学提出了一种动态扩散网络突发公共事件的信息舆情演化系统与数学模型。首先对突发公共事件信息传播进行了分析与设计;其次对动态扩散网络进行了设计,并结合动力学构建了突发公共事件信息传播数学模型;最后对模型进行仿真分析,并与现实社会真实统计数据进行实证对比。结果表明:仿真结果数据与真实监测数据的相似度为0.8386,相关系数为0.8279;提出的数学模型揭示了微观个体信息与舆情传播的内在规律,与真实事件传播过程相吻合,证明了构建的模型是合理、有效的。

灰色预测模型在隧道洞顶楔形体稳定性预测中的应用

吴发友, 王林峰, 翁其能

计算机科学. 2019, 46 (5): 327-330. doi:10.11896/j.issn.1002-137X.2019.05.051

摘要 ( 413 )

PDF(1290KB) ( 1213 )

参考文献 | 相关文章 | 多维度评价

目前我国在交通方面投建了大量的基础设施,隧道是其中不可避免的工程,特别是在西部地区。在隧道中,洞顶楔形体失稳是施工中存在的危害之一,对楔形体进行监测和预测以保证隧道施工及后期的安全具有重要的意义。通过预测,施工方能及时采取有效措施来消除危险,避免经济损失和人员伤亡。隧道楔形体失稳的影响因素复杂、影响因子难以量化且具有不确定性,符合灰色系统的特性。将灰色系统理论应用于隧道楔形体变形的预测,在原始监测数据的基础上建立隧道楔形体变形的G(1,1)单点预测模型。通过工程实例,验证了该模型的精度。预测模型中,后验差比为C=0.1195,小误差频率为P=1。结果表明,预测模型的精度达到了较高的水平,该预测的结果可以很好地指导实际施工。