1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2017年第5期, 刊出日期:2018-11-13
  
目次
流行音乐主旋律提取技术综述
李伟,冯相宜,吴益明,张旭龙
计算机科学. 2017, 44 (5): 1-5.  doi:10.11896/j.issn.1002-137X.2017.05.001
摘要 ( 633 )   PDF(494KB) ( 1366 )   
参考文献 | 相关文章 | 多维度评价
旋律是最重要的音乐要素之一,多应用于音乐内容分析、音乐创作、音乐教育、抄袭检测等方面。主旋律提取旨在从一段音乐中自动估计对应于主旋律单音音符序列的音高或基频。流行音乐一般属于复杂的多音音乐,因此主旋律提取面临着许多挑战。综述了主旋律提取的研究背景,将主旋律提取的典型方法分别从基于音高显著度、基于声源分离以及其他方法3个类别进行了阐述,最后介绍了主旋律提取的评价指标以及研究进展。
两层传感器网络中安全Top-k查询处理技术综述
戴华,叶庆群,杨庚,肖甫,何瑞良
计算机科学. 2017, 44 (5): 6-13.  doi:10.11896/j.issn.1002-137X.2017.05.002
摘要 ( 244 )   PDF(830KB) ( 575 )   
参考文献 | 相关文章 | 多维度评价
无线传感网中安全数据查询技术的研究已引起了广泛的关注,其中以存储节点为中间层的两层传感器网络中安全Top-k查询技术的研究具有重要的现实意义。现有的安全Top-k查询技术主要针对查询过程中数据的隐私保护和查询结果的完整性验证等问题开展研究工作。从安全性能和通信性能两个维度出发对现有的两层传感器网络中的安全Top-k查询技术进行了总结,介绍了网络模型查询模型,以及查询过程中存在的安全性问题;同时分析和总结了现有的各协议所采用的关键技术以及其主要优点和不足,最后指出了未来可能的研究方向。
分支嵌套循环的自动并行化研究
丁丽丽,李雁冰,张素平,王鹏翔,张庆花
计算机科学. 2017, 44 (5): 14-19.  doi:10.11896/j.issn.1002-137X.2017.05.003
摘要 ( 366 )   PDF(609KB) ( 1163 )   
参考文献 | 相关文章 | 多维度评价
GCC编译器是一种受广大研究者青睐的开源优化编译器,但它仅仅能够对完美嵌套循环进行依赖分析。为了更好地挖掘嵌套循环粗粒度的并行,深入研究了GCC5.1数据依赖分析过程,提出了一种能够处理分支嵌套循环的依赖测试方法。首先识别出分支嵌套循环,然后分析数组下标与分支嵌套循环外层索引变量的关系,最后计算出外层循环索引变量的距离向量,并通过检测距离向量判断循环是否存在依赖。实验结果表明,该方法能够正确、有效地分析出分支嵌套循环的依赖关系。
一种基于MapReduce的大数据集相似自连接算法
孙德才,王晓霞
计算机科学. 2017, 44 (5): 20-25.  doi:10.11896/j.issn.1002-137X.2017.05.004
摘要 ( 266 )   PDF(629KB) ( 760 )   
参考文献 | 相关文章 | 多维度评价
如何快速发现数据集中重复或相似的记录是大数据处理技术中的一个基本问题。相似连接是一种有效的相似数据查找方法,且基于MapReduce的相似连接算法因对大数据集的处理能力强而得到广泛关注。通过分析当前相似连接算法进行自连接时存在的自连接冗余、读取原字符串复杂等问题,在Massjoin算法的基础上提出了一种改进的基于MapReduce的自连接算法。改进算法在过滤阶段增加了消除自身冗余的过滤条件,在验证阶段又采用了生成正反候选对和组合id等去冗余技术,并且读取原始字符串内容时只需读取数据集一次。实验数据显示,改进算法无论在过滤阶段还是在验证阶段都减少了算法的CPU时耗,结果表明所提改进策略是有效的。
基于Intel MIC架构的3D有限差分算法优化
郝鑫,郭绍忠
计算机科学. 2017, 44 (5): 26-32.  doi:10.11896/j.issn.1002-137X.2017.05.005
摘要 ( 397 )   PDF(583KB) ( 554 )   
参考文献 | 相关文章 | 多维度评价
有限差分算法是一种基于偏微分方程的数值离散方法,被广泛应用于弹性波传播问题的数值模拟中。该算法访存跨度大、计算密度高、CPU利用率低,这在实际应用中成为了性能瓶颈。针对上述问题,在详析3D有限差分算法(3DFD)的基础上,基于Intel MIC架构,采用三步递进法对其进行优化:首先,通过分支消除、循环展开、不变量外提等基本优化法削减计算强度并为向量化扫除障碍;然后,通过分析数据依赖及循环分块,使用向量指令集改写核心算法等并行优化法,充分利用MIC协处理器多线程、长向量的机制;最后,在异构众核平台(CPU+MIC:Many Integra-ted Cores)下通过数据传输最小化、负载均衡等异构协同优化法实现CPU和MIC的并行计算。实验验证,与原有算法相比,优化后的算法在异构平台上获得了50~120倍的加速。
网络与通信
基于单位超球面上Mean Shift聚类的地震子波盲估计
萧蕴诗,赵彦青,程成
计算机科学. 2017, 44 (5): 33-36.  doi:10.11896/j.issn.1002-137X.2017.05.006
摘要 ( 160 )   PDF(1012KB) ( 469 )   
参考文献 | 相关文章 | 多维度评价
石油勘探领域中,地震信号可以看作地震子波与地震反射系数的褶积。由于缺乏先验知识,地震反褶积本质上是一个盲过程。针对带状独立分量分析方法估计子波的多解性,以及地震子波的单位模长约束。对子波空间进行了单位超球面建模,进而研究了这种特定几何空间的黎曼度量及梯度,并由此构造了单位超球面上的Mean Shift聚类算法,最后依据聚类结果求取子波平均。模型实验与实际资料应用结果表明,与带状独立分量分析方法估计的地震子波相比,通过该方法估计的地震子波保真度更高,与设计子波相似度更高,反褶积处理后能够有效提高地震资料的分辨率。
基于信任和权重的无线传感器网络数据融合模型
张峰,郑洪源,丁秋林
计算机科学. 2017, 44 (5): 37-41.  doi:10.11896/j.issn.1002-137X.2017.05.007
摘要 ( 226 )   PDF(515KB) ( 598 )   
参考文献 | 相关文章 | 多维度评价
在无线传感器网络中,数据融合的可靠性是一个非常重要的问题并且受到了广泛的关注。为此,提出一种基于信任和权重的无线传感器网络数据融合模型(TWDFM)。在该模型中,传感器节点通过构建信任表选举可靠簇头,簇头根据权重检测异常节点并融合可信数据。仿真实验表明,该模型可以有效提高数据融合的安全性和准确性。
稀疏原子分解算法在AR模型参数估计中的应用
姜玉洁,刘国庆,王天荆
计算机科学. 2017, 44 (5): 42-47.  doi:10.11896/j.issn.1002-137X.2017.05.008
摘要 ( 212 )   PDF(452KB) ( 539 )   
参考文献 | 相关文章 | 多维度评价
针对自回归(Autoregressive,AR)模型阶数和系数的估计问题,提出一种基于稀疏表示的原子分解新算法。首先,根据AR模型自相关函数特征构造一个过完备稀疏字典;其次,针对含噪观测信号,通过引入松弛变量,建立关于AR模型特征根稀疏恢复的优化模型;最后, 将定阶和参数估计问题转化为求解稀疏最优基问题,并提出一种改进的变尺度变换算法来求解该优化问题。实验结果表明,无论是对模拟信号,还是真实的脑电信号,该算法在定阶和系数估计两方面均优于传统估计方法,具有更好的预测精度和鲁棒性。
一种基于OFDM认知无线电网络的次优动态资源分配算法
韩杰,宋晓勤,董莉,金慧
计算机科学. 2017, 44 (5): 48-52.  doi:10.11896/j.issn.1002-137X.2017.05.009
摘要 ( 279 )   PDF(407KB) ( 608 )   
参考文献 | 相关文章 | 多维度评价
研究了采用正交频分复用的认知无线电网络中的多用户资源分配问题,包括子载波分配和功率分配。在认知无线电系统中,除了考虑主用户与次用户之间的相互干扰,还要求将主用户对次用户的干扰控制在预设门限之下,因此,系统模型更为复杂。整数约束条件,使得寻求最优解的算法复杂度高,无法用于对实时性要求高的系统。因此,提出了一种寻求次优解的分步式资源分配算法,以降低算法的复杂度。首先采用一种综合考虑了功率限制和对主用户的干扰限制的新型子载波分配方案,然后提出改进的线性注水算法进行功率分配。仿真结果表明,相比于最优分配算法,所提出的算法可以在获得较好的系统容量的同时,有效地降低系统的复杂度,适用于对实时性要求高的系统。
面向工业无线汇聚网络的高吞吐率MAC协议
徐亦达,徐朝农
计算机科学. 2017, 44 (5): 53-60.  doi:10.11896/j.issn.1002-137X.2017.05.010
摘要 ( 267 )   PDF(2393KB) ( 495 )   
参考文献 | 相关文章 | 多维度评价
汇聚网络是工业传感器网络的常用拓扑形式。汇聚网络的隐藏终端是影响网络吞吐率的重要因素,目前常用信道预留机制来加以解决。此外,随着物理层数据传输速率的不断提高,相对短报文的现象日渐突出,使得用于信道预留的控制报文的开销相对增加。现有的IEEE802.11 DCF不能同时有效应对这两个现象。提出了取消信道预留方式来克服相对短报文问题,而对于由于信道预约取消所导致的隐藏终端问题,则以随机发送机制解决。为了获得最优的发送概率,设计了APCSMA协议,该协议以最大化节点吞吐率为目标,提出吞吐率最大化的必要条件,基于该必要条件,在主干扰模型下推导出节点均匀分布情况下的最优报文发送概率。从理论上分析了协议的网络吞吐率、延迟和能量效率。仿真结果和分析表明,APCSMA协议对于工业无线汇聚网络具有广泛的适用性。
针对单区域突发流量的移动Sink路径规划
万成,常捷,张灵
计算机科学. 2017, 44 (5): 61-65.  doi:10.11896/j.issn.1002-137X.2017.05.011
摘要 ( 249 )   PDF(448KB) ( 541 )   
参考文献 | 相关文章 | 多维度评价
在传感器节点定期收集全网数据且单区域可能突发事件的密集型无线传感网中,如果产生区域突发事件,需要在短时间内将突发事件数据准确地发送到基站,同时也要兼顾其他区域定期产生的数据。提出针对单区域突发流量的移动Sink路径规划算法,首先将网络划分为虚拟网格,每个网格为一个簇,将节点划分到各个网格并选举簇头;然后通过TSP相关算法建立最短遍历路径, Sink节点通过该路径收集全网数据。如果某区域有突发流量产生,Sink节点将动态改变移动路径去收集数据。大量基于NS-2平台的仿真实验结果表明,该路径规划算法能动态改变路径来收集数据,均衡突发数据流量的准确性、实时性和定期产生的区域数据流量的丢包率、数据收集时延,延长网络生命周期。
基于脑电EEG的改进EEMD算法
黄丽亚,笪铖璐,杨晨,陈志阳,王镐
计算机科学. 2017, 44 (5): 66-70.  doi:10.11896/j.issn.1002-137X.2017.05.012
摘要 ( 341 )   PDF(471KB) ( 566 )   
参考文献 | 相关文章 | 多维度评价
为了有效地改善模态混叠问题以适应脑电信号的研究,提出了一种改进的集合经验模态分解算法。首先对脑信号进行相关性筛选;然后自适应地从原始脑信号中预测脑电特性信号,融合高斯白噪声生成新型脑信号噪声;最后基于该噪声进行集合经验模态分解。仿真实验表明,新型脑信号噪声不仅具有自适应特性,而且可以更好地解决脑信号经验模态分解中的模态混叠问题,同时也证明了该算法在脑电研究领域的理论和应用价值。
采用预编码的GSM网络最大互信息优化方法研究
魏霖静,宁璐璐,练智超,代永强,王联国
计算机科学. 2017, 44 (5): 71-74.  doi:10.11896/j.issn.1002-137X.2017.05.013
摘要 ( 285 )   PDF(344KB) ( 511 )   
参考文献 | 相关文章 | 多维度评价
为了提高广义空间调制(GSM)互信息的性能,提出了一种新的基于椭球算法的预编码方案。首先,为了对含有互信息的预编码器进行优化,推导出了有限字符输入下的GSM互信息解析表达式。在最大化GSM互信息的过程中,为了解决联合预编码设计的非凸耦合问题,将GMS系统转换成虚拟的多输入多输出(MIMO)系统。然后,在考虑所有子信道功率约束的条件下,使用了扩展的椭球算法。实验结果表明,提出的预编码方案大大提升了GSM互信息的性能。
信息安全
面向移动物联网的可信超网络概念及构架研究
王慧强,温秀秀,吕宏武,冯光升,林俊宇
计算机科学. 2017, 44 (5): 75-80.  doi:10.11896/j.issn.1002-137X.2017.05.014
摘要 ( 257 )   PDF(585KB) ( 630 )   
参考文献 | 相关文章 | 多维度评价
泛在服务已成为当前用户的一种基本需求。移动物联网作为泛在服务的一种重要实现形式,面临着网络接入点分布不均匀、频谱无法全面覆盖和网络不稳定等问题,因此用户服务的可信性难以得到保障。与此同时,现有面向移动物联网的网络构架缺乏泛在服务保障与可信性保障的有效结合。因此,首先提出“可信超网络”的新概念,即在传统网络的基础上,利用认知计算技术构建虚拟网或者逻辑网络;然后在可信超网络概念的基础上结合移动物联网的特点,提出以可信性确保为目标、以泛在服务为核心能力的可信超网络构架,从总体上保障移动物联网泛在服务的可信性。
差分隐私在协同过滤算法中的应用研究
鲜征征,李启良,李改,李磊
计算机科学. 2017, 44 (5): 81-88.  doi:10.11896/j.issn.1002-137X.2017.05.015
摘要 ( 388 )   PDF(815KB) ( 979 )   
参考文献 | 相关文章 | 多维度评价
利用背景知识间接推导出个人隐私信息已成为Internet用户更担忧的问题,定义极为严格且可证明的差分隐私保护是目前解决该问题的最有效的隐私保护技术。Berlioz等将差分隐私保护技术应用于协同过滤算法之一的矩阵分解中,虽然提出了新的算法,但是缺少严格的证明过程。针对他们提出的算法,将补充相应的数学证明,然后 将Chaudhuri等提出的目标函数加扰方法灵活应用于ALS目标函数中。此外,还给出一种差分隐私保护参数的选择方案。最后,在两个真实数据集上的实验验证结果表明,所提出的ALS目标函数加扰方法取得了更好的推荐效果。
基于深度极限学习机的危险源识别算法HIELM
李诗瑶,周良,刘虎
计算机科学. 2017, 44 (5): 89-94.  doi:10.11896/j.issn.1002-137X.2017.05.016
摘要 ( 280 )   PDF(512KB) ( 954 )   
参考文献 | 相关文章 | 多维度评价
危险源识别是民用航空管理的重要环节之一,危险源识别结果必须高度准确才能确保飞行的安全。为此,提出了一种基于深度极限学习机的危险源识别算法HIELM(Hazard Identification Algorithm Based on Extreme Lear-ning Machine),设计了一种由多个深层栈式极限学习机(S-ELM)和一个单隐藏层极限学习机(ELM)构成的深层网络结构。算法中,多个深层S-ELM使用平行结构,各自可以拥有不同的隐藏结点个数,按照危险源领域分类接受危险源状态信息完成预学习,并结合识别特征改进网络输入权重的产生方式。在单隐藏层ELM中,深层ELM的预学习结果作为其输入,改进了反向传播算法,提高了网络识别的精确度。同时,分别训练各深层S-ELM,缓解了高维数据训练的内存压力和节点过多产生的过拟合现象。
云存储中基于虚拟用户的数据完整性验证
徐云云,白光伟,沈航,黄中平
计算机科学. 2017, 44 (5): 95-99.  doi:10.11896/j.issn.1002-137X.2017.05.017
摘要 ( 251 )   PDF(465KB) ( 576 )   
参考文献 | 相关文章 | 多维度评价
针对验证数据完整性过程中被撤销用户与云服务器存在共谋的问题,提出基于虚拟用户的数据完整性校验方案。在管理群组用户的过程中,管理员让云服务器作为代理,通过重签名方法将被撤销用户的签名转换为虚拟用户签名,以防止攻击者获取群组用户身份隐私信息。另一方面,管理员在本地存储所有用户的身份隐私信息,用户在访问共享数据之前需要通过管理员的验证,这样既能保证校验者可以正确验证共享数据的完整性,又能保护群组用户的隐私和共享数据的安全。分析证明结果表明,所提方案在用户撤销时不仅能够验证共享数据的完整性,还能降低攻击者精确获取用户身份隐私信息和共享数据内容的概率。
一种面向融合泛在网的协同防护体系设计
戚湧,莫璇,李千目
计算机科学. 2017, 44 (5): 100-104.  doi:10.11896/j.issn.1002-137X.2017.05.018
摘要 ( 306 )   PDF(545KB) ( 441 )   
参考文献 | 相关文章 | 多维度评价
在深入分析融合泛在网功能和特征的基础上,通过增加安全接入网关和虚拟重构安全控制服务器(简称安全控制服务器)两类主要的功能实体构成协同防护的硬件体系,同时通过策略订阅实现协同防护的软件逻辑体系,并采用基于证据投影分解方法的证据理论实现安全态势评估,从而实现在融合泛在网中各种末梢网络均可通过安全接入网关,利用现有的各种异构接入网络安全接入到位于IP核心网的安全服务平台,也可将安全服务命令和数据发送到末梢节点。
云环境中基于cache负载实时定噪的同驻分析方法
何佩聪,黄汝维,陈宁江,赵搏文,刘洋
计算机科学. 2017, 44 (5): 105-110.  doi:10.11896/j.issn.1002-137X.2017.05.019
摘要 ( 209 )   PDF(571KB) ( 624 )   
参考文献 | 相关文章 | 多维度评价
云计算具有使用便捷、可按需定制服务、优化资源利用等特点,成为提供外包服务的主要计算模式。云环境中的虚拟机侧通道攻击是云计算的主要潜在威胁之一,同驻是云环境中侧通道攻击的前提。针对如何在多租户云环境下进行同驻检测,提出基于链式结构的Prime-Probe测量cache负载方法MCLPPLS和针对云环境噪声复杂多变问题的实时噪声分析机制RTNAM。结合MCLPPLS与RTNAM提出一种新型的同驻检测分析方法。实验表明,该方法能减少突发噪声对同驻检测的干扰,有较高的同驻检测正确率及较低的同驻检测时耗,表现出良好的性能。
基于属性圆的多属性决策云模型构建与可靠性分析应用
崔铁军,李莎莎,王来贵
计算机科学. 2017, 44 (5): 111-115.  doi:10.11896/j.issn.1002-137X.2017.05.020
摘要 ( 255 )   PDF(412KB) ( 462 )   
参考文献 | 相关文章 | 多维度评价
为了使云模型能直观方便地表示以及计算多属性决策问题,并且适应专家给出的范围数据,对提出的属性圆表示多属性的方法进行了改造,从而通过属性圆来计算云模型的特征参数;给出了改造后属性圆的定义、性质和绘制过程,以及如何通过属性圆计算表示某决策级别的云模型特征参数,包括:定义决策系统、属性归一化、属性圆特征及性质、属性圆面积求法、基于属性圆的云模型计算;通过实例给出了云模型的计算过程和应用方案。根据数据处理和专家分析,计算得到表示系统可靠性风险为可接受决策级别的云模型,进而构成决策云集合,便可用于实际系统的可靠性级别多属性决策。
基于混合式聚类算法的离群点挖掘在异常检测中的应用研究
尹娜,张琳
计算机科学. 2017, 44 (5): 116-119.  doi:10.11896/j.issn.1002-137X.2017.05.021
摘要 ( 247 )   PDF(424KB) ( 576 )   
参考文献 | 相关文章 | 多维度评价
为了提高异常检测系统的检测率,降低误警率,解决现有异常检测所存在的问题,将离群点挖掘技术应用到异常检测中,提出了一种基于混合式聚类算法的异常检测方法(NADHC)。该方法将基于距离的聚类算法与基于密度的聚类算法相结合从而形成新的混合聚类算法,通过k-中心点算法找出簇中心,进而去除隐蔽性较高的少量攻击行为样本,再将重复增加样本的方法结合基于密度的聚类算法计算出异常度,从而判断出异常行为。最后在KDD CUP 99数据集上进行实验仿真,验证了所提算法的可行性和有效性。
基于分类树的动态集值型数据发布的隐私保护
石秀金,胡艳玲
计算机科学. 2017, 44 (5): 120-124.  doi:10.11896/j.issn.1002-137X.2017.05.022
摘要 ( 214 )   PDF(508KB) ( 542 )   
参考文献 | 相关文章 | 多维度评价
基于分类树的差分隐私保护方法有效地对静态集值型数据进行了保护,但对于动态集值型数据却没有相应的保护方法,因此提出一种基于分类树的差分隐私保护下的动态集值型数据发布的算法。该算法首先根据数据集中项的全集构造关系矩阵,挑选关系最紧密的项集构造分类树;然后设定一个边界值来限制数据的增量更新,并将新增的记录添加到分类树的根节点中,按照初始分类树的分配法迭代分配每个记录;最后根据拉普拉斯机制向叶子节点中加入噪音,保证整个算法满足差分隐私的要求。相对已有算法,所提算法优化了分类树,使所发布数据建立的分类树模型有少量的叶子节点产生,减少了噪音的添加。实验用两组真实的数据集验证了所提算法的有效性和相对于其他算法的优越性。
基于开源工具集的大数据网络安全态势感知及预警架构
琚安康,郭渊博,朱泰铭
计算机科学. 2017, 44 (5): 125-131.  doi:10.11896/j.issn.1002-137X.2017.05.023
摘要 ( 637 )   PDF(682KB) ( 1190 )   
参考文献 | 相关文章 | 多维度评价
对信息系统安全防护而言,大数据是一把双刃剑。信息量的巨增使得数据价值密度更小,给APT等攻击行为提供了更好的藏身环境;但大数据处理技术对海量数据的聚合、挖掘和分析又使得准确检测及预测攻击威胁成为可能。为增强信息系统的威胁感知与攻击预警能力,构建大数据威胁处理平台势在必行。基于最新的开源大数据组件集,构建了集数据收集整理、数据存储、离线分析发现、实时关联检测、威胁预警和态势呈现等功能于一体的、支持全流程安全事件处理过程的、完整的网络安全态势感知及预警架构,与现有同类平台架构相比,其具有高可用、可扩展、易部署等特点,且能较好地支持威胁情报的引入。
基于状态的工控协议Fuzzing测试技术
张亚丰,洪征,吴礼发,周振吉,孙贺
计算机科学. 2017, 44 (5): 132-140.  doi:10.11896/j.issn.1002-137X.2017.05.024
摘要 ( 572 )   PDF(1416KB) ( 1923 )   
参考文献 | 相关文章 | 多维度评价
针对传统Fuzzing测试应用于工控系统存在测试覆盖率和有效性低、异常监测手段受限等不足,提出了一种基于状态的工控协议Fuzzing测试方法。该方法采用XML脚本对协议状态机进行描述,设计了基于协议状态机的测试序列生成算法PSTSGM,对被测对象进行状态引导以求达到更高的命中率和覆盖率。提出了基于心跳的异常监测与定位方法HFDLM,采用心跳探测和循环定位的方式,对被测嵌入式设备进行异常行为监测和异常用例定位。设计并实现了基于中间人代理的模糊测试原型系统SCADA-Fuzz,对电力SCADA系统进行了测试。实验结果表明,利用状态引导的测试能够有效发现安全漏洞。
基于协议混合变形的Web安全模糊测试与效用评估方法
涂玲,马跃,程诚,周彦晖
计算机科学. 2017, 44 (5): 141-145.  doi:10.11896/j.issn.1002-137X.2017.05.025
摘要 ( 376 )   PDF(421KB) ( 541 )   
参考文献 | 相关文章 | 多维度评价
在Web应用安全模糊测试中,存在测试用例覆盖率低、测试效用无法得到有效验证及漏洞检测结果无法得到有效评估等问题。提出了协议变形和动态特征并行混合的测试用例生成方法,建立了按典型漏洞分类的输入特征组合规则和协议变形规则,并形成了基于污染传播策略漏洞响应数据分析和有效性验证的方法。实验表明所提方法增大了测试用例的多样性以及提高了覆盖率,降低了在网站过滤环境复杂情况下的漏洞检测的漏报率和误报率。
一种云环境中密文数据的模糊多关键词检索方案
何亨,夏薇,张继,金瑜,李鹏
计算机科学. 2017, 44 (5): 146-152.  doi:10.11896/j.issn.1002-137X.2017.05.026
摘要 ( 399 )   PDF(609KB) ( 602 )   
参考文献 | 相关文章 | 多维度评价
越来越多的企业和个人用户将大量的数据存储在云服务器。为了保障数据隐私,重要数据以密文形式存储在云端,但却给数据检索操作带来严峻挑战。传统的基于明文的检索方案不再适用,已有的基于密文的检索方案存在不支持模糊检索或多关键词检索、效率较低、空间开销较大、不支持检索结果排序等问题。因此,研究安全高效的密文检索方法具有重要意义。提出了一种新的云环境中密文数据的模糊多关键词检索方案,该方案能够从云服务器上检索出包含有指定多个关键词的密文,支持模糊关键词检索,并且不会向云服务器和其他攻击者泄露与数据和检索相关的任何明文信息;使用计数型布隆过滤器和MinHash算法构建索引向量和查询向量,使得索引构建和查询过程更加高效,且排序结果更加准确。安全性分析和性能评估表明该方案具有高安全性、可靠性、检索效率和准确率。
基于Stackelberg博弈的海事安全问题研究
巩绪福,蔚承建,钱震,车宝真,沈航
计算机科学. 2017, 44 (5): 153-159.  doi:10.11896/j.issn.1002-137X.2017.05.027
摘要 ( 203 )   PDF(575KB) ( 772 )   
参考文献 | 相关文章 | 多维度评价
近年来,安全问题在全世界范围内得到了越来越多的重视,如何利用有限的安全资源最大限度地部署防御策略保护重要的设施以及目标是许多安全部门所面临的一项艰巨的挑战。针对海事安全巡逻问题,提出基于Stackelberg博弈的安全模型进行安全资源调度,在安全资源有限的情况下,对现实世界中出现的时空限制和人类行为不完全理性因素进行了综合考虑,放宽了经典安全博弈模型对攻击者是完美理性这一假设。在随机最优反应均衡理论的基础上考虑了攻击者的行为偏好,对非完全理性情况下的最佳策略和完全理性情况下的最佳策略进行对比和分析,实验结果表明,非完全理性下的新模型在现实问题中可以获得更高的收益,可更有效地用于海事安全巡逻问题。
可公开定责的密文策略属性基加密方案
马潇潇,于刚
计算机科学. 2017, 44 (5): 160-165.  doi:10.11896/j.issn.1002-137X.2017.05.028
摘要 ( 316 )   PDF(506KB) ( 735 )   
参考文献 | 相关文章 | 多维度评价
属性基加密利用属性集和访问结构之间的匹配关系实现用户解密权限的控制,从功能上高效灵活地解决了“一对多”的密数据共享问题,在云计算、物联网、大数据等细粒度访问控制和隐私保护领域有光明的应用前景。然而,在属性基加密系统中(以密文策略属性基加密为例),一个属性集合会同时被多个用户拥有,即一个解密私钥会对应多个用户,因此用户敢于共享其解密私钥以非法获利。此外,半可信的中心存在为未授权用户非法颁发私钥的可能。针对属性基加密系统中存在的两类私钥滥用问题,通过用户和中心分别对私钥进行签名的方式,提出一个密文策略属性基加密方案。该方案支持追踪性和公开定责性,任何第三方可以对泄露私钥的原始持有者的身份进行追踪,审计中心可以利用公开参数验证私钥是用户泄露的还是半可信中心非法颁发的。最后,可以证明方案的安全性基于其依赖的加密方案、签名方案。
面向云数据安全存储的分段融合模糊聚类算法
单冬红,史永昌,赵伟艇,张敬普
计算机科学. 2017, 44 (5): 166-169.  doi:10.11896/j.issn.1002-137X.2017.05.029
摘要 ( 370 )   PDF(1097KB) ( 473 )   
参考文献 | 相关文章 | 多维度评价
为了提高云数据的安全存储性能,需要对数据进行优化属性聚类归集。针对传统方法采用模糊C均值聚类进行云数据存储归类设计具有对初始聚类中心敏感、容易陷入局部收敛的问题,提出一种基于分段融合模糊聚类的云数据安全存储模型构建方法。建立云数据安全存储的网格分布结构模型并进行数据结构分析,进行云数据属性集的向量量化特征分解,对海量的云存储数据流采用分段匹配检测方法进行特征压缩,实现冗余数据自适应归集合并,挖掘云数据信息流的高阶谱特征。在模糊C均值聚类算法的基础上采用分段数据融合进行数据分簇模糊聚类,提高数据存储的安全性,同时降低云数据存储的负荷。仿真结果表明,采用该方法进行云数据聚类和优化存储设计,能降低数据聚类的误分率,提高云数据存储的吞吐量,确保云数据的安全存储。
一类有限域上的置换多项式
魏晴,孙光洪
计算机科学. 2017, 44 (5): 170-171.  doi:10.11896/j.issn.1002-137X.2017.05.030
摘要 ( 390 )   PDF(202KB) ( 584 )   
参考文献 | 相关文章 | 多维度评价
有限域上的置换多项式在科学工程中的多个领域有着广泛的应用,尤其应用于现代通讯、密码学等领域中。基于Zha等人在文献[23]中提出,当t为偶数时,有限域Fpn上形如(xpk-x+δ)t+γx+βTr(x)的多项式是置换的,通过进一步研究,运用证明置换多项式的一般方法,将其改进为无论t为奇数或偶数,(xpk+1-xp+δ)t+γx+βTr(x)形式的多项式在Fpn上均是置换的。
软件与数据库技术
分布式流数据加载和查询技术优化
易佳,薛晨,王树鹏
计算机科学. 2017, 44 (5): 172-177.  doi:10.11896/j.issn.1002-137X.2017.05.031
摘要 ( 373 )   PDF(545KB) ( 607 )   
参考文献 | 相关文章 | 多维度评价
分布式流查询是一种基于数据流的实时查询计算方法,近年来得到了广泛的关注和快速发展。综述了分布式流处理框架在实时关系型查询上取得的研究成果;对涉及分布式数据加载、分布式流计算框架、分布式流查询的产品进行了分析和比较;提出了基于Spark Streaming和Apache Kafka构建的分布式流查询模型,以并发加载多个文件源的形式,设计内存文件系统实现数据的快速加载,相较于基于Apache Flume的加载技术提速1倍以上。在Spark Streaming的基础上,实现了基于Spark SQL的分布式流查询接口,并提出了自行编码解析SQL语句的方法,实现了分布式查询。测试结果表明,在查询语句复杂的情况下,自行编码解析SQL的查询效率具有明显的优势。
面向大数据分布式存储的动态负载均衡算法
张栗粽,崔园,罗光春,陈爱国,卢国明,王晓雪
计算机科学. 2017, 44 (5): 178-183.  doi:10.11896/j.issn.1002-137X.2017.05.032
摘要 ( 494 )   PDF(522KB) ( 1017 )   
参考文献 | 相关文章 | 多维度评价
随着大数据时代的到来,分布式存储技术应运而生。目前主流大数据技术Hadoop的HDFS分布式存储系统的元数据存储架构上一直存在可扩展性差和写延迟高等问题,其在官方2.0版本中针对可扩展性的解决方案(Fe-deration)仍不完美,仅解决了原有HDFS扩展性的问题,在元数据分配的问题上没有考虑NameNode的异构性能差异,也未解决NameNode集群动态负载均衡的问题。针对该情况,提出了一种动态负载均衡的分布NameNode算法,通过元数据多副本异构节点的动态适应性备份,使元数据在考虑节点性能及负载的情况下实现了动态分布,保证了元数据服务器集群的性能;同时结合缓存策略及自动恢复机制,提高了元数据的读写性及可用性。该算法在试验验证中达到了较为理想的效果。
一种基于单数据源的可视化自定义报表模型
汤加,符云清,万煊民
计算机科学. 2017, 44 (5): 184-188.  doi:10.11896/j.issn.1002-137X.2017.05.033
摘要 ( 271 )   PDF(412KB) ( 523 )   
参考文献 | 相关文章 | 多维度评价
通过一种新的可视化定义报表方法,用户可根据需要灵活定义报表样式,并利用XML实现动态创建数据表;在此基础上配置数据源及其字段与报表单元格间的关系,系统将据此自动拼装出相应的SQL,从而快速生成满足用户需求的各类基于单数据源的报表,并可对生成的报表进行预览和导出到Excel文件。最后,在重庆交通运输(控股)集团中的实际应用表明,这种新的可视化自定义报表方法能快速适应报表变更需求,大大提高了工作效率,并保护了用户的投资。
异构信息空间中时间感知的跨类型实体推荐
杨丹,陈默,王刚,孙良旭
计算机科学. 2017, 44 (5): 189-192.  doi:10.11896/j.issn.1002-137X.2017.05.034
摘要 ( 298 )   PDF(400KB) ( 499 )   
参考文献 | 相关文章 | 多维度评价
随着实体搜索成为信息检索的一种新趋势,实体推荐也成为业界和学术界的热门研究问题之一。异构信息空间中的异构实体间彼此相互关联,因此跨类型实体推荐至关重要。此外,异构实体具有时间信息,异构信息空间中的实体不断随时间演化,用户希望得到在时间上最相关的实体推荐。提出一个时间感知的跨类型实体推荐框架T-ERe,利用异构实体间丰富的关联关系和查询日志实现跨类型的实体推荐。T-ERe考虑实体的时间信息和查询的时间上下文, 给用户推荐时间上最相关的多种类型的实体。在真实数据集上的实验结果表明了T-ERe的可行性和有效性。
使用模型检测解决概率布尔网络优化控制
郭宗豪,魏欧
计算机科学. 2017, 44 (5): 193-198.  doi:10.11896/j.issn.1002-137X.2017.05.035
摘要 ( 258 )   PDF(632KB) ( 737 )   
参考文献 | 相关文章 | 多维度评价
系统生物学期望对复杂生物系统建立一个真实的、可计算的模型,以便于以系统的角度去理解生物系统的演变过程。在系统生物学中,一个重要的主题是通过外部的干预控制发展关于基因调控网络的控制理论,以作为未来基因治疗技术。目前,布尔网络及其扩展的概率布尔网络已经被广泛用于对基因调控网络进行建模。在控制问题的研究中,概率布尔控制网络的状态迁移本质上构成一条有限状态空间的离散时间马尔科夫决策过程。依据马尔科夫决策过程的理论,通过概率模型检测方法解决网络中有限范围优化控制问题和无限范围优化控制问题。针对带有随机干扰且上下文相关的概率布尔控制网络,使用概率模型检测器PRISM对其进行形式化建模,然后将两类优化控制问题描述为相应的时序逻辑公式,最后通过模型检测寻找出最优解。实验结果表明,提出的方法可以有效地用于生物网络的分析和优化控制。
人工智能
多粒度决策粗糙集中的粒度约简方法
桑妍丽,钱宇华
计算机科学. 2017, 44 (5): 199-205.  doi:10.11896/j.issn.1002-137X.2017.05.036
摘要 ( 213 )   PDF(515KB) ( 541 )   
参考文献 | 相关文章 | 多维度评价
多粒度决策粗糙集模型是一种泛化的多粒度粗糙集模型,该模型结合决策粗糙集数据分析理论和多粒度思想,实现了在多个粒空间进行决策粗糙集理论的建模。在此基础上,利用贝叶斯决策理论具体分析了在多粒度粗糙集模型中乐观和悲观的融合策略下多个粒空间中的概率融合关系,推导出基于最大条件概率和最小条件概率的粗糙集近似表示,进而构建了乐观多粒度决策粗糙集模型和悲观多粒度决策粗糙集模型。在该模型中引入近似分布约简的概念,分析了多个粒空间中的粒度选择问题。基于多粒度近似分布质量定义了多粒度决策粗糙集的粒度重要度,并且基于此给出了悲观和乐观融合策略α-下近似分布约简的粒度约简算法。通过实例验证了该算法的有效性。
直觉模糊序信息系统下变精度与程度的“逻辑且”粗糙集
胡猛,李蒙蒙,徐伟华
计算机科学. 2017, 44 (5): 206-210.  doi:10.11896/j.issn.1002-137X.2017.05.037
摘要 ( 205 )   PDF(425KB) ( 446 )   
参考文献 | 相关文章 | 多维度评价
通过综合考虑集合中元素的隶属度、非隶属度和犹豫度,定义了直觉模糊信息系统的加权得分函数。基于此得分函数,定义了直觉模糊信息下的优势关系,运用“逻辑且”的方式将变精度粗糙集和程度粗糙集结合起来定义了“逻辑且”粗糙集模型,并研究了其相关性质。最后,通过实例分析进一步体现了该研究的意义,为序信息系统的知识表示提供了新的理论基础。
基于副本交换的局部增强差分进化蛋白质结构从头预测方法
李章维,郝小虎,张贵军
计算机科学. 2017, 44 (5): 211-217.  doi:10.11896/j.issn.1002-137X.2017.05.038
摘要 ( 216 )   PDF(2008KB) ( 530 )   
参考文献 | 相关文章 | 多维度评价
针对蛋白质高维构象空间搜索问题,提出一种基于副本交换的局部增强差分进化蛋白质结构从头预测方法(RLDE)。首先,采用基于知识的Rosetta粗粒度能量模型显著降低构象空间优化变量维数;其次,引入基于片段库知识的片段组装技术进一步减小构象搜索空间,有效避免搜索过程中的熵效应;此外,在每个副本层设置构象种群,采用差分进化算法对种群进行更新,然后利用Monte Carlo算法对种群做局部增强,以此得到全局和部分局部最优构象。综上,RLDE利用差分进化算法较强的全局搜索能力可以对构象空间进行有效的全局搜索;借助Monte Carlo算法局部搜索性能对构象空间局部极小区域进行更为充分的采样;副本交换策略保证了副本层中种群的多样性,同时能够增强算法跳出局部极小的能力,从而使得算法对构象空间的搜索能力进一步增强。15个目标蛋白测试结果表明,所提方法能够有效地对构象空间采样,得到高精度的近天然态蛋白质构象。
一种基于混沌和单纯形法的水波优化算法
吴秀丽,周永权
计算机科学. 2017, 44 (5): 218-225.  doi:10.11896/j.issn.1002-137X.2017.05.039
摘要 ( 223 )   PDF(1270KB) ( 671 )   
参考文献 | 相关文章 | 多维度评价
水波优化(Water Wave Optimization,WWO)算法是一种基于浅水波理论的新兴元启发式优化算法,通过模拟水波的传播、碎浪、折射操作在解空间中进行全局搜索。为提高算法的收敛速度和精度,提出了一种基于混沌(Ch-aotic)优化和单纯形法(Simplex Method,SM)的水波优化算法,简称为CSMWWO。在CSMWWO算法中,引入了混沌优化策略来降低随机初始化的种群对收敛速度和求解精度的影响,在混沌优化策略的基础上又引入了局部搜索能力较强的单纯形法来提高WWO算法的收敛速度。将CSMWWO与包括WWO在内的4个启发式算法在12个基本测试函数上进行了测试,结果表明改进后的算法在计算精度和收敛速度上都有一定程度的提高,所提出的混合水波优化算法能改进水波优化算法的整体性能。
基于异构中文在线百科的层次话题构建
王煦中,刘琰,胡琳梅,陈静
计算机科学. 2017, 44 (5): 226-231.  doi:10.11896/j.issn.1002-137X.2017.05.040
摘要 ( 212 )   PDF(1251KB) ( 540 )   
参考文献 | 相关文章 | 多维度评价
中文在线百科包含大量有价值的信息,很多工作成功地将其用于各类知识获取任务。例如,拥有相似话题的文档可以被归为一个概念。从这些在线百科中构建出的针对某一概念的层次话题对于搜索与浏览、信息组织和检索等应用都有很大的帮助。然而,目前尚未出现对在线百科中某一概念层次话题构建的研究。针对中文在线百科的异构性与粗糙性的问题,提出了一种基于贝叶斯网络的话题层次构建方法。该方法同时综合文档的结构化目录信息和非结构化文本信息,采用最大树形图算法自动地在文档所属概念的贝叶斯话题网络中建立层次话题。实验证明,与原有的百科话题结构相比较,所提方法在保持75%的准确性的同时扩充了4倍的内容。
基于Floyd算法的多重最短路问题的改进算法
左秀峰,沈万杰
计算机科学. 2017, 44 (5): 232-234.  doi:10.11896/j.issn.1002-137X.2017.05.041
摘要 ( 517 )   PDF(315KB) ( 1300 )   
参考文献 | 相关文章 | 多维度评价
路径分析是网络分析最基本的问题,其核心是对最短路径的求解。Floyd算法是一种求取最短路的经典算法。分析发现,两点间可能存在多条权重相同的最短路径,而这一点Floyd算法没有涉及。以无向联通图为研究对象,设计了基于Floyd求解多重等价最短路算法,并分析计算了一个实际算例。计算结果表明,基于Floyd的多重等价最短路算法可以有效解决多重等价最短路问题。
自适应步长布谷鸟搜索算法
李荣雨,戴睿闻
计算机科学. 2017, 44 (5): 235-240.  doi:10.11896/j.issn.1002-137X.2017.05.042
摘要 ( 604 )   PDF(462KB) ( 1400 )   
参考文献 | 相关文章 | 多维度评价
布谷鸟搜索算法(CSA)是一种新颖且简单、高效的生物启发式算法。针对标准算法存在后期收敛速度慢、易陷入局部最优等问题,提出了一种新的自适应步长布谷鸟搜索算法(ASCSA)。通过自适应调整莱维飞行步长使算法在前期拥有较大的寻优空间,提高全局搜索能力;步长随迭代自适应减小,算法的局部开发能力增强。针对偏好随机游动,引入动态惯性权重和记忆策略后,算法能够充分利用历史经验,稳定性得到提高。实验结果表明,改进后的布谷鸟搜索算法的各方面性能较标准算法及相关改进版本都有显著提高。
一种中文事件事实性识别方法
何天雄,李培峰,朱巧明
计算机科学. 2017, 44 (5): 241-244.  doi:10.11896/j.issn.1002-137X.2017.05.043
摘要 ( 291 )   PDF(447KB) ( 757 )   
参考文献 | 相关文章 | 多维度评价
事件事实性指出了事件发生与否的确定性程度,是自然语言理解的基础。在研究过程中,针对中文事件的事实性识别问题,提出了一种基于特征工程的有效识别方法。该方法选取事件的事实性相关信息进行特征的处理和转化。同时,考虑到部分特征与事件事实性之间的联系,依据规则进行特征融合。实验证明,相比基于规则的事件事实性识别方法,该方法有着更好的识别效果。
基于动态QoS的Web服务选取方法
方晨,王晋东,于智勇
计算机科学. 2017, 44 (5): 245-250.  doi:10.11896/j.issn.1002-137X.2017.05.044
摘要 ( 220 )   PDF(509KB) ( 691 )   
参考文献 | 相关文章 | 多维度评价
针对动态环境中Web服务QoS属性值波动的问题,提出一种基于动态QoS的服务选取方法。该方法首先建立区间QoS模型来表示QoS属性值的动态变化,然后用区间相似度衡量候选服务提供的QoS属性与用户需求值的接近程度。基于相似度的概念,采用逼近理想点的多属性决策方法计算出每个基本服务的QoS指标客观权重,并结合用户主观偏好得出QoS指标综合权重,最终基于推荐度对候选服务进行排序。仿真实验表明,此服务选取方法既充分考虑了用户的主观偏好,又克服了Web服务QoS属性值的波动影响,提高了服务选取的准确性。
基于LTE方向型传播模型的模拟退火加权定位算法
王卫红,严鲁琴,杨洁
计算机科学. 2017, 44 (5): 251-256.  doi:10.11896/j.issn.1002-137X.2017.05.045
摘要 ( 409 )   PDF(1167KB) ( 719 )   
参考文献 | 相关文章 | 多维度评价
针对LTE网络采集到的MRO数据,提出一种基于LTE方向型传播模型的模拟退火加权定位算法。先结合LTE定向天线和小区特性,引入方向型参量提出基于RSS的方向型传播模型,对传统的信号传播模型COST-231 Hata进行改进;然后提出距离比加权算法消除RSS波动误差,将定位问题转换为一元求解问题,使用模拟退火算法计算最优解;最后通过距离椭圆模型对结果进行方位校正,得到最终终端定位结果。算法对比实验结果表明,基于LTE方向型传播模型的模拟退火加权定位算法具有较高的定位精度,完全符合FCC规定的定位精度要求。
基于模拟退火与高斯扰动的烟花优化算法
韩守飞,李席广,拱长青
计算机科学. 2017, 44 (5): 257-262.  doi:10.11896/j.issn.1002-137X.2017.05.046
摘要 ( 279 )   PDF(448KB) ( 806 )   
参考文献 | 相关文章 | 多维度评价
烟花算法(Fireworks Algorithm,FWA)是一种群体智能优化算法,具有求解复杂问题的全局最优解的能力。为了提高FWA求解全局最优解的能力,将模拟退火的思想引入到烟花优化算法中,并对FWA中某些单个烟花个体进行高斯扰动,提出了一种基于模拟退火与高斯扰动的烟花优化算法(SAFWA)。分别把烟花算法(FWA)、标准粒子群算法(SPSO)、增强烟花算法(EFWA)和SAFWA在10个典型的基准测试函数中进行仿真对比,结果表明,在收敛速度、计算精度以及稳定性方面,SAFWA均优于其他3种算法。
基于IF-HPSO算法的防空作战WTA问题研究
梅海涛,华继学,王毅,文童
计算机科学. 2017, 44 (5): 263-267.  doi:10.11896/j.issn.1002-137X.2017.05.047
摘要 ( 316 )   PDF(413KB) ( 500 )   
参考文献 | 相关文章 | 多维度评价
武器-目标分配问题(WTA)是防空作战指挥决策中的一个关键环节,属于典型的NP难问题。为提高其求解速度和精度,提出一种基于直觉模糊的混合粒子群优化算法(IF-HPSO)。首先,以弹药消耗最小、拦截率最大为目标函数,建立火力资源受限条件下WTA的优化模型;采用实数编码,引入直觉模糊领导力函数选择出较优粒子参与速度更新;定义种群同构因子函数来调节惯性权重和学习因子;此外,将基于精英保留策略的遗传操作混合PSO算法进行迭代寻优,加快收敛速度;最后,对WTA问题实例进行仿真并将所提算法与AIA,GA,HDPSO算法进行比较,结果表明所提算法具有更快的寻优速度和更高的求解精度。
基于卡尔曼滤波参数自学习的大坝变形预测
占鹏飞,吕鑫,毛莺池,徐淑芳,王龙宝,马鸿旭
计算机科学. 2017, 44 (5): 268-271.  doi:10.11896/j.issn.1002-137X.2017.05.048
摘要 ( 239 )   PDF(406KB) ( 666 )   
参考文献 | 相关文章 | 多维度评价
卡尔曼滤波模型被广泛运用于大坝的变形预测,然而其参数的识别,尤其是状态和观测噪音协方差矩阵的识别,主要来源于工程经验和领域专家知识。因此提出一种自学习的参数识别方法,该方法基于历史数据,结合Monte Carlo和拒绝采样算法获取卡尔曼滤波参数。具体地,从训练样本中挑选出与真实值最接近的实测值对状态噪音进行估计,并通过计算它与总体误差的差值来确定观测噪音。实验表明,相比已有的同类方法,该方法的准确性更高,更适用于大坝变形预测。
基于神经网络的异构网络向量化表示方法
吴卫祖,刘利群,谢冬青
计算机科学. 2017, 44 (5): 272-275.  doi:10.11896/j.issn.1002-137X.2017.05.049
摘要 ( 220 )   PDF(317KB) ( 714 )   
参考文献 | 相关文章 | 多维度评价
当网络中存在不同类型的对象时,对象与对象之间的关系会变得多种多样,网络的结构也会变得更为复杂。针对网络的异构化问题,提出了一种基于神经网络的异构网络向量化表示方法。针对具有图片和文本两种类型对象的异构网络,采用多层次的卷积网络将图片映射到一个潜在的特征空间,采用全连接的神经网络将文本对象也映射到相同的特征空间。在该特征空间内,图片与图片、文本与文本以及图片和文本之间的相似性采用相同的距离计算方法。在实验中,应用提出的方法进行异构网络的多种应用测试,结果表明提出的方法是有效的。
基于秩约束密度敏感距离的自适应聚类算法
任永功,刘洋,赵月
计算机科学. 2017, 44 (5): 276-279.  doi:10.11896/j.issn.1002-137X.2017.05.050
摘要 ( 275 )   PDF(380KB) ( 490 )   
参考文献 | 相关文章 | 多维度评价
传统的聚类算法一般使用欧氏距离获得数据的相似矩阵,在处理一些较复杂的数据时,欧氏距离由于不能反映全局一致性,因此无法有效地描述出数据点的实际分布。提出了一种基于秩约束密度敏感距离(Rank Constraints Density Sensitive Distance,RCDSD) 的自适应聚类算法。该方法首先引入密度敏感距离的相似性度量得到相似矩阵,有效地扩大了不同类数据点之间的距离,缩小了同类数据点间的距离,从而解决了传统聚类算法使用欧氏距离作为相似性度量导致聚类结果出现偏差的弊端;其次,在相似矩阵的拉普拉斯矩阵上施加秩约束,使相似矩阵的连通区域数等于聚类数,直接将数据点划分到正确的类中,得到最终的聚类结果,而不需要执行k-means或其它离散化程序。在人工仿真数据集和真实数据集上进行了大量实验,结果表明,所提算法得到了准确的聚类结果,并提高了聚类性能。
基于汉语复句的语义相关度计算及类别的标识
杨进才,陈忠忠,沈显君,胡金柱
计算机科学. 2017, 44 (5): 280-284.  doi:10.11896/j.issn.1002-137X.2017.05.051
摘要 ( 327 )   PDF(399KB) ( 663 )   
参考文献 | 相关文章 | 多维度评价
语义相关度计算作为中文信息处理领域中的一项关键技术,在信息检索、语义消岐、文本分类中起着重要的作用。利用汉语复句的句法理论和关系标记搭配理论,以汉语复句语料库以及搜索引擎获取的复句为语料,提出了一种基于汉语复句的语义相关度计算方法——SRCCS。本方法不仅能够计算词语的相关度,而且能够表明相关的性质与类别。与通过短文计算相关度的方法相比,本方法选取的计算对象范围更小,因而结果更准确,计算复杂度更低。在同一测试集上与搜索引擎方法的对比分析证明了基于汉语复句的语义相关度计算方法的有效性与优越性。
基于改进贝叶斯概率模型的推荐算法
刘付勇,高贤强,张著
计算机科学. 2017, 44 (5): 285-289.  doi:10.11896/j.issn.1002-137X.2017.05.052
摘要 ( 202 )   PDF(393KB) ( 995 )   
参考文献 | 相关文章 | 多维度评价
针对现有基于矩阵分解的协同过滤推荐系统预测精度与推荐精度较低的问题,提出一种改进的矩阵分解方法与协同过滤推荐系统。首先,将评分矩阵分解为两个非负矩阵,并对评分做归一化处理,使其具有概率语义;然后,采用变分推理法计算贝叶斯概率模型实部后验的分布;最后,搜索相同偏好的用户分组并预测用户的偏好。此外,基于用户向量的稀疏性设计一种低计算复杂度、低存储成本的推荐结果决策算法。基于3组公开数据集的实验结果表明,本算法的预测性能以及推荐系统的效果均优于其他预测算法与推荐算法。
求解2-D Strip Packing问题的u-分组优化算法
黄海,李松斌
计算机科学. 2017, 44 (5): 290-293.  doi:10.11896/j.issn.1002-137X.2017.05.053
摘要 ( 350 )   PDF(1160KB) ( 637 )   
参考文献 | 相关文章 | 多维度评价
D strip packing问题指将带有价值的矩形物品装入长宽固定的箱子中,使其装入的物品价值最大。基于装箱的期望目标ε,提出一种新的分组构造函数,结合装箱矩形特点计算出最优分组参数u并对矩形进行分类,同时对不同类别的矩形引入相应的数据结构,最后对不同类别矩形基于箱子X轴的u等分点进行填充,使其装入的物品价值最大。文中的主要贡献在于:提出了一种有效的分组构造函数;计算出了对应的最优分组参数u;简化了不同类别箱体的数据结构以及相应的装箱算法;特别地,在期望目标ε、多项式时间复杂度和 至少装入(1-ε) OPT价值物品的情况下,可将所需箱体宽度从1+ε减小到1,而高度保持不变。
图形图像与模式识别
基于改进的PBAS算法的前景目标检测
汪荣琪,郑林,王标
计算机科学. 2017, 44 (5): 294-298.  doi:10.11896/j.issn.1002-137X.2017.05.054
摘要 ( 443 )   PDF(1232KB) ( 607 )   
参考文献 | 相关文章 | 多维度评价
针对像素层自适应分割算法(Pixel Based Adaptive Segmenter,PBAS)在动态背景下检测准确率低、静止或运动缓慢的前景目标被更新为背景以及出现鬼影干扰的问题,提出了一种 结合 像素级信息和区域级信息的改进的前景检测算法。首先,提出一种融合区域结构信息和区域颜色信息的背景复杂度衡量方式;然后,采用改进的背景复杂度来控制判定阈值和学习率,并检测前景;其次,对像素层的检测结果使用区域窗口进行空间邻域对比,以消除鬼影;最后,引入前景计数机制来保证静止前景不被更新为背景。实验结果表明,该算法对光照条件和前景运动速度不敏感,能有效地从背景中检测出完整的前景目标,并迅速地消除鬼影干扰,准确率达到了92.7%。
基于非局部自相似性的谱聚类图像去噪算法
柯祖福,易本顺,谢秋莹
计算机科学. 2017, 44 (5): 299-303.  doi:10.11896/j.issn.1002-137X.2017.05.055
摘要 ( 400 )   PDF(1083KB) ( 777 )   
参考文献 | 相关文章 | 多维度评价
常见的图像去噪方法只是单独地利用了无噪图像或含噪图像的先验信息,并没有将这两种图像的先验信息有效地结合起来。针对这个问题,提出一种 联合无噪图像块的先验信息和含噪图像块的非局部自相似性进行去噪的图像去噪算法。首先,对无噪图像块进行谱聚类,通过谱聚类进行学习,图像中的相似块被聚集到同一类,并将学习得到的聚类信息用于含噪图像块的聚类;然后,向量化同一类中的含噪图像块并聚集形成一个矩阵,该矩阵中包含的原始图像数据构成一个低秩矩阵;再通过一个低秩逼近过程估计出相应的原始图像数据;最后,根据逼近得到的原始图像数据重建图像。实验结果表明,相较于已有的自适应正则化的非局部均值去噪算法以及基于主成分分析和局部像素聚类的两级图像去噪算法,提出的算法不仅可以获得较大的峰值信噪比,而且还能较好地保存图像的细节,取得了更好的去噪效果。
基于子带能熵比的语音端点检测算法
张毅,王可佳,席兵,颜博
计算机科学. 2017, 44 (5): 304-307.  doi:10.11896/j.issn.1002-137X.2017.05.056
摘要 ( 394 )   PDF(366KB) ( 866 )   
参考文献 | 相关文章 | 多维度评价
准确地识别语音端点是语音识别过程中的一个重要步骤。在低信噪比环境下,为更好地增强语音和噪声的区分度,提高语音端点检测系统的准确率,在分析了常规子带谱熵端点检测算法的基础上结合子带能量,提出了一种基于子带能熵比的语音端点检测算法。该算法将子带能量和子带谱熵的比值作为端点检测的重要参数,以此设定阈值进行语音端点的检测。实验表明,该算法快速高效,具有较高的鲁棒性,在较低的信噪比环境下能准确地进行语音端点检测。
基于目标识别与显著性检测的图像场景多对象分割
李青,袁家政,刘宏哲
计算机科学. 2017, 44 (5): 308-313.  doi:10.11896/j.issn.1002-137X.2017.05.057
摘要 ( 207 )   PDF(3273KB) ( 508 )   
参考文献 | 相关文章 | 多维度评价
提出了一种基于目标识别与显著性检测的图像场景多对象分割方法。该方法的步骤包括:在图像训练集上训练语义对象的检测器,用来检测输入图像中对象的位置,标定对象的包围盒;对输入的图像进行过分割处理,得到超像素集合,根据包围盒的位置和超像素的语义概率值计算兴趣区域;在3种稠密尺度上进行场景显著性检测,得到输入图像的显著图;在兴趣区域内计算超像素的邻接关系,形成邻接矩阵,构建条件随机场模型,将多对象分割问题转化成多类别标记问题,每一个对象是一种类别;以每个超像素作为场模型的节点,超像素的邻接关系对应场模型中节点之间的连接关系,将显著性和图像特征转化为节点和边的权重值;利用图割算法,在条件随机场模型上进行优化,迭代终止时得到像素的对象标记结果,从而实现对多个对象的分割。实验结果表明该方法效果较好。
分水岭算法应用于主动轮廓模型能量分割算法的研究
汪梅,李琳,汪斌,何高明
计算机科学. 2017, 44 (5): 314-319.  doi:10.11896/j.issn.1002-137X.2017.05.058
摘要 ( 370 )   PDF(2401KB) ( 816 )   
参考文献 | 相关文章 | 多维度评价
主动轮廓模型(snake模型)被广泛应用于边缘提取、图像分割等领域。该模型能对目标适当初始化,并进行自主收敛,使得能量处于极小值状态,以达到目标分离的效果。当目标初始位置敏感时,需要依赖其他机制对内部能量进行合理初始化,由于模型的非凸性,它有可能收敛到局部极值点甚至发散。将分水岭算法应用于主动轮廓模型的能量分割算法,通过改进的分水岭算法确定主动轮廓模型的初始轮廓,利用迭代完成对轮廓点周围的局部近邻点的检索,以选取更小的轮廓模型,当获得最小值时完成目标轮廓的提取。