计算机科学

曹东,付承毓,金钢

计算机科学. 2016, 43 (12): 1-7. doi:10.11896/j.issn.1002-137X.2016.12.001

摘要 ( 1010 )

PDF(1452KB) ( 1631 )

参考文献 | 相关文章 | 多维度评价

在视频目标跟踪研究中,基于机器学习的理论和算法成为了一个重要的发展方向。在线学习通过对样本持续的学习和更新从而适应背景环境以及目标的变化,能够获得更好的目标跟踪效果。根据算法的特点,将在线学习方法分为集成学习方法、判别式学习方法和核函数学习方法3类。重点对每类中具有代表性的几种方法进行详细描述,并分析其优缺点。最后还分析了机器学习方法在目标跟踪研究中面临的问题和未来的研究趋势。

作战计划生成方法研究现状与展望

程恺,陈刚,张品,尹成祥

计算机科学. 2016, 43 (12): 8-12. doi:10.11896/j.issn.1002-137X.2016.12.002

摘要 ( 863 )

PDF(530KB) ( 2187 )

参考文献 | 相关文章 | 多维度评价

作战计划质量的高低事关战争的成败,而作战行动序列生成是计划制定的关键。目前作战计划生成面临着行动状态搜索空间大,无法有效处理战场不确定因素对计划执行效果的影响,不能满足现代战争非线性、不确定性需求等问题。为此,分别从经典计划生成和作战计划生成中的理论与应用两个方面分析了国内外的研究现状,特别是针对作战计划生成问题中传统的、基于效果作战的以及不确定性的作战行动序列生成方法进行了系统及深入的阐述,进而指出当前该领域的主要研究方向,这对于现代战争中作战计划的生成具有重要指导意义。

深度学习及其在图像物体分类与检测中的应用综述

刘栋,李素,曹志冬

计算机科学. 2016, 43 (12): 13-23. doi:10.11896/j.issn.1002-137X.2016.12.003

摘要 ( 829 )

PDF(1727KB) ( 1594 )

参考文献 | 相关文章 | 多维度评价

传统的图像物体分类与检测算法及策略难以满足图像视频大数据在处理效率、性能和智能化等方面所提出的要求。深度学习通过模拟类似人脑的层次结构建立从低级信号到高层语义的映射,以实现数据的分级特征表达,具有强大的视觉信息处理能力,成为应对这一挑战的前沿技术和国内外研究热点。首先论述了深度学习的起源、发展历程及理论体系;然后分别围绕图像物体分类和检测,总结了近年来深度学习在视觉领域的发展；最后对深度学习及其在视觉领域目前存在的诸多问题以及后续的研究方向进行了分类探讨。

概念漂移数据流挖掘算法综述

丁剑,韩萌,李娟

计算机科学. 2016, 43 (12): 24-29. doi:10.11896/j.issn.1002-137X.2016.12.004

摘要 ( 755 )

PDF(637KB) ( 2937 )

参考文献 | 相关文章 | 多维度评价

数据流是一种新型的数据模型,具有动态、无限、高维、有序、高速和变化等特性。在真实的数据流环境中,一些数据分布是随着时间改变的,即具有概念漂移特征,称为可变数据流或概念漂移数据流。因此处理数据流模型的方法需要处理时空约束和自适应调整概念变化。对概念漂移问题和概念漂移数据流分类、聚类和模式挖掘等内容进行综述。首先介绍概念漂移的类型和常用概念改变检测方法。为了解决概念漂移问题,数据流挖掘中常使用滑动窗口模型对新近事务进行处理。数据流分类常用的模型包括单分类模型和集成分类模型,常用的方法包括决策树、分类关联规则等。数据流聚类方式通常包括基于k- means的和非基于k- means的。模式挖掘可以为分类、聚类和关联规则等提供有用信息。概念漂移数据流中的模式包括频繁模式、序列模式、episode、模式树、模式图和高效用模式等。最后详细介绍其中的频繁模式挖掘算法和高效用模式挖掘算法。

基于局部上下文特征的组合的中文真词错误自动校对研究

刘亮亮,曹存根

计算机科学. 2016, 43 (12): 30-35. doi:10.11896/j.issn.1002-137X.2016.12.005

摘要 ( 534 )

PDF(501KB) ( 1364 )

参考文献 | 相关文章 | 多维度评价

中文的真词错误类似于英文的真词错误,指一个中文词错成另一个词典中的词。提出一种基于混淆集的真词错误发现方法,通过对目标词的局部特征的提取,形成局部左邻接二元、右邻接二元及3个三元特征,然后通过和目标词对应的混淆集中的混淆词来估计二元概率和三元概率。最后提出一种多特征融合的模型,然后利用规则来判断中文文本中的真词错误。将查错结果分为标记错误和更改错误两种类型,采用18组混淆集,构造2万行的测试语料进行实验。实验表明,该方法能有效地发现中文文本中的真词错误,并且能给出真词错误的修改建议。该方法是一种集自动查错和自动纠错于一体的中文文本自动校对方法。

基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类

阿力甫·阿不都克里木,李晓

计算机科学. 2016, 43 (12): 36-40. doi:10.11896/j.issn.1002-137X.2016.12.006

摘要 ( 777 )

PDF(399KB) ( 1155 )

参考文献 | 相关文章 | 多维度评价

针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank算法提取文本关键词集合;最后,根据互信息相似度度量,计算输入文本关键词集和各类关键词集的相似度,最终实现文本的分类。实验结果表明,该方案能够提取出具有较高识别度的关键词,当关键词集大小为1250时,平均分类率达到了91.2%。

基于行为分析的微博传播模型研究

郑志蕴,郭芳,王振飞,李钝

计算机科学. 2016, 43 (12): 41-45. doi:10.11896/j.issn.1002-137X.2016.12.007

摘要 ( 824 )

PDF(517KB) ( 1167 )

参考文献 | 相关文章 | 多维度评价

随着微博的迅速兴起和其影响力的不断提高,提取微博信息传播特征和构建传播模型已成为了研究热点。针对用户转发行为,首先分析了信息传播机制；然后从影响用户转发行为的发布用户、接收用户、用户亲密度和信息时效性4个方面提取出8个特征因素进行建模；在借鉴传染病动力学SIR模型的基础上,引入用户行为分析和接触节点,提出基于用户行为分析的SCIR模型,并给出动力学方程；最后利用新浪微博真实转发数据验证模型的合理性。实验结果表明,考虑用户转发行为的8个影响因素,结合行为分析结果,能够较好地拟合信息传播过程。

直觉模糊小生境的自适应遗传算法求解旅行商问题

梅海涛,王毅,华继学

计算机科学. 2016, 43 (12): 46-49. doi:10.11896/j.issn.1002-137X.2016.12.008

摘要 ( 614 )

PDF(421KB) ( 951 )

参考文献 | 相关文章 | 多维度评价

提出一种基于直觉模糊距离测度的小生境技术,结合模糊控制的自适应遗传算法求解旅行商问题。运用个体在遗传算法迭代寻优中的适应度值,通过直觉模糊集的距离测度确定个体之间的相似性,使用共享函数和惩罚函数对适应度低的个体进行惩罚和淘汰,维护了种群个体的多样性；建立模糊推理系统,以自适应调节遗传算法迭代中的交叉率和变异率,使遗传算法能在局部寻优和全局寻优之间达到平衡,弥补遗传算法易早熟收敛和后期寻优能力差的缺陷；通过求解TSPLIB中的多组实例并进行对比,结果表明所提算法的收敛速度、优化精度、效率均具有明显优势。

基于词或词组长度和频数的短中文文本关键词提取算法

陈伟鹤,刘云

计算机科学. 2016, 43 (12): 50-57. doi:10.11896/j.issn.1002-137X.2016.12.009

摘要 ( 727 )

PDF(725KB) ( 1624 )

参考文献 | 相关文章 | 多维度评价

中文文本的关键词提取是自然语言处理研究中的难点。国内外大部分关键词提取的研究都是基于英文文本的, 但其并不适用于中文文本的关键词提取。已有的针对中文文本的关键词提取算法大多适用于长文本,如何从一段短中文文本中准确地提取出具有实际意义且与此段中文文本的主题密切相关的词或词组是研究的重点。提出了面向中文文本的基于词或词组长度和频数的关键词提取算法,此算法首先提取文本中出现频数较高的词或词组,再根据这些词或词组的长度以及在文本中出现的频数计算权重,从而筛选出关键词或词组。该算法可以准确地从中文文本中提取出相对重要的词或词组,从而快速、准确地提取此段中文文本的主题。实验结果表明,基于词或词组长度和频数的中文文本关键词提取算法与已有的其他算法相比,可用于处理中文文本,且具有更高的准确性。

基于向量冲突表示方法的证据组合规则

李军伟,刘先省

计算机科学. 2016, 43 (12): 58-62. doi:10.11896/j.issn.1002-137X.2016.12.010

摘要 ( 665 )

PDF(418KB) ( 1027 )

参考文献 | 相关文章 | 多维度评价

针对Dempster组合规则在高冲突证据融合的情况下常常会得到违背直觉的结果,提出了一种基于向量冲突表示方法的Dempster(VCRD)组合规则。首先,通过实例分析了冲突因子和Jousselme距离存在的不足；然后,利用证据向量的相似性和差异性共同衡量证据之间的冲突程度,通过证据之间的冲突程度确定修正证据的权重因子,对融合证据进行预处理；最后,利用Dempster组合规则进行融合。理论分析和仿真实验结果表明:与Dempster组合规则及其它改进算法相比,VCRD组合规则能够合理地处理高冲突证据情况下的融合问题,降低了决策风险。

一种基于概率粗糙集的属性约简加速算法

刘芳,李天瑞

计算机科学. 2016, 43 (12): 63-70. doi:10.11896/j.issn.1002-137X.2016.12.011

摘要 ( 456 )

PDF(590KB) ( 1101 )

参考文献 | 相关文章 | 多维度评价

介绍了基于概率粗糙集模型的启发式属性约简算法,提出了概率粗糙集模型中的概率近似精度和改进概率近似精度的增量更新机制,通过比较概率近似精度的更新值得到属性核,然后通过比较改进概率近似精度的值逐步得到概率粗糙集中的属性约简。最后提出了一种概率粗糙集模型中属性核与属性约简的加速求解算法,并举例说明了所提算法的有效性和可行性。

多准则分类问题中近似集的增量更新方法

李艳,靳永飞,吴婷婷,郭娜娜,于群

计算机科学. 2016, 43 (12): 71-78. doi:10.11896/j.issn.1002-137X.2016.12.012

摘要 ( 508 )

PDF(629KB) ( 1004 )

参考文献 | 相关文章 | 多维度评价

在优势关系粗糙集方法(DRSA)的框架下,优势关系可用于处理带有序关系属性(准则)的数据,并且已经被广泛用于处理多准则决策问题。然而在实际应用中,当属性集和对象集发生变化时,信息系统会随之不断更新。在这种动态环境下,DRSA中用于属性约简、规则提取以及决策制定的近似集需要得到相应的更新。针对对象集发生变化时(增加或删除一个对象)的多准则分类问题,采用增量方法来更新近似集并提出两种相应的更新算法DRSA1和DRSA2。同时,对不同情况下的更新原则进行了讨论并给出了相关的理论结果与详细的证明。最后给出算例,并在UCI数据集上进行大量的实验,与非增量的方法(传统的DRSA)进行对比,结果充分体现了所提增量方法的有效性与可扩展性。

一种基于二进制表示的快速求核算法

胡帅鹏,张清华,姚龙洋

计算机科学. 2016, 43 (12): 79-83. doi:10.11896/j.issn.1002-137X.2016.12.013

摘要 ( 615 )

PDF(477KB) ( 895 )

参考文献 | 相关文章 | 多维度评价

在基于粗糙集的知识发现过程中,计算条件属性对论域的划分U/C和求解属性核是尤为关键的步骤。一般需要逐个比较对象的所有条件属性值才能得出结果。提出一种基于二进制表示的方法,只需比较对象的属性值的“和”。该方法先求得所有条件属性值的“和”,仅对该“和”进行一次比较,再通过判断该“和”是否重复,就能得出U/C,理论分析得到该算法的复杂度为O(|C||U|)；然后把计算U/C的思想应用于求解属性核,提出了一种新的快速计算属性核的高效算法。理论分析表明,无论信息系统是否一致,该算法的复杂度均可达到O(|C||U|)。随后通过一个实例阐明了算法的具体步骤,最后通过实验验证了算法的正确性和高效性。

模糊信息系统中基于OWA算子的模糊粗糙集模型

杨霁琳,秦克云

计算机科学. 2016, 43 (12): 84-87. doi:10.11896/j.issn.1002-137X.2016.12.014

摘要 ( 568 )

PDF(298KB) ( 1079 )

参考文献 | 相关文章 | 多维度评价

在模糊信息系统中,属性值并不是一个确定的值,而是一个隶属度函数。因此,通过利用有序加权平均(OWA)算子聚合对象间在每个属性上的差异,刻画出对象之间的相似性,定义对象的相似度并讨论其相关性质。借助对象相似度,通过逻辑关系和相应的函数运算,分别给出了对象隶属于上、下近似集合的隶属度。最后,通过实例分析说明在模糊信息系统中,该相似度能较准确地刻画出对象的相似性,同时,对象对于上、下近似的隶属度能更直观、合理地反应对象隶属于某一集合的上、下近似的情况,且能更合理地描述这一粗糙集合。

基于属性权重的时序模糊软集的群决策方法研究

张其文,谢艳钊

计算机科学. 2016, 43 (12): 88-90. doi:10.11896/j.issn.1002-137X.2016.12.015

摘要 ( 444 )

PDF(309KB) ( 904 )

参考文献 | 相关文章 | 多维度评价

针对模糊软集在群决策过程中其属性权重往往被忽略或依靠主观经验来确定的问题,提出了一种基于属性优势度的属性权重确定方法,并讨论了其相关性质及运算。在群决策过程中,针对决策信息是随时间变化而变化的这一特点,定义了时序模糊软集等概念,并建立了基于决策时间差的对数增长型时间权重确定公式。最后通过与其他决策方法进行对比分析验证了该方法的可行性和合理性。

受限玻尔兹曼机的稀疏化特征学习

康丽萍,许光銮,孙显

计算机科学. 2016, 43 (12): 91-96. doi:10.11896/j.issn.1002-137X.2016.12.016

摘要 ( 515 )

PDF(1778KB) ( 1007 )

参考文献 | 相关文章 | 多维度评价

受限玻尔兹曼机(RBM)作为深度学习算法的一种基础模型被广泛应用,但传统RBM算法没有充分考虑数据的稀疏化特征学习,使得算法性能受数据集的稀疏性影响较大。提出一种RBM稀疏化特征学习方法(sRBM),通过归一化的输入数据均值确定数据集的稀疏系数,将稀疏系数大于阈值的稠密数据集自动转化为稀疏数据集,在不损失信息量的情况下实现输入数据的稀疏化。在手写字符数据集和自然图像数据集上的实验结果表明,sRBM通过输入数据稀疏化有效提升了RBM的稀疏化特征学习性能。

基于支持向量上采样的不平衡数据分类方法

曹路

计算机科学. 2016, 43 (12): 97-100. doi:10.11896/j.issn.1002-137X.2016.12.017

摘要 ( 558 )

PDF(1938KB) ( 1530 )

参考文献 | 相关文章 | 多维度评价

传统的支持向量机在处理不平衡数据时效果不佳。为了提高少类样本的识别精度,提出了一种基于支持向量的上采样方法。首先根据K近邻的思想清除原始数据集中的噪声；然后用支持向量机对训练集进行学习以获得支持向量,进一步对少类样本的每一个支持向量添加服从一定规律的噪声,增加少数类样本的数目以获得相对平衡的数据集；最后将获得的新数据集用支持向量机学习。实验结果显示,该方法在人工数据集和UCI标准数据集上均是有效的。

基于滑动窗口的主题模型

常东亚,严建峰,杨璐,刘晓升

计算机科学. 2016, 43 (12): 101-107. doi:10.11896/j.issn.1002-137X.2016.12.018

摘要 ( 511 )

PDF(1137KB) ( 1550 )

参考文献 | 相关文章 | 多维度评价

LDA(Latent Dirichlet Allocation)是一个分层的概率主题模型,目前被广泛地应用于文本挖掘。这种模型既不考虑文档与文档之间的顺序关系,也不考虑同一篇文档中词与词之间的顺序关系,简化了问题的复杂性,同时也为模型的改进提供了契机。针对此问题提出了基于滑动窗口的主题模型,该模型的基本思想是文档中的一个单词的主题与其附近若干单词的主题关系越紧密,受附近单词主题的影响越大。根据窗口和滑动位移的大小,把文档切割为粒度更小的片段。同时,针对大数据集和数据流问题,提出了在线滑动窗口主题模型。在4个数据集上的实验表明,基于滑动窗口的主题模型训练出来的模型在数据集上有更好的泛化性能和精度。

利用Tri-training算法解决推荐系统冷启动问题

张栩晨

计算机科学. 2016, 43 (12): 108-114. doi:10.11896/j.issn.1002-137X.2016.12.019

摘要 ( 541 )

PDF(587KB) ( 992 )

参考文献 | 相关文章 | 多维度评价

随着社交网络的发展,推荐系统日趋重要,而冷启动问题是推荐系统中的关键问题。设计了一种基于上下文的半监督学习框架TSEL,对矩阵分解模型SVD进行扩充以支持更多形式的上下文信息,利用Tri-training框架训练各个模型。与其他解决推荐系统冷启动问题的半监督方法(如Co- training)相比,该方法有着更好的效果。Tri-training框架能够更加方便地引入更多推荐模型,具有更好的可扩展性。将Tri-training框架加以扩展,提出了基于用户活跃度生成无标记教学集合的算法和更加丰富的对矩阵分解模型扩充的形式。在真实数据集MovieLens上进行验证,获得了更好的实验效果。

基于深度学习的问题分类方法研究

李超,柴玉梅,南晓斐,高明磊

计算机科学. 2016, 43 (12): 115-119. doi:10.11896/j.issn.1002-137X.2016.12.020

摘要 ( 1008 )

PDF(1157KB) ( 1450 )

参考文献 | 相关文章 | 多维度评价

问题分类是问答系统中的重要组成部分。但现阶段的问题分类需要人工制定提取特征的策略和不断优化特征规则。深度学习方法在问题分类上具有可行性,通过自我学习特征的方式表示和理解问题,避免人工特征的制定,从而减少人工代价。针对问题分类,改进了长短期记忆人工神经网络(LSTM)和卷积神经网络(CNN)模型,并结合两者的优势组合成为一种新的学习框架(LSTM-MFCNN),加强对词序语义和深度特征的学习。实验结果表明,该方法在不需要制定繁琐的特征规则的条件下,仍然有较好的表现,准确率达到了93.08%。

一种基于动态词汇表的在线LDA算法

张健伟,严建峰,刘晓升,杨璐

计算机科学. 2016, 43 (12): 120-124. doi:10.11896/j.issn.1002-137X.2016.12.021

摘要 ( 524 )

PDF(1009KB) ( 1256 )

参考文献 | 相关文章 | 多维度评价

目前的在线潜在狄利克雷分布模型(LDA)算法大多是基于固定的词汇表,在实际应用中经常会出现词汇表和处理的语料不匹配的情况,影响了模型的实用性。针对这个现象,在置信传播算法(BP)的框架下,使主题单词分布服从狄利克雷过程,重新推导公式,使得词汇表在模型运行之前为空,并且在处理时不断向词汇表中增加发现的新词。实验证明,这种新的基于动态词汇表的算法不仅使得词汇表与语料的贴合度更高,而且使其在混淆度以及互信息指数这两个指标上能够比基于固定词汇表的LDA模型表现得更加优越。

随机权分布对极限学习机性能影响的实验研究

翟俊海,臧立光,张素芳

计算机科学. 2016, 43 (12): 125-129. doi:10.11896/j.issn.1002-137X.2016.12.022

摘要 ( 588 )

PDF(410KB) ( 944 )

参考文献 | 相关文章 | 多维度评价

极限学习机是一种训练单隐含层前馈神经网络的算法,它随机初始化输入层的权值和隐含层结点的偏置,用分析的方法确定输出层的权值。极限学习机具有学习速度快、泛化能力强的特点。很多研究都用服从[－1,1]区间均匀分布的随机数初始化输入层权值和隐含层结点的偏置,但没有对这种随机初始化合理性的研究。用实验的方法对这一问题进行了研究,分别研究了随机权服从均匀分布、高斯分布和指数分布对极限学习机性能的影响。研究发现随机权的分布对极限学习机的性能的确有影响,对于不同的问题或不同的数据集,服从[－1,1]区间均匀分布的随机权不一定是最优的选择。研究结论对从事极限学习机研究的人员具有一定的借鉴作用。

基于贝叶斯方法和变化表的恐怖行为预测算法

薛安荣,毛文渊,王孟頔,陈泉浈

计算机科学. 2016, 43 (12): 130-134. doi:10.11896/j.issn.1002-137X.2016.12.023

摘要 ( 599 )

PDF(420KB) ( 1005 )

参考文献 | 相关文章 | 多维度评价

传统的恐怖行为预测算法没有考虑到组织会改变其行为策略,而CAPE算法根据组织背景的改变预测行为变化,但其只能根据变化表中存在的背景变化预测行为。为了能根据任意背景变化预测恐怖行为,针对恐怖数据高维小样本的特点,提出了一种利用贝叶斯方法在改进的变化表上预测组织行为的算法。利用贝叶斯方法可快速有效地解决高维小样本分类问题的特性,在改进的变化表上实现对组织行为的预测,从而提高了预测精度和计算效率。此外,考虑到背景的变化会在时间序列上对组织行为产生持续的影响,因此在不同时间滞差下,利用加权的贝叶斯方法预测组织行为。MAROB数据集上多个组织数据的实验结果也表明,所提算法在准确率及时间复杂度上优于CAPE算法。

基于类内散度的粗糙one-class支持向量机

张彬,朱嘉钢

计算机科学. 2016, 43 (12): 135-138. doi:10.11896/j.issn.1002-137X.2016.12.024

摘要 ( 539 )

PDF(360KB) ( 1042 )

参考文献 | 相关文章 | 多维度评价

粗糙one-class支持向量机(ROC-SVM)在粗糙集理论基础上通过构建粗糙上超平面和下超平面来处理过拟合问题,但是在寻找最优分类超平面的过程中,忽略了训练样本类内结构这一非常重要的先验知识。因此,提出了一种基于类内散度的粗糙one-class支持向量机(WSROC-SVM),该方法通过最小化训练样本类内散度来优化训练样本类内结构,一方面使训练样本在高维特征空间中与坐标原点的间隔尽可能大,另一方面使得训练样本在粗糙上超平面尽可能紧密。在合成数据集和UCI数据集上的实验结果表明,较原始算法,该方法有着更高的识别率和更好的泛化性能,在解决实际分类问题上更具优越性。

一种基于样本加权的多尺度核支持向量机方法

沈健,蒋芸,张亚男,胡学伟

计算机科学. 2016, 43 (12): 139-145. doi:10.11896/j.issn.1002-137X.2016.12.025

摘要 ( 514 )

PDF(585KB) ( 1323 )

参考文献 | 相关文章 | 多维度评价

多核学习方法是机器学习领域中的一个新的热点。核方法通过将数据映射到高维空间来增加线性分类器的计算能力,是目前解决非线性模式分析与分类问题的一种有效途径。但是在一些复杂的情况下,单个核函数构成的核学习方法并不能完全满足如数据异构或者不规则、样本规模大、样本分布不平坦等实际应用中的需求问题,因此将多个核函数进行组合以期获得更好的结果,是一种必然的发展趋势。因此提出一种基于样本加权的多尺度核支持向量机方法,通过不同尺度核函数对样本的拟合能力进行加权,从而得到基于样本加权的多尺度核支持向量机决策函数。通过在多个数据集上的实验分析可以得出所提方法对于各个数据集都获得了很高的分类准确率。

基于业务路径和频度矩阵的关联规则挖掘算法

胡波,黄宁,仵伟强

计算机科学. 2016, 43 (12): 146-152. doi:10.11896/j.issn.1002-137X.2016.12.026

摘要 ( 466 )

PDF(1235KB) ( 1026 )

参考文献 | 相关文章 | 多维度评价

关联规则挖掘为分析机载网络关联故障及提高排故效率提供了重要方法。分析了经典Apriori算法的局限性,结合机载网络领域知识、矩阵运算和频繁项集性质,提出一种高效的关联规则挖掘算法。应用机载网络故障具有的基于业务路径的关联特征,提出分块挖掘策略,从而实现挖掘过程的噪声隔离。提出频度矩阵和特征向量,结合矩阵特点和频繁项集性质,设计5个扫描策略,从而减少了循环次数和对比运算。与Apriori算法相比,新算法能有效提高频繁项集的搜索速率。

基于引力因子的加权网络重叠社区识别算法

刘冰玉,王翠荣,王聪,苑迎

计算机科学. 2016, 43 (12): 153-157. doi:10.11896/j.issn.1002-137X.2016.12.027

摘要 ( 606 )

PDF(430KB) ( 1007 )

参考文献 | 相关文章 | 多维度评价

通过挖掘大数据来识别复杂社会网络上的社区,有利于对经济、政治、人口等方面的重要问题进行定量研究,社区的识别算法已经成为当前研究的热点问题。重点研究了重叠社区识别问题,提出了基于引力因子的加权复杂网络的重叠社区识别算法GWCR。该算法首先选取万有引力因子大的节点为中心节点,将节点与中心节点之间的引力因子作为衡量标准,并将节点归入社区引力因子大于某一阈值的社区,最后通过识别重叠节点来识别重叠社区。在3个真实网络数据集上的实验结果表明,与传统的重叠社区识别算法相比,GWCR算法划分的社区的模块度较高。

考虑用户活跃度和项目流行度的基于项目最近邻的协同过滤算法

王锦坤,姜元春,孙见山,孙春华

计算机科学. 2016, 43 (12): 158-162. doi:10.11896/j.issn.1002-137X.2016.12.028

摘要 ( 808 )

PDF(425KB) ( 1147 )

参考文献 | 相关文章 | 多维度评价

项目相关性度量是基于项目最近邻的协同过滤算法的关键。已有的项目相关性度量方法在数据集稀疏或推荐低流行度产品时会面临较大挑战,因此提出一种考虑用户活跃度和项目流行度的基于项目最近邻的协同过滤算法。该算法在度量两个项目的相关性时,若有记录只对两个项目之一有评分,则利用该记录所对应的评分用户的活跃度和被评价项目的流行度进行相关性惩罚,从而提高数据稀疏环境下低流行度产品被推荐的概率。实验表明,所提算法在保证评分预测精度的情况下提升了推荐结果的多样性和新颖性。

基于用户签到和地理属性的个性化位置推荐算法研究

蔡海尼,陈程,文俊浩,王喜宾,曾骏

计算机科学. 2016, 43 (12): 163-167. doi:10.11896/j.issn.1002-137X.2016.12.029

摘要 ( 759 )

PDF(498KB) ( 1064 )

参考文献 | 相关文章 | 多维度评价

针对基于LBSNs (Location-based Social Networks)的位置推荐算法考虑因素单一且不能有效解决用户位于不同城市的位置推荐的问题,综合考虑潜在的社交影响、内容匹配影响和地理属性影响等因素,提出了基于用户签到和地理属性的个性化位置推荐算法SCL (Social-Content-Location)。该算法在协同过滤的基础上,引入了用户兴趣特征比较,改进了用户的相似度计算；同时,在分析位置的内容信息时,融入用户评论,缓解了位置标签的短文本特性对LDA (Latent Dirichlet Allocation)主题提取的影响,提高了用户兴趣和城市偏好主题提取的准确率。实验结果表明,SCL算法在本地城市召回率上较协同过滤算法U提高近65%,较LCA-LDA算法提高近 30%；在异地城市召回率上,高于LCA-LDA算法近26%。这表明SCL算法在不同城市下的位置推荐具有一定的可行性。

基于改进鱼群算法与张量分解的社会化标签推荐模型

张浩,何杰,李慧宗

计算机科学. 2016, 43 (12): 168-172. doi:10.11896/j.issn.1002-137X.2016.12.030

摘要 ( 473 )

PDF(454KB) ( 988 )

参考文献 | 相关文章 | 多维度评价

基于大众分类法(folksonomy)的标签应用已逐渐成为一种重要的互联网内容组织方式,但随着数据规模的海量增长,产生了严重的信息过载问题,而传统的基于“用户-项目”二元关系的个性化推荐算法难以有效应对由“用户-项目-标签”所构成的三元关系。通过对基本人工鱼群算法进行改进,提出一种对标签推荐系统初始数据集进行聚类分析的方法,用以降低标签推荐系统的数据分析规模。在此基础上,综合考虑标签推荐系统中的元素权重以及反映用户偏好的评分信息,将元素权重和评分等级进行加权处理,以处理结果作为张量中的元素,建立了一种新的加权张量模型,并利用动态增量更新的张量分解算法进行模型求解,进而完成个性化的推荐。最后在两个真实的实验数据集上对比分析了所提算法(FTA)与另外两个经典标签推荐算法的推荐性能,实验结果表明FTA算法在准确率和召回率上均具有较好的表现。

基于Kappa系数的数据流分类算法

徐树良,王俊红

计算机科学. 2016, 43 (12): 173-178. doi:10.11896/j.issn.1002-137X.2016.12.031

摘要 ( 625 )

PDF(503KB) ( 1399 )

参考文献 | 相关文章 | 多维度评价

数据流挖掘已经成为数据挖掘领域一个热门的研究方向,由于数据流中概念漂移现象的存在,使得传统的分类算法无法直接应用于数据流中。为了能有效地应对数据流中的概念漂移,提出了一种基于Kappa系数的数据流分类算法。该算法采用集成式分类技术,以Kappa系数度量系统的分类性能,根据Kappa系数来动态地调整分类器,当发生概念漂移时,系统能利用已有的知识很快删除不符合要求的分类器来适应新概念。实验结果表明,相对于实验中参与比较的BWE,AE和AWE算法,该算法不但具有较好的分类性能,而且在一定程度上能较为有效地降低时间开销。

一种面向不完全标记的文本数据流自适应分类方法

张玉红,陈伟,胡学钢

计算机科学. 2016, 43 (12): 179-182. doi:10.11896/j.issn.1002-137X.2016.12.032

摘要 ( 455 )

PDF(426KB) ( 1006 )

参考文献 | 相关文章 | 多维度评价

现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流,这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此,面向不完全标记的文本数据流提出了一种自适应的数据流分类算法。该算法以一个标记数据块作为起始数据块,对未标记数据块首先提取标记数据块与未标记数据块之间的特征集,并利用特征在两个数据块间的相似度进行概念漂移检测,最后计算未标记数据中特征的极性并对数据进行预测。实验表明了算法在分类精度上的优越性,尤其在标记信息较少和概念漂移较为频繁时。

一种成对约束限制的半监督文本聚类算法

王纵虎,刘速

计算机科学. 2016, 43 (12): 183-188. doi:10.11896/j.issn.1002-137X.2016.12.033

摘要 ( 527 )

PDF(554KB) ( 1230 )

参考文献 | 相关文章 | 多维度评价

半监督聚类能利用少量标记数据来提高聚类算法性能,但大部分文本聚类算法无法直接应用成对约束等先验信息。针对文本数据高维稀疏的特点,提出了一种半监督文本聚类算法。将成对约束信息扩展后嵌入文档相似度矩阵,在此基础上根据已划分与未划分文档之间的统计信息逐步找出剩余未划分文本集合中密集的且与已划分聚类中心集合相似度较小的K个初始聚类中心集合,然后将剩余的相对较难区分的文档结合成对约束限制信息划分到K个初始聚类中心集合,最后通过融合成对约束违反惩罚的收敛准则函数对聚类结果进行进一步优化。算法在聚类过程中自动确定初始聚类中心集合,避免了K均值算法对初始聚类中心选择的敏感性。在几个中英文数据集上的实验结果表明,所提算法能有效地利用少量的成对约束先验信息提高聚类效果。

大数据环境下的多源数据演化更新研究

余放,陈盛双,李石君,余伟

计算机科学. 2016, 43 (12): 189-194. doi:10.11896/j.issn.1002-137X.2016.12.034

摘要 ( 757 )

PDF(495KB) ( 881 )

参考文献 | 相关文章 | 多维度评价

大数据环境下的多源数据呈现出数据量大、数据种类多、数据变化快的特点,这些特点对数据更新提出了新的挑战。通过分析大数据下多源数据的特点,定义了演化数据的概念,基于此建立了大数据的动态变频遍历更新模型。首先通过抽象数据的演化方式,建立了演化数据的势与稳定性概念,从而推导出更一般的代数意义上的演化运算工具；其次通过将运算工具导入大数据数据更新的实际应用中,推导出基于概率的变频遍历与动态权值模型；最后通过实验验证了在大数据环境下动态变频遍历模型(Dynamic Frequency Conversion Traversal,DFCT) 对多源数据具有较高的更新效率。

基于隐私保护的序列模式挖掘

方炜炜,谢伟,黄宏博,夏红科

计算机科学. 2016, 43 (12): 195-199. doi:10.11896/j.issn.1002-137X.2016.12.035

摘要 ( 622 )

PDF(1098KB) ( 1020 )

参考文献 | 相关文章 | 多维度评价

隐私保护是当前数据挖掘领域的一个研究热点,其目标是在不暴露原始数据信息的前提下准确地实现挖掘任务。针对隐私保护序列模式挖掘问题,提出了项集的布尔集合关系概念,设计了基于随机集和扰乱函数对原始序列库进行数据干扰的方法模型,并通过扰乱函数的特性还原出原始序列库的频繁序列模式的真实支持度,完成了在保护原始数据隐私的前提下准确地挖掘出频繁序列模式的任务。理论分析和实验结果表明,该方法模型具有很好的数据隐私保护性、挖掘结果准确性和算法执行高效性。

基于Jaccard相似度和位置行为的协同过滤推荐算法

李斌,张博,刘学军,章玮

计算机科学. 2016, 43 (12): 200-205. doi:10.11896/j.issn.1002-137X.2016.12.036

摘要 ( 584 )

PDF(488KB) ( 1341 )

参考文献 | 相关文章 | 多维度评价

协同过滤是现今推荐系统中应用最为成功且最广泛的推荐方法之一,其中概率矩阵分解算法作为一类重要的协同过滤方式,能够通过学习低维的近似矩阵进行推荐。然而,传统的协同过滤推荐算法在推荐过程中只利用用户-项目评分信息,忽略了用户(项目)间的潜在影响力,影响了推荐精度。针对上述问题,首先利用Jaccard相似度对用户(项目)做预处理,而后通过用户(项目)间的位置信息挖掘出其间的潜在影响力,成功找到最近邻居集合；最后将该邻居集合融合到基于概率矩阵分解的协同过滤推荐算法中。实验证明该算法较传统的协同过滤推荐算法能够更有效地预测用户的实际评分,提高了推荐效果。

基于改进相似度的协同过滤算法研究

李容,李明奇,郭文强

计算机科学. 2016, 43 (12): 206-208. doi:10.11896/j.issn.1002-137X.2016.12.037

摘要 ( 494 )

PDF(331KB) ( 1172 )

参考文献 | 相关文章 | 多维度评价

协同过滤利用邻居用户的偏好对目标用户的偏好进行推荐预测,相似度计算是其关键。传统的相似度计算忽略了用户共同评分项目数与用户平均评分的影响,以至于在数据稀疏时不能很好地度量用户间的相似度。提出了两个修正因子来改进传统相似度,同时改进了协同过滤算法,将其应用于电影推荐。仿真结果表明,在电影推荐中,基于改进后相似度计算的协同过滤算法能取得比传统算法更低的MAE值,提高了电影推荐质量。

密度自适应的半监督谱聚类算法

周海松,黄德才

计算机科学. 2016, 43 (12): 209-212. doi:10.11896/j.issn.1002-137X.2016.12.038

摘要 ( 664 )

PDF(330KB) ( 947 )

参考文献 | 相关文章 | 多维度评价

谱聚类是一种新兴的聚类算法,数据点间的相似度定义对其聚类效果起着至关重要的作用。传统的谱聚类算法通常利用高斯核函数作为相似度函数,但是对于多密度的数据往往不能取得良好的效果。在定义新的相似度函数的基础上,提出了一种密度自适应的半监督聚类算法。该算法结合半监督聚类的成对约束理论,利用先验信息对样本点之间的相似度进行自适应调整,提高了聚类的精度。该算法在人工数据集和真实数据集上的仿真实验都取得了良好的效果。

基于相对密度和流形上k近邻的聚类算法

古凌岚,彭利民

计算机科学. 2016, 43 (12): 213-217. doi:10.11896/j.issn.1002-137X.2016.12.039

摘要 ( 450 )

PDF(422KB) ( 1053 )

参考文献 | 相关文章 | 多维度评价

针对传统的基于欧氏距离的相似性度量不能完全反映复杂结构的数据分布特性的问题,提出了一种基于相对密度和流形上k近邻的聚类算法。基于能描述全局一致性信息的流形距离,及可体现局部相似性和紧密度的k近邻概念,通过流形上k近邻相似度度量数据对象间的相似性,采用k近邻的相对紧密度发现不同密度下的类簇,设计近邻点对约束规则搜寻k近邻点对构成的近邻链,归类数据对象及识别离群点。与标准k-means算法、流形距离改进的k-means算法进行了性能比较,在人工数据集和UCI数据集上的仿真实验结果均表明,该算法能有效地处理复杂结构的数据聚类问题,且聚类效果更好。

一种基于随机森林的LBS用户社会关系判断方法

马春来,单洪,马涛,顾正海

计算机科学. 2016, 43 (12): 218-222. doi:10.11896/j.issn.1002-137X.2016.12.040

摘要 ( 591 )

PDF(966KB) ( 1149 )

参考文献 | 相关文章 | 多维度评价

根据LBS用户位置信息对用户之间是否存在社会关系进行判断,是基于位置大数据的情报挖掘领域中的一个新兴问题,可为群体发现及社团划分提供信息支撑。以时空共现理论为依据,将时空共现区特征归纳为4类,提出了一种基于随机森林的用户社会关系判断方法。该方法包括特征选择和训练分类环节。首先,针对特征空间存在不相关和冗余特征而影响判断性能的问题,提出一种基于Fisher准则和χ²检验的特征选择算法,对无关、冗余特征进行剔除；然后采用随机森林进行分类判断,克服了现有方法训练速度慢、容易过拟合的问题。以LBSN用户Check-in数据为例进行的实验结果表明,该方法能够以较低的计算代价和较高的准确率实现社会关系的判断。

基于用户浏览轨迹的商品推荐

郭俊霞,许文生,卢罡

计算机科学. 2016, 43 (12): 223-228. doi:10.11896/j.issn.1002-137X.2016.12.041

摘要 ( 577 )

PDF(519KB) ( 1169 )

参考文献 | 相关文章 | 多维度评价

随着电子商务的迅速发展,推荐系统在这些网站中得到了广泛的应用。目前应用最广泛的个性化推荐算法是协同过滤推荐算法,但是该方法存在稀疏矩阵与冷启动问题。根据用户浏览记录推荐商品是缓解这些问题的一个重要研究方向,这些方法根据用户在电子商务网站的访问日志,提取出用户的浏览路径序列,即用户浏览轨迹,为用户推荐偏爱商品。目前,通过分析用户浏览路径为用户推荐商品的方法主要依据用户浏览轨迹模式匹配或者从用户浏览轨迹中商品与下一个商品关系的角度进行考虑。而本研究从浏览轨迹中被浏览商品与最终被购买商品关系的角度出发,并以此为基础建立用户浏览轨迹偏爱模型,挖掘用户偏爱,为用户推荐商品。实验表明,所提方法能够在一定程度上解决因为新用户缺少历史购买及评分记录而引起的新用户冷启动问题,提高了推荐方法的准确度与召回率。

基于词条与语意差异度量的文档聚类算法

魏霖静,练智超,王联国,侯振兴

计算机科学. 2016, 43 (12): 229-233. doi:10.11896/j.issn.1002-137X.2016.12.042

摘要 ( 524 )

PDF(473KB) ( 932 )

参考文献 | 相关文章 | 多维度评价

已有的文本聚类算法大多基于一般的相似性度量而忽略了语义内容,对此提出一种基于最大化文本判别信息的文本聚类算法。首先,分别分析词条对其类簇与其他类簇的判别信息,并且将数据集从输入空间转换至差异分数矩阵空间；然后,设计了一个贪婪算法来筛选矩阵每行的低分数词条；最终,采用最大似然估计对文本差别信息进行平滑处理。仿真实验结果表明,所提方法的文档聚类质量优于其他分层与单层聚类算法,并且具有较好的可解释性与收敛性。

车辆数限制的多车型校车路径问题模型及算法研究

侯彦娥,孔云峰,党兰学,谢毅

计算机科学. 2016, 43 (12): 234-240. doi:10.11896/j.issn.1002-137X.2016.12.043

摘要 ( 568 )

PDF(605KB) ( 1518 )

参考文献 | 相关文章 | 多维度评价

为适应校车路径规划中校车有多种车型且每种车型数量受限的需求,建立车辆数限制的多车型校车路径问题(HFSBRP)的数学模型,并提出一种迭代局部搜索算法进行求解。该算法借助邻域随机选择的变邻域下降搜索(VND)算法完成局部提升。局部提升过程中,首先调整车型,然后再混合使用缩减路径数和提高车辆利用率的邻域解接受策略以提高算法的寻优能力,为保证解的多样性,允许接受一定偏差范围内的邻域解。此外,为避免算法过早陷入局部最优,设计了多点交换和移动的扰动规则。基于国际基准测试案例进行模型验证和算法测试,实验结果表明了模型的正确性和算法的有效性。

动态进化多目标优化中的串式记忆方法

刘敏,曾文华,刘玉珍

计算机科学. 2016, 43 (12): 241-247. doi:10.11896/j.issn.1002-137X.2016.12.044

摘要 ( 578 )

PDF(594KB) ( 960 )

参考文献 | 相关文章 | 多维度评价

如何利用过去搜索到的最优解对新的环境变化做出快速响应,是动态进化多目标优化(Dynamic Evolutio-nary Multi- objective Optimization,DEMO)研究的一大挑战。为此提出了一种串式记忆(Bunchy Memory,BM)方法。设计了基于极小化效应函数的抽取过程,从非支配集中抽取一串记忆串,以便保持记忆的多样性;将记忆体组织成串式队列的方式,以便将过去数次环境变化下抽取的记忆串存入记忆体;提出了基于二进制锦标赛选择的检索过程以复用记忆体中过去的最优解,来快速响应新的变化。BM方法具有良好的记忆效果,显著地提高了DEMO算法的收敛性和多样性。4个标准测试问题上的实验结果表明,BM方法比其它3种方法具有更好的记忆能力。相应地,集成了BM方法的DEMO算法所获得解集的收敛性与多样性也明显好于其它3种DEMO算法。

一种均衡各速度项系数的多目标粒子群优化算法

耿焕同,赵亚光,陈哲,李辉健

计算机科学. 2016, 43 (12): 248-254. doi:10.11896/j.issn.1002-137X.2016.12.045

摘要 ( 420 )

PDF(537KB) ( 1005 )

参考文献 | 相关文章 | 多维度评价

粒子群优化算法已成为求解多目标优化问题的有效方法之一,而速度更新公式中的惯性、局部和全局3个速度项的系数的动态合理设置是算法优化效率的关键问题。为解决现有算法仅单独设置各速度项系数导致优化效率不高的问题,提出了一种均衡各速度项系数的多目标粒子群优化算法。该方法旨在通过粒子的局部最优和全局最优的信息来引导种群的进化方向,动态调整每一个粒子速度项系数来均衡惯性、局部和全局3个速度项在搜索中的作用,从而更为准确地刻画算法的搜索能力和搜索精度,更好地平衡算法的探究和探索能力,进一步提高粒子群优化算法解决复杂多目标优化问题的效率。在7个标准测试函数上进行实验,并与5种经典的进化算法进行对比,结果表明新算法在综合指标IGD以及多样性评估指标Δ评分上具有更好的收敛速度和分布性,验证了新算法的有效性。

基于直觉模糊熵的改进粒子群算法求解WTA问题

苏丁为,王毅,周创明

计算机科学. 2016, 43 (12): 255-259. doi:10.11896/j.issn.1002-137X.2016.12.046

摘要 ( 659 )

PDF(416KB) ( 1035 )

参考文献 | 相关文章 | 多维度评价

为了提高求解武器目标分配问题的效率和性能,提出了一种基于直觉模糊熵的改进粒子群算法(IFEIPSO)。首先,针对WTA问题的多约束条件建立了整数编码方案,降低了问题的复杂性；其次,采用一种交换操作和模拟退火机制对粒子群算法的局部最优解进行更新,从而得到更优的局部最优解和全局最优解,以增加算法的局部搜索能力；最后,以直觉模糊熵作为种群多样性的测度,根据熵值大小对种群进行变异操作,提高种群的多样性,增加算法的全局搜索性能。仿真实验结果表明,该算法很好地提高了粒子群算法的寻优能力,有效地解决了WTA问题。

求解环境车辆路径问题的多种群伊藤算法

尹志扬,余世明

计算机科学. 2016, 43 (12): 260-263. doi:10.11896/j.issn.1002-137X.2016.12.047

摘要 ( 440 )

PDF(393KB) ( 946 )

参考文献 | 相关文章 | 多维度评价

针对传统伊藤算法收敛速度慢、易陷入局部最优解的缺陷,重新设计了环境温度调节函数,并改进了粒子漂移和波动时的路径权重更新规则,使粒子更符合布朗运动的特性。把多种群概念引入到算法中,利用种群信息加快算法的收敛速度和寻优能力。利用2-opt局部优化和反转优化进一步改进前5个最优解。最后,考虑车辆载重量对燃料消耗率的影响,对最少碳排放的环境车辆路径问题模型进行改进,利用改进后的算法进行仿真求解。实验结果表明,改进后的算法提高了搜寻最优解的能力并加快了收敛速度,有效防止了停滞现象。

基于维度分区的果蝇优化新算法

王友卫,凤丽洲,朱建明

计算机科学. 2016, 43 (12): 264-268. doi:10.11896/j.issn.1002-137X.2016.12.048

摘要 ( 444 )

PDF(377KB) ( 1047 )

参考文献 | 相关文章 | 多维度评价

为提高果蝇算法的收敛稳定性,提出了一种基于维度分区的果蝇优化新算法。将果蝇种群均分为两组:跟随果蝇和搜索果蝇。跟随果蝇在全局最优果蝇附近实现精细化局部搜索,而搜索果蝇则将位置向量的每个维度搜索范围划分为若干个区间,通过比较各个区间的最优位置来更新果蝇位置。为加快算法收敛速度,若某搜索果蝇在连续若干次迭代过程中均表现最差,则在当前最优果蝇位置附近产生该果蝇的新位置。针对8种典型函数的仿真实验表明:与传统算法相比, 所提算法所需参数较少,收敛稳定性高,并且在收敛精度及收敛速度等方面具有明显优势。

基于描述逻辑的传感器网络事件检测

张玉利,常亮,孟瑜,古天龙

计算机科学. 2016, 43 (12): 269-272. doi:10.11896/j.issn.1002-137X.2016.12.049

摘要 ( 643 )

PDF(420KB) ( 953 )

参考文献 | 相关文章 | 多维度评价

基于异构数据源的事件检测是物联网上的一类典型应用。现有技术已经可以实现对异构数据源的收集、过滤、表示及部分数据的低层次融合和分析,但对于隐藏结论获取等高层次信息融合仍然需要人工参与。针对这种情况,给出了基于轻量级描述逻辑εL⁺⁺的传感器网络事件检测方法,实现特定领域事件的实时自动检测。首先,针对传感器网络中的具体场景,用εL⁺⁺对传感器网络领域知识进行刻画；然后应用描述逻辑对待判定事件进行形式化描述；最后借助描述逻辑推理机制实现事件的自动检测。该方法充分发挥了描述逻辑的知识表示和推理能力,能够基于领域知识和具体数据进行自动的事件检测。

基于改进全局人工蜂群算法的WSN节点定位研究

邢熔华,黄海燕

计算机科学. 2016, 43 (12): 273-276. doi:10.11896/j.issn.1002-137X.2016.12.050

摘要 ( 670 )

PDF(331KB) ( 906 )

参考文献 | 相关文章 | 多维度评价

无线传感器网络(Wireless Sensor Network,WSN)系统性能的提高,离不开对WSN中每一个传感器节点地理位置的精准定位。全局人工蜂群算法在基本人工蜂群算法的基础上,在邻域搜索后将迭代最优解添加到新解的更新公式中,提高了算法的开发能力。但将其应用于WSN节点位置求解时,存在计算时间长、收敛不稳定的问题。提出一种改进的全局人工蜂群算法,在邻域搜索后对新解进行衡量,若新解适应值在可接受的范围内,与迭代最优解进行交叉操作；若新解适应值较好,不与迭代最优解进行交叉操作；若新解适应值较差,舍弃新解。这较好地平衡了算法的探索和开发能力。求解WSN节点位置时,证明了该算法有更快的收敛速度和更好的收敛效果。

一种基于联合深度神经网络的食品安全信息情感分类模型

刘金硕,张智

计算机科学. 2016, 43 (12): 277-280. doi:10.11896/j.issn.1002-137X.2016.12.051

摘要 ( 556 )

PDF(383KB) ( 958 )

参考文献 | 相关文章 | 多维度评价

针对因中文食品安全文本特征表达困难,而造成语义信息缺失进而导致分类器准确率低下的问题,提出一种基于深度神经网络的跨文本粒度情感分类模型。以食品安全新闻报道为目标语料,采用无监督的浅层神经网络初始化文本的词语级词向量。引入递归神经网络,将预训练好的词向量作为下层递归神经网络(Recursive Neural Network)的输入层,计算得到具备词语间语义关联性的句子特征向量及句子级的情感倾向输出,同时动态反馈调节词向量特征,使其更加接近食品安全特定领域内真实的语义表达。然后,将递归神经网络输出的句子向量以时序逻辑作为上层循环神经网络(Recurrent Neural Network)的输入,进一步捕获句子结构的上下文语义关联信息,实现篇章级的情感倾向性分析任务。实验结果表明,联合深度模型在食品安全新闻报道的情感分类任务中具有良好的效果,其分类准确率和F1值分别达到了86.7%和85.9%,较基于词袋思想的SVM模型有显著的提升。

基于EDBN-SVM的高速列车故障分析

郭超,杨燕,金炜东

计算机科学. 2016, 43 (12): 281-286. doi:10.11896/j.issn.1002-137X.2016.12.052

摘要 ( 606 )

PDF(525KB) ( 977 )

参考文献 | 相关文章 | 多维度评价

深度学习作为机器学习领域的新热点,为故障诊断技术领域的研究开拓了新的思路。针对高速列车进行故障分析的重要性,将深度学习和集成学习相结合,提出一种基于EDBN-SVM(EnsembleDeep Belief Network-Support Vector Machine)的故障诊断模型。首先对高速列车振动信号进行快速傅立叶变换,其次分析确定了EDBN-SVM模型的参数,然后将信号的FFT系数作为EDBN-SVM模型的可视层输入,并逐层学习高层特征,最后利用多个SVM分类器进行识别并对识别结果进行集成。为评估该方法的有效性,采用实验室数据和仿真数据进行实验测试,并与传统的几种故障分析方法进行对比。结果表明,该方法的故障识别效果优于传统的故障分析方法,同时稳定性更好。

基于Wang-Landau抽样的带静不平衡约束的简化卫星舱布局方法

刘景发,黄娟,蒋宇聪,刘文杰,郝亮

计算机科学. 2016, 43 (12): 287-292. doi:10.11896/j.issn.1002-137X.2016.12.053

摘要 ( 663 )

PDF(1628KB) ( 1100 )

参考文献 | 相关文章 | 多维度评价

以简化卫星舱承载板上三维布局设计问题为背景,研究一类带静不平衡约束的圆柱体和长方体混合待布物布局问题。针对该三维布局问题,将已成功应用于统计物理学和蛋白质结构预测的Wang-Landau抽样算法引入布局问题中。Wang- Landau抽样算法通过在复杂布局空间中进行有效抽样来得到一个平坦的能量直方图,从而精确估计布局系统的状态密度。通过将Wang- Landau抽样算法与带加速策略的最速下降法、质心平移策略相结合,提出了改进的Wang-Landau抽样算法。对文献中两个算例进行了实算,计算结果表明,改进的Wang-Landau抽样算法的收敛速度和解的质量相比文献中其它算法均有较大的提高。

基于改进人工势场法的机器人避障及路径规划研究

徐飞

计算机科学. 2016, 43 (12): 293-296. doi:10.11896/j.issn.1002-137X.2016.12.054

摘要 ( 875 )

PDF(326KB) ( 2870 )

参考文献 | 相关文章 | 多维度评价

在不确定和复杂的移动环境中,利用传统的人工势场法进行机器人避障很难满足对环境动态适应性的需要。提出了一种相对速度的改进的人工势场法,针对于传统的路径规划中局部最小值问题,提出设置中间目标点的方法,给机器人一个外力以避免其在局部最小点处停止或者徘徊,确保机器人能够逃出最小值陷阱并顺利到达目标位置。最后在Matlab平台上进行了仿真实验,实验结果表明,改进后的人工势场法能较好地实现动态环境下移动机器人的路径规划。

一种基于多分类器融合的人体运动行为识别模型

王忠民,王科,贺炎

计算机科学. 2016, 43 (12): 297-301. doi:10.11896/j.issn.1002-137X.2016.12.055

摘要 ( 581 )

PDF(402KB) ( 1044 )

参考文献 | 相关文章 | 多维度评价

为了提高基于智能设备的人体日常行为识别的准确率,针对不同智能设备内置加速度传感器获取的三轴加速度信息,提出了一种基于多分类器融合的行为识别MCF(Multiple Classifier Fusion)模型。针对5种日常行为(静止、散步、跑步、上楼及下楼),优选出与每种行为相关度高的特征集,用于训练对每种行为识别效果最佳的5个基分类器,并采用一个融合器对5个基分类器的输出进行融合处理,得到最终行为识别结果。该模型对这5种行为的平均识别准确率和可信度分别达到96.84%和97.41%,能有效进行用户行为识别。

基于K-PSO稀疏表示的故障分类方法研究

傅蒙蒙,王培良

计算机科学. 2016, 43 (12): 302-306. doi:10.11896/j.issn.1002-137X.2016.12.056

摘要 ( 452 )

PDF(428KB) ( 942 )

参考文献 | 相关文章 | 多维度评价

针对现代复杂生产过程中不能准确识别、分类多种故障的问题,提出一种改进的稀疏表示故障分类方法。该方法依据信号的稀疏表示来判断故障所属类别。其具体实现过程首先是利用K-均值奇异值分解(K-SVD)算法构造过完备字典,使其包含原信息的主要特征,再通过粒子群(PSO)算法有效地搜索并寻找稀疏分解中产生的在过完备字典范围中的最匹配原子,最后利用以该匹配原子为基础的稀疏表示结果实现对多故障问题的分类识别。运用数值仿真验证了该算法的可行性和有效性。同时,针对柴油机燃油系统的故障分类,将该方法与基于BP神经网络和SVM的分类识别方法进行比较,实验表明该算法在故障分类上具有更好的效果。

基于失真激励式机会模糊控制的视频跟踪机制

刘智

计算机科学. 2016, 43 (12): 307-310. doi:10.11896/j.issn.1002-137X.2016.12.057

摘要 ( 451 )

PDF(848KB) ( 881 )

参考文献 | 相关文章 | 多维度评价

为了提高目标跟踪精度和跟踪视频质量,研究了一种具有失真激励功能和基于机会模糊控制的视频跟踪机制及其系统架构。首先,针对目标行为空域和模糊集群,通过建立群内模糊集且依据目标移动速度构建了机会模糊控制系统。然后,在分析跟踪目标的差异性和目标移动速度的随机性的基础上,以激励模糊集群用户的机会逻辑控制为目标,提出了基于失真激励的视频跟踪机制及其系统架构。最后,实验结果表明,提出的算法在系统执行效率、视频传输时延和跟踪视频质量等方面具有明显优势。