1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2018 年第七届中国数据挖掘会议 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 层次粒结构下粗糙模糊集的不确定性度量
    杨洁, 王国胤, 张清华, 冯林
    计算机科学    2019, 46 (1): 45-50.   DOI: 10.11896/j.issn.1002-137X.2019.01.007
    摘要446)      PDF(pc) (1855KB)(723)    收藏
    众所周知,经典粗糙集的不确定性来自于边界域,但是对于粗糙模糊集来说,其正域和负域中的元素存在不确定性,从而导致粗糙模糊集的不确定性不仅来自于边界域,还来自于正域和负域。另外,在粗糙模糊集中,一个模糊概念可以通过层次粒结构中不同的粗糙近似空间进行刻画,随着粒度的变化,模糊概念的不确定性的变化规律如何?对此,文中提出一种基于模糊度的不确定性度量公式,并基于均值模糊集分析了粗糙模糊集模型,得出粗糙模糊集不确定性度量的模型同样适合于度量概率粗糙集的不确定性的结论。其次,采用基于模糊度的不确定性度量方法,揭示了分层递阶的多粒度空间下粗糙模糊集不确定性的变化规律。然后,分析了3个域(正域、边界域和负域)的不确定性,并揭示了它们在分层递阶的多粒度空间下的变化规律。最后,通过实验验证了所提不确定性度量理论的有效性。
    参考文献 | 相关文章 | 多维度评价
    2. 网络维数:一种度量复杂网络的新方法
    刘胜久, 李天瑞, 刘小伟
    计算机科学    2019, 46 (1): 51-56.   DOI: 10.11896/j.issn.1002-137X.2019.01.008
    摘要473)      PDF(pc) (1467KB)(1395)    收藏
    如何对复杂网络进行刻画与度量,一直是人们关注的热点。在研究自相似复杂网络分形维数的基础上,提出了一种度量复杂网络的新方法——网络维数,即复杂网络边权重和的对数值与节点权重和的对数值的比值,可以将边权重及点权重推广到实数域和复数域;同时给出了不同类型权重对应的网络维数的计算方法;最后以几个代表性的经典复杂网络模型为例,讨论了所提出的网络维数的若干性质。
    参考文献 | 相关文章 | 多维度评价
    3. 在线核选择的对抗式多臂赌博机模型
    李峻樊, 廖士中
    计算机科学    2019, 46 (1): 57-63.   DOI: 10.11896/j.issn.1002-137X.2019.01.009
    摘要358)      PDF(pc) (1253KB)(887)    收藏
    在线核选择是在线核方法的重要工作,可分为过滤式、包裹式和嵌入式3种类型。已有在线核选择探索了包裹式方法和嵌入式方法,也经验地采用了过滤式方法,但迄今尚没有一个统一的框架来比较、分析并研究各种在线核选择问题。文中提出一种在线核选择的多臂赌博机模型,该模型可作为一个统一框架,同时给出在线核选择的包裹式方法和嵌入式方法。给定候选核集合,候选集中的一个核对应多臂赌博机模型中的一个臂,在线核选择的每回合依据一个概率分布重复地随机选择多个核,并应用指数加权的方法来更新该概率分布。这样,在线核选择问题本质上可归约为一个非遗忘对手环境下的对抗式多臂赌博机问题,并可应用对抗式多臂赌博机模型统一地给出在线核选择的包裹式方法和嵌入式方法。文中进一步提出一个新的在线核选择后悔的概念,理论证明包裹式方法具有关于回合数亚线性的弱期望后悔界,并且嵌入式方法具有关于回合数亚线性的期望后悔界。最后,在标准数据集上通过实验验证了所提统一框架的可行性。
    参考文献 | 相关文章 | 多维度评价
    4. 概念漂移数据流分类中的多源在线迁移学习算法
    秦一休, 文益民, 何倩
    计算机科学    2019, 46 (1): 64-72.   DOI: 10.11896/j.issn.1002-137X.2019.01.010
    摘要690)      PDF(pc) (3631KB)(980)    收藏
    现有概念漂移处理算法在检测到概念漂移发生后,通常需要在新到概念上重新训练分类器,同时“遗忘”以往训练的分类器。在概念漂移发生初期,由于能够获取到的属于新到概念的样本较少,导致新建的分类器在短时间内无法得到充分训练,分类性能通常较差。进一步,现有的基于在线迁移学习的数据流分类算法仅能使用单个分类器的知识辅助新到概念进行学习,在历史概念与新到概念相似性较差时,分类模型的分类准确率不理想。针对以上问题,文中提出一种能够利用多个历史分类器知识的数据流分类算法——CMOL。CMOL算法采取分类器权重动态调节机制,根据分类器的权重对分类器池进行更新,使得分类器池能够尽可能地包含更多的概念。实验表明,相较于其他相关算法,CMOL算法能够在概念漂移发生时更快地适应新到概念,显示出更高的分类准确率。
    参考文献 | 相关文章 | 多维度评价
    5. 基于迁移学习的图像检索算法
    李晓雨, 聂秀山, 崔超然, 蹇木伟, 尹义龙
    计算机科学    2019, 46 (1): 73-77.   DOI: 10.11896/j.issn.1002-137X.2019.01.011
    摘要442)      PDF(pc) (1560KB)(824)    收藏
    近年来,随着互联网的发展和智能设备的普及,网络上存储的图片数量呈现爆发式增长,同时,不同类型的社交网络、媒体的用户数量也连续增长。在这种情况下,网络上的多媒体数据类型也发生了变革,在包含其本身携带的视觉信息的同时,也包含用户为其设定的标签信息、文本信息。在这种多模态信息杂糅的环境下,如何向用户提供快速准确的图像检索结果,是多媒体检索领域的一个新挑战。文中提出了一种基于迁移学习的图像检索算法,在对图像的视觉信息进行学习的同时,也对图像的文本信息进行学习,并将学习到的结果迁移到视觉信息领域,进行跨模态信息融合,进而产生包含跨模态信息的图像特征。经实验证明,所提算法能够实现更优的图像检索结果。
    参考文献 | 相关文章 | 多维度评价
    6. 数据集分类可用性评估的置信区间方法
    谈询滔, 顾依依, 阮彤, 袁玉波
    计算机科学    2019, 46 (1): 78-85.   DOI: 10.11896/j.issn.1002-137X.2019.01.012
    摘要360)      PDF(pc) (2175KB)(1653)    收藏
    如何有效评价训练数据集的可用性,一直是困扰智能分类系统应用的难点问题。针对机器学习领域的数据分类问题,提出了一种基于区间分析和信息粒化的数据集分类可用性的评估方法,用于评价数据集的可分程度。该方法将待评估的数据集定义为分类信息系统,提出了分类置信区间的概念,通过区间分析进行信息粒化。在此信息粒化策略下,定义分类可用性的数学模型,并进一步给出单个属性以及整体数据集的分类可用性的计算方法。选择18个UCI标准数据集作为评估对象,给出了部分数据集分类可用性的评估结果,并且选取3种分类器对所选数据集进行分类实验,最终通过对上述实验结果的分析证明了该评估方法的有效性和可行性。
    参考文献 | 相关文章 | 多维度评价
    7. 基于改进逆滤波的衍射成像光谱仪图像复原方法
    张茗琪, 曹国, 陈强, 孙权森
    计算机科学    2019, 46 (1): 86-93.   DOI: 10.11896/j.issn.1002-137X.2019.01.013
    摘要439)      PDF(pc) (6764KB)(809)    收藏
    针对在衍射光谱仪(DOIS)成像中离焦谱段对准焦谱段成像造成干扰而导致的图像模糊问题,提出一种改进的逆滤波复原方法,旨在解决逆滤波中存在的不适定问题,并利用该方法对衍射光谱图像进行复原。改进的逆滤波算法通过引入正则化矩阵来改变原始问题的求解形式,将逆滤波函数进行正则化,从而减弱噪声对图像复原效果所产生的影响。通过将图像复原过程转换为矩阵求逆的过程,并在SVD算法求解过程中添加规则滤波器的方法,来调节正则化矩阵的形式以及参数的大小,达到了减弱矩阵的病态性并取得较优的复原效果的目的。实验结果表明,该方法能够有效地对衍射成像光谱仪图像进行复原,在一定程度上提高了拉普拉斯梯度以及图像质量指数(QI)值,同时减小了均方根(RMSE)值。所提方法能够抑制噪声干扰,增强图像清晰度,复原出与参考图相似度更高的单谱段图像,并能够获得更好的光谱曲线,有助于分析出地貌特征。
    参考文献 | 相关文章 | 多维度评价
    8. 样本自适应的不平衡分类器
    才子昕, 王馨月, 徐剑, 景丽萍
    计算机科学    2019, 46 (1): 94-99.   DOI: 10.11896/j.issn.1002-137X.2019.01.014
    摘要354)      PDF(pc) (1347KB)(968)    收藏
    大数据时代,不平衡数据分类在实际应用场景中频繁出现。以二分类为例,传统分类器由于较难学习少数类数据集内部的本质结构,容易将少数类样本错误分类。针对这一问题,一种有效的解决方法是在传统的方法中引入代价敏感机制,为少数类样本赋予更高的误分代价以提升其预测精度。这类方法同等对待了同类样本集中的数据,然而同一类内的不同样本可能对训练过程有不同程度的贡献。为了提升代价敏感机制的有效性,样本自适应的代价敏感策略为不同的样本赋予不同的权重。首先,通过考察样本局部的类分布情况,判断其距离两类样本边界的远近;然后,根据边界分布理论,即距离决策面越近的样本对决策面位置的影响越大,为距离两类样本边界越近的样本赋予越高的权重。实验过程中,通过将样本自适应代价敏感策略应用于LDM,并在标准数据集上进行一系列对比实验,验证了样本自适应代价敏感策略在处理不平衡数据分类问题上的有效性。
    参考文献 | 相关文章 | 多维度评价
    9. 不同纹理复杂度图像生成中CycleGAN循环一致损失系数优化选择方法
    徐强, 钟尚平, 陈开志, 张春阳
    计算机科学    2019, 46 (1): 100-106.   DOI: 10.11896/j.issn.1002-137X.2019.01.015
    摘要679)      PDF(pc) (4469KB)(1506)    收藏
    高质量的图像生成一直是计算机视觉等领域探索的难点和热点。通过使用循环一致损失,CycleGAN在无监督图像生成任务中取得了良好效果。但是面对不同纹理复杂度的图像生成任务,CycleGAN的循环一致损失系数是默认不变的,使得生成图像存在纹理变形甚至消失等弱点,不能很好地保证生成图像的质量。文中融合图像的空间维度和时间维度来度量图像的纹理复杂性,阐明循环一致损失函数在优化目标函数中的重要性,发现并解释循环一致损失系数的大小与不同纹理复杂度图像生成质量的关联性:纹理复杂度越高,应选择越大的循环一致损失系数;反之,应取越小的循环一致损失系数。文中使用基准和自采集的图像数据集,引入了基于迁移学习的分类准确性等生成图像质量评估指标。实验结果表明,优化选择大小合适的循环一致损失系数,可有效提高生成图像的质量。
    参考文献 | 相关文章 | 多维度评价
    10. 基于区间分类的螺旋图可视化边绑定方法
    朱立霞, 李天瑞, 滕飞, 彭博
    计算机科学    2019, 46 (1): 107-111.   DOI: 10.11896/j.issn.1002-137X.2019.01.016
    摘要532)      PDF(pc) (2753KB)(798)    收藏
    在时序数据可视化领域,螺旋图是一种常用的可视化方法,它既能将多个阶段的数据同时展示在一个平面空间内,又能在有限的空间内展示任意时长的数据。针对现有的螺旋图可视化方法在展示大量的时间序列数据时会出现因螺旋线交叉而导致视觉杂乱的问题,研究螺旋图可视化方法意义非凡。首先将状态圆环上的数据点进行分类;然后在相邻的状态圆环之间设置虚拟绑定圆环,通过边绑定的函数将状态圆环上的数据点映射到其对应的虚拟绑定圆环上;最后在状态圆环与其对应的虚拟绑定圆环之间绘制Bézier曲线,在虚拟绑定圆环与虚拟绑定圆环之间绘制螺旋线,从而实现边绑定的效果。实验结果表明,该边绑定算法能够有效地对大规模数据进行可视化,并能有效地缓解视觉杂乱的问题。
    参考文献 | 相关文章 | 多维度评价
    11. 基于状态转移和模糊思考的迁徙优化算法
    钟大鉴, 冯翔, 虞慧群
    计算机科学    2019, 46 (1): 112-116.   DOI: 10.11896/j.issn.1002-137X.2019.01.017
    摘要493)      PDF(pc) (2051KB)(609)    收藏
    基于现有的动物迁徙算法(AMO),提出基于状态转移和模糊思考的迁徙优化算法(SMO)来解决全局优化问题。SMO算法中引入了状态模型和模糊对立模型。首先,状态模型中使用两种状态(分散状态和集中状态)来描述种群分布。在分散状态下,群体随机分布于解空间中,因此,使用概率决策的方式探索解空间,这个过程属于空间探索;随着个体之间的相互学习,个体之间的差异已经很小,群体进入集中状态,此时使用基于步长的搜索策略来调节个体位置,这个过程属于局部勘探。因此,将二者结合可以平衡空间探索和局部勘探功能。其次,算法使用了模糊对立模型,充分利用个体的模糊对立位置,增加了群体的多样性,提高了算法的收敛精度。然后,从理论上证明了该算法的收敛性,并且使用12个基准测试函数来验证算法的性能。最后,将该算法与其他优化算法进行比较,实验结果验证了该算法在优化问题上的有效性。
    参考文献 | 相关文章 | 多维度评价
    12. 基于多视图集成的网络表示学习算法
    冶忠林, 赵海兴, 张科, 朱宇
    计算机科学    2019, 46 (1): 117-125.   DOI: 10.11896/j.issn.1002-137X.2019.01.018
    摘要337)      PDF(pc) (2517KB)(933)    收藏
    现有的网络表示学习算法主要为基于浅层神经网络的网络表示学习和基于神经矩阵分解的网络表示学习。基于浅层神经网络的网络表示学习又被证实是分解网络结构的特征矩阵。另外,现有的大多数网络表示学习仅仅从网络的结构学习特征,即单视图的表示学习;然而,网络本身蕴含有多种视图。因此,文中提出了一种基于多视图集成的网络表示学习算法(MVENR)。该算法摈弃了神经网络的训练过程,将矩阵的信息融合和分解思想融入到网络表示学习中。另外,将网络的结构视图、连边权重视图和节点属性视图进行了有效的融合,弥补了现有网络表示学习中忽略了网络连边权重的不足,解决了基于单一视图训练时网络特征稀疏的问题。实验结果表明,所提MVENR算法的性能优于网络表示学习中部分常用的联合学习算法和基于结构的网络表示学习算法,是一种简单且高效的网络表示学习算法。
    参考文献 | 相关文章 | 多维度评价
    13. 一种基于深度学习的混合推荐算法
    曾旭禹, 杨燕, 王淑营, 何太军, 陈剑波
    计算机科学    2019, 46 (1): 126-130.   DOI: 10.11896/j.issn.1002-137X.2019.01.019
    摘要653)      PDF(pc) (1505KB)(1172)    收藏
    推荐系统在电子商务的发展中发挥着越来越重要的作用,但用户对物品评分数据的稀疏性往往是推荐精度较低的重要原因。目前通常采用推荐技术对辅助信息进行处理,以缓解用户评价的稀疏性,并提高预测评分精度。通过相关模型,可以利用文本数据来提取物品的隐藏特征。最近,深度学习算法快速发展,因此文中选用了一种具有强大特征提取能力的新型深度网络架构——变分自编码器(Variational AutoEncoder,VAE)。通过将无监督变分自编码融合到概率矩阵分解(Probability Matrix Factorization,PMF)中,构建了一种感知上下文的新型推荐模型——变分矩阵分解(Variational AutoEncoder Matrix Factorization,VAEMF)。首先使用TD-IDF对物品的评价文档进行数据预处理,然后对处理后的数据使用VAE捕获物品的上下文信息特征,最后使用概率矩阵分解进一步提高预测评分精度。在两个真实数据集上的实验结果验证了所提方法相较于自编码算法及概率矩阵分解算法的优势。
    参考文献 | 相关文章 | 多维度评价
    14. 基于犹豫模糊可信度的知识推理
    郑宏亮, 侯雪辉, 宋笑迎, 庞阔, 邹丽
    计算机科学    2019, 46 (1): 131-137.   DOI: 10.11896/j.issn.1002-137X.2019.01.020
    摘要499)      PDF(pc) (1262KB)(978)    收藏
    针对不确定性推理中的可信度估值不精确的问题,将犹豫模糊集引入可信度不确定性推理中。提出犹豫模糊可信度的定义,并基于可信度的知识表示给出犹豫模糊可信度的知识表示方式。为解决专家在推理过程中出现的信息缺失问题,提出求解平均值的信息补全方法。构建犹豫模糊可信度的单条规则和多条规则并行关系的运算法则,并给出基于犹豫模糊可信度的知识表示与推理的具体步骤。最后,运用实例验证了所提算法的可行性及有效性。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共14条记录