1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2018 年第七届中国数据挖掘会议 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 层次粒结构下粗糙模糊集的不确定性度量
    杨洁, 王国胤, 张清华, 冯林
    计算机科学    2019, 46 (1): 45-50.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.007
    摘要 (170)   PDF (1855KB) (297)  
    众所周知,经典粗糙集的不确定性来自于边界域,但是对于粗糙模糊集来说,其正域和负域中的元素存在不确定性,从而导致粗糙模糊集的不确定性不仅来自于边界域,还来自于正域和负域。另外,在粗糙模糊集中,一个模糊概念可以通过层次粒结构中不同的粗糙近似空间进行刻画,随着粒度的变化,模糊概念的不确定性的变化规律如何?对此,文中提出一种基于模糊度的不确定性度量公式,并基于均值模糊集分析了粗糙模糊集模型,得出粗糙模糊集不确定性度量的模型同样适合于度量概率粗糙集的不确定性的结论。其次,采用基于模糊度的不确定性度量方法,揭示了分层递阶的多粒度空间下粗糙模糊集不确定性的变化规律。然后,分析了3个域(正域、边界域和负域)的不确定性,并揭示了它们在分层递阶的多粒度空间下的变化规律。最后,通过实验验证了所提不确定性度量理论的有效性。
    参考文献 | 相关文章 | 多维度评价
    2. 网络维数:一种度量复杂网络的新方法
    刘胜久, 李天瑞, 刘小伟
    计算机科学    2019, 46 (1): 51-56.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.008
    摘要 (213)   PDF (1467KB) (674)  
    如何对复杂网络进行刻画与度量,一直是人们关注的热点。在研究自相似复杂网络分形维数的基础上,提出了一种度量复杂网络的新方法——网络维数,即复杂网络边权重和的对数值与节点权重和的对数值的比值,可以将边权重及点权重推广到实数域和复数域;同时给出了不同类型权重对应的网络维数的计算方法;最后以几个代表性的经典复杂网络模型为例,讨论了所提出的网络维数的若干性质。
    参考文献 | 相关文章 | 多维度评价
    3. 在线核选择的对抗式多臂赌博机模型
    李峻樊, 廖士中
    计算机科学    2019, 46 (1): 57-63.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.009
    摘要 (160)   PDF (1253KB) (286)  
    在线核选择是在线核方法的重要工作,可分为过滤式、包裹式和嵌入式3种类型。已有在线核选择探索了包裹式方法和嵌入式方法,也经验地采用了过滤式方法,但迄今尚没有一个统一的框架来比较、分析并研究各种在线核选择问题。文中提出一种在线核选择的多臂赌博机模型,该模型可作为一个统一框架,同时给出在线核选择的包裹式方法和嵌入式方法。给定候选核集合,候选集中的一个核对应多臂赌博机模型中的一个臂,在线核选择的每回合依据一个概率分布重复地随机选择多个核,并应用指数加权的方法来更新该概率分布。这样,在线核选择问题本质上可归约为一个非遗忘对手环境下的对抗式多臂赌博机问题,并可应用对抗式多臂赌博机模型统一地给出在线核选择的包裹式方法和嵌入式方法。文中进一步提出一个新的在线核选择后悔的概念,理论证明包裹式方法具有关于回合数亚线性的弱期望后悔界,并且嵌入式方法具有关于回合数亚线性的期望后悔界。最后,在标准数据集上通过实验验证了所提统一框架的可行性。
    参考文献 | 相关文章 | 多维度评价
    4. 概念漂移数据流分类中的多源在线迁移学习算法
    秦一休, 文益民, 何倩
    计算机科学    2019, 46 (1): 64-72.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.010
    摘要 (195)   PDF (3631KB) (468)  
    现有概念漂移处理算法在检测到概念漂移发生后,通常需要在新到概念上重新训练分类器,同时“遗忘”以往训练的分类器。在概念漂移发生初期,由于能够获取到的属于新到概念的样本较少,导致新建的分类器在短时间内无法得到充分训练,分类性能通常较差。进一步,现有的基于在线迁移学习的数据流分类算法仅能使用单个分类器的知识辅助新到概念进行学习,在历史概念与新到概念相似性较差时,分类模型的分类准确率不理想。针对以上问题,文中提出一种能够利用多个历史分类器知识的数据流分类算法——CMOL。CMOL算法采取分类器权重动态调节机制,根据分类器的权重对分类器池进行更新,使得分类器池能够尽可能地包含更多的概念。实验表明,相较于其他相关算法,CMOL算法能够在概念漂移发生时更快地适应新到概念,显示出更高的分类准确率。
    参考文献 | 相关文章 | 多维度评价
    5. 基于迁移学习的图像检索算法
    李晓雨, 聂秀山, 崔超然, 蹇木伟, 尹义龙
    计算机科学    2019, 46 (1): 73-77.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.011
    摘要 (247)   PDF (1560KB) (353)  
    近年来,随着互联网的发展和智能设备的普及,网络上存储的图片数量呈现爆发式增长,同时,不同类型的社交网络、媒体的用户数量也连续增长。在这种情况下,网络上的多媒体数据类型也发生了变革,在包含其本身携带的视觉信息的同时,也包含用户为其设定的标签信息、文本信息。在这种多模态信息杂糅的环境下,如何向用户提供快速准确的图像检索结果,是多媒体检索领域的一个新挑战。文中提出了一种基于迁移学习的图像检索算法,在对图像的视觉信息进行学习的同时,也对图像的文本信息进行学习,并将学习到的结果迁移到视觉信息领域,进行跨模态信息融合,进而产生包含跨模态信息的图像特征。经实验证明,所提算法能够实现更优的图像检索结果。
    参考文献 | 相关文章 | 多维度评价
    6. 数据集分类可用性评估的置信区间方法
    谈询滔, 顾依依, 阮彤, 袁玉波
    计算机科学    2019, 46 (1): 78-85.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.012
    摘要 (111)   PDF (2175KB) (845)  
    如何有效评价训练数据集的可用性,一直是困扰智能分类系统应用的难点问题。针对机器学习领域的数据分类问题,提出了一种基于区间分析和信息粒化的数据集分类可用性的评估方法,用于评价数据集的可分程度。该方法将待评估的数据集定义为分类信息系统,提出了分类置信区间的概念,通过区间分析进行信息粒化。在此信息粒化策略下,定义分类可用性的数学模型,并进一步给出单个属性以及整体数据集的分类可用性的计算方法。选择18个UCI标准数据集作为评估对象,给出了部分数据集分类可用性的评估结果,并且选取3种分类器对所选数据集进行分类实验,最终通过对上述实验结果的分析证明了该评估方法的有效性和可行性。
    参考文献 | 相关文章 | 多维度评价
    7. 基于改进逆滤波的衍射成像光谱仪图像复原方法
    张茗琪, 曹国, 陈强, 孙权森
    计算机科学    2019, 46 (1): 86-93.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.013
    摘要 (110)   PDF (6764KB) (303)  
    针对在衍射光谱仪(DOIS)成像中离焦谱段对准焦谱段成像造成干扰而导致的图像模糊问题,提出一种改进的逆滤波复原方法,旨在解决逆滤波中存在的不适定问题,并利用该方法对衍射光谱图像进行复原。改进的逆滤波算法通过引入正则化矩阵来改变原始问题的求解形式,将逆滤波函数进行正则化,从而减弱噪声对图像复原效果所产生的影响。通过将图像复原过程转换为矩阵求逆的过程,并在SVD算法求解过程中添加规则滤波器的方法,来调节正则化矩阵的形式以及参数的大小,达到了减弱矩阵的病态性并取得较优的复原效果的目的。实验结果表明,该方法能够有效地对衍射成像光谱仪图像进行复原,在一定程度上提高了拉普拉斯梯度以及图像质量指数(QI)值,同时减小了均方根(RMSE)值。所提方法能够抑制噪声干扰,增强图像清晰度,复原出与参考图相似度更高的单谱段图像,并能够获得更好的光谱曲线,有助于分析出地貌特征。
    参考文献 | 相关文章 | 多维度评价
    8. 样本自适应的不平衡分类器
    才子昕, 王馨月, 徐剑, 景丽萍
    计算机科学    2019, 46 (1): 94-99.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.014
    摘要 (171)   PDF (1347KB) (430)  
    大数据时代,不平衡数据分类在实际应用场景中频繁出现。以二分类为例,传统分类器由于较难学习少数类数据集内部的本质结构,容易将少数类样本错误分类。针对这一问题,一种有效的解决方法是在传统的方法中引入代价敏感机制,为少数类样本赋予更高的误分代价以提升其预测精度。这类方法同等对待了同类样本集中的数据,然而同一类内的不同样本可能对训练过程有不同程度的贡献。为了提升代价敏感机制的有效性,样本自适应的代价敏感策略为不同的样本赋予不同的权重。首先,通过考察样本局部的类分布情况,判断其距离两类样本边界的远近;然后,根据边界分布理论,即距离决策面越近的样本对决策面位置的影响越大,为距离两类样本边界越近的样本赋予越高的权重。实验过程中,通过将样本自适应代价敏感策略应用于LDM,并在标准数据集上进行一系列对比实验,验证了样本自适应代价敏感策略在处理不平衡数据分类问题上的有效性。
    参考文献 | 相关文章 | 多维度评价
    9. 不同纹理复杂度图像生成中CycleGAN循环一致损失系数优化选择方法
    徐强, 钟尚平, 陈开志, 张春阳
    计算机科学    2019, 46 (1): 100-106.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.015
    摘要 (343)   PDF (4469KB) (698)  
    高质量的图像生成一直是计算机视觉等领域探索的难点和热点。通过使用循环一致损失,CycleGAN在无监督图像生成任务中取得了良好效果。但是面对不同纹理复杂度的图像生成任务,CycleGAN的循环一致损失系数是默认不变的,使得生成图像存在纹理变形甚至消失等弱点,不能很好地保证生成图像的质量。文中融合图像的空间维度和时间维度来度量图像的纹理复杂性,阐明循环一致损失函数在优化目标函数中的重要性,发现并解释循环一致损失系数的大小与不同纹理复杂度图像生成质量的关联性:纹理复杂度越高,应选择越大的循环一致损失系数;反之,应取越小的循环一致损失系数。文中使用基准和自采集的图像数据集,引入了基于迁移学习的分类准确性等生成图像质量评估指标。实验结果表明,优化选择大小合适的循环一致损失系数,可有效提高生成图像的质量。
    参考文献 | 相关文章 | 多维度评价
    10. 基于区间分类的螺旋图可视化边绑定方法
    朱立霞, 李天瑞, 滕飞, 彭博
    计算机科学    2019, 46 (1): 107-111.   https://doi.org/10.11896/j.issn.1002-137X.2019.01.016
    摘要 (267)   PDF (2753KB) (426)  
    在时序数据可视化领域,螺旋图是一种常用的可视化方法,它既能将多个阶段的数据同时展示在一个平面空间内,又能在有限的空间内展示任意时长的数据。针对现有的螺旋图可视化方法在展示大量的时间序列数据时会出现因螺旋线交叉而导致视觉杂乱的问题,研究螺旋图可视化方法意义非凡。首先将状态圆环上的数据点进行分类;然后在相邻的状态圆环之间设置虚拟绑定圆环,通过边绑定的函数将状态圆环上的数据点映射到其对应的虚拟绑定圆环上;最后在状态圆环与其对应的虚拟绑定圆环之间绘制Bézier曲线,在虚拟绑定圆环与虚拟绑定圆环之间绘制螺旋线,从而实现边绑定的效果。实验结果表明,该边绑定算法能够有效地对大规模数据进行可视化,并能有效地缓解视觉杂乱的问题。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共14条记录