计算机科学 ›› 2018, Vol. 45 ›› Issue (6A): 453-459.

• 大数据与数据挖掘 • 上一篇    下一篇

基于分形理论的多尺度分类尺度上推算法

李佳星,赵书良,安磊,李长镜   

  1. 河北师范大学数学与信息科学学院 石家庄050024
    河北师范大学河北省计算数学与应用重点实验室 石家庄050024
  • 出版日期:2018-06-20 发布日期:2018-08-03
  • 作者简介:李佳星(1992-),女,硕士生,主要研究领域为数据挖掘、智能信息处理,E-mail:lijiaxing0322@163.com;赵书良(1967-),男,教授,博士生导师,主要研究领域为数据挖掘、智能信息处理,E-mail:zhaoshuliang@sina.com;安 磊(1991-),男,硕士生,主要研究领域为数据挖掘、智能信息处理,E-mail:543080509@qq.com;李长镜(1990-),男,硕士生,主要研究领域为数据挖掘、智能信息处理,E-mail:lee_0809hbsd@outlook.com。
  • 基金资助:
    国家自然科学资金项目(71271067),国家社科基金重大项目(13&ZD091),河北省高等学校科学技术研究项目(QN2014196),河北师范大学硕士基金(xj2015003)资助

Scaling-up Algorithm of Multi-scale Classification Based on Fractal Theory

LI Jia-xing, ZHAO Shu-liang,AN Lei,LI Chang-jing   

  1. College of Mathematic & Information Science,Hebei Normal University,Shijiazhuang 050024,China
    Hebei Key Laboratory of Computational Mathematics & Applications,Hebei Normal University,Shijiazhuang 050024,China
  • Online:2018-06-20 Published:2018-08-03

摘要: 目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但还没有研究涉及一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(Multi-Scale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。

关键词: 尺度上推, 多尺度分类, 多尺度数据挖掘, 分形理论

Abstract: At present,the research of multi-scale data mining mainly focuses on space image data,and recently has produced some results on the general data,including the multi-scale clustering and multi-scale association rules,but it has not been involved in the field of classification mining.Combining with fractal theory,this paper applied the theory,knowledge and methods related to the multi-scale data mining to the areas of the classification mining,and proposed an approach of similarity measure based on Hausdorff.Relative to the definition of weight through experience,this paper clearly defined it by the similarity of generalized fractal dimension to improve the precision of similarity measure.Then,this paper proposed a multi-scale classification scaling-up algorithm named MSCSUA(Multi-Scale Classification Scaling-Up Algorithm).At last,this paper performed experiments on four UCI benchmark data sets and one real data set (H province part of the population).The experimental results show that the thought of multi-scale classification is feasible and effective,the MSCSUA algorithm performs well in terms of classification than SLAD,KNN,Decision Tree and LIBSVM algorithms on different data sets.

Key words: Fractal theory, Multi-scale classification, Multi-scale data mining, Scaling-up

中图分类号: 

  • TP391
[1]韩玉辉,赵书良,柳萌萌,等.多尺度聚类挖掘算法[J].计算机科学,2016,43(8):244-248.
[2]赵仲秋,季海峰,高隽,等.基于稀疏编码多尺度空间潜在语义分析的图像分类[J].计算机学报,2014,37(6):1251-1260.
[3]张瑞杰,李弼程,魏福山.基于多尺度上下文语义信息的图像场景分类算法[J].电子学报,2014,4:646-652.
[4]兰泽英,刘洋.领域知识辅助下基于多尺度与主方向纹理的遥感影像土地利用分类[J].测绘学报,2016,45(8):973-982.
[5]佃袁勇,方圣辉,姚崇怀.多尺度分割的高分辨率遥感影像变化检测[J].遥感学报,2016,20(1):129-137.
[6]李少英,刘小平,黎夏,等.土地利用变化模拟模型及应用研究进展[J].遥感学报,21(3):329-340.
[7]HOBERG T,ROTTENSTEINER F,FEITOSA R Q,et al.Conditional Random Fields for Multitemporal and Multiscale Classification of Optical Satellite Imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(2):659-673.
[8]SHEN L,SUN G,HUANG Q M,et al.Multi-Level Discriminative Dictionary Learning With Application to Large Scale Image Classification[J].IEEE Transactions on Image Processing,2015,24(10):3109-3123.
[9]柳萌萌,赵书良,陈敏,等.多尺度关联规则挖掘的尺度上推算法[J].计算机应用研究,2015,32(10):2924-2929.
[10]栾海军,田庆久,余涛,等.根据分形理论与五指标评价体系构建NDVI连续空间尺度转换模型[J].遥感学报,2015,19(1):116-125.
[11]BELUSSI A,FALOUTSOS C.Estimating the selectivity of spatial queries using the Correlation Fractal dimension[C]∥Proceedings of the 21st International Conference on Very Large Data Bases(VLDB’95).San Francisco,CA,USA:Morgan Kau-fndnn,1995:1-26.
[12]孙力帆,张森,冀保峰,等.基于改进豪斯多夫距离的扩展目标形态估计评估[J].光学学报,2017,37(7):0728003.
[13]高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2004:42-46.
[14]MILLER D,SOH L K.Cluster-Based Boosting[J].IEEE Transactions on Knowledge and Data Engineering,2015,27(6):1491-1504.
[15]BRUNI R,BIANCHI G.Effective Classification Using a Small Training Set Based on Discretization and StatisticalAnalysis[J].IEEE Transactions on Knowledge and Data Engineering,2015,27(9):2349-2361.
[1] 刘胜久, 李天瑞, 谢鹏, 刘佳.
带权图的多重分形度量
Measure for Multi-fractals of Weighted Graphs
计算机科学, 2021, 48(3): 136-143. https://doi.org/10.11896/jsjkx.200700159
[2] 张昉, 赵书良, 武永亮.
面向多尺度数据挖掘的数据尺度划分方法
Data Scaling Method for Multi-scale Data Mining
计算机科学, 2019, 46(4): 57-65. https://doi.org/10.11896/j.issn.1002-137X.2019.04.009
[3] 李超,赵书良,赵骏鹏,高琳,池云仙.
多尺度关联规则尺度上推算法
Scaling-up Algorithm of Multi-scale Association Rules
计算机科学, 2017, 44(8): 285-289. https://doi.org/10.11896/j.issn.1002-137X.2017.08.049
[4] 李文莉,高宏伟,冀大雄,李岩.
基于遗传算法的海底沉积物纹理特征优化方法
Optimization Method of Seabed Sediment Texture Feature Based on Genetic Algorithm
计算机科学, 2016, 43(Z6): 130-133. https://doi.org/10.11896/j.issn.1002-137X.2016.6A.031
[5] 李广鑫 丁振国 周利华.
一种新的兼具自动性和可控性的地形生成方法

计算机科学, 2005, 32(6): 151-154.
[6] 蒋廷耀 李庆华 杨景华.
关联维数的并行求解算法

计算机科学, 2004, 31(7): 169-170.
[7] 侯建荣 刘宣会 等.
分形插值函数反问题的小波解法

计算机科学, 2001, 28(8): 126-127.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!