计算机科学 ›› 2018, Vol. 45 ›› Issue (6A): 453-459.
李佳星,赵书良,安磊,李长镜
LI Jia-xing, ZHAO Shu-liang,AN Lei,LI Chang-jing
摘要: 目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但还没有研究涉及一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(Multi-Scale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。
中图分类号:
[1]韩玉辉,赵书良,柳萌萌,等.多尺度聚类挖掘算法[J].计算机科学,2016,43(8):244-248. [2]赵仲秋,季海峰,高隽,等.基于稀疏编码多尺度空间潜在语义分析的图像分类[J].计算机学报,2014,37(6):1251-1260. [3]张瑞杰,李弼程,魏福山.基于多尺度上下文语义信息的图像场景分类算法[J].电子学报,2014,4:646-652. [4]兰泽英,刘洋.领域知识辅助下基于多尺度与主方向纹理的遥感影像土地利用分类[J].测绘学报,2016,45(8):973-982. [5]佃袁勇,方圣辉,姚崇怀.多尺度分割的高分辨率遥感影像变化检测[J].遥感学报,2016,20(1):129-137. [6]李少英,刘小平,黎夏,等.土地利用变化模拟模型及应用研究进展[J].遥感学报,21(3):329-340. [7]HOBERG T,ROTTENSTEINER F,FEITOSA R Q,et al.Conditional Random Fields for Multitemporal and Multiscale Classification of Optical Satellite Imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(2):659-673. [8]SHEN L,SUN G,HUANG Q M,et al.Multi-Level Discriminative Dictionary Learning With Application to Large Scale Image Classification[J].IEEE Transactions on Image Processing,2015,24(10):3109-3123. [9]柳萌萌,赵书良,陈敏,等.多尺度关联规则挖掘的尺度上推算法[J].计算机应用研究,2015,32(10):2924-2929. [10]栾海军,田庆久,余涛,等.根据分形理论与五指标评价体系构建NDVI连续空间尺度转换模型[J].遥感学报,2015,19(1):116-125. [11]BELUSSI A,FALOUTSOS C.Estimating the selectivity of spatial queries using the Correlation Fractal dimension[C]∥Proceedings of the 21st International Conference on Very Large Data Bases(VLDB’95).San Francisco,CA,USA:Morgan Kau-fndnn,1995:1-26. [12]孙力帆,张森,冀保峰,等.基于改进豪斯多夫距离的扩展目标形态估计评估[J].光学学报,2017,37(7):0728003. [13]高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2004:42-46. [14]MILLER D,SOH L K.Cluster-Based Boosting[J].IEEE Transactions on Knowledge and Data Engineering,2015,27(6):1491-1504. [15]BRUNI R,BIANCHI G.Effective Classification Using a Small Training Set Based on Discretization and StatisticalAnalysis[J].IEEE Transactions on Knowledge and Data Engineering,2015,27(9):2349-2361. |
[1] | 刘胜久, 李天瑞, 谢鹏, 刘佳. 带权图的多重分形度量 Measure for Multi-fractals of Weighted Graphs 计算机科学, 2021, 48(3): 136-143. https://doi.org/10.11896/jsjkx.200700159 |
[2] | 张昉, 赵书良, 武永亮. 面向多尺度数据挖掘的数据尺度划分方法 Data Scaling Method for Multi-scale Data Mining 计算机科学, 2019, 46(4): 57-65. https://doi.org/10.11896/j.issn.1002-137X.2019.04.009 |
[3] | 李超,赵书良,赵骏鹏,高琳,池云仙. 多尺度关联规则尺度上推算法 Scaling-up Algorithm of Multi-scale Association Rules 计算机科学, 2017, 44(8): 285-289. https://doi.org/10.11896/j.issn.1002-137X.2017.08.049 |
[4] | 李文莉,高宏伟,冀大雄,李岩. 基于遗传算法的海底沉积物纹理特征优化方法 Optimization Method of Seabed Sediment Texture Feature Based on Genetic Algorithm 计算机科学, 2016, 43(Z6): 130-133. https://doi.org/10.11896/j.issn.1002-137X.2016.6A.031 |
[5] | 李广鑫 丁振国 周利华. 一种新的兼具自动性和可控性的地形生成方法 计算机科学, 2005, 32(6): 151-154. |
[6] | 蒋廷耀 李庆华 杨景华. 关联维数的并行求解算法 计算机科学, 2004, 31(7): 169-170. |
[7] | 侯建荣 刘宣会 等. 分形插值函数反问题的小波解法 计算机科学, 2001, 28(8): 126-127. |
|