计算机科学 ›› 2019, Vol. 46 ›› Issue (12): 286-291.doi: 10.11896/jsjkx.181202257
吴晨1,3, 袁昱纬2, 王宏伟3, 刘宇3, 刘思彤4, 全吉成3
WU Chen1,3, YUAN Yu-wei2, WANG Hong-wei3, LIU Yu3, LIU Si-tong4, QUAN Ji-cheng3
摘要: 零样本分类算法无须标注要识别的类别样本,因而能大幅度降低实际应用成本,近年来受到广泛关注。遥感场景类别的语义词向量与图像特征空间原型的结构不一致问题,严重影响了遥感场景零样本的分类效果。利用不同词向量间的互补性,文中提出一种基于语义词向量融合的遥感场景零样本分类算法,即耦合式解析字典学习(Coupled Analysis Dictionary Learning,CADL)方法。首先,采用稀疏编码效率较高的解析字典学习方法获取各语义词向量的稀疏系数,以减少冗余信息;然后,将对应的稀疏编码系数串接后作为融合语义词向量表示,并将融合语义词向量线性映射到图像特征空间,与图像特征空间场景类别原型表示进行结构对齐,以降低结构差异性;最后,计算得到要识别的场景类别的图像特征原型,并采用最近邻分类器在图像特征空间完成分类。在UCM和AID数据集上对多种语义词向量的融合进行定量实验,同时将RSSCN7数据集作为已知场景类别的数据集来对两幅实际遥感图像进行定性实验。在UCM和AID上的定量实验分别获得了最高总体分类准确度48.40%和60.23%,相比于典型零样本分类方法的总体分类准确度分别提升了4.80%和6.98%。对两幅实际遥感图像的定性实验,同样获得了最佳零样本的分类效果。实验结果表明,多种语义词向量融合,可以获得与图像特征空间原型结构更一致的语义词向量,且显著提升了遥感场景零样本分类的准确度。
中图分类号:
[1] | CHEN S,TIAN Y L.Pyramid of spatial relations for scene-level land use classification[J].IEEE Transactions on Geoscience & Remote Sensing,2014,53(4):1947-1957. |
[2] | LI A,LU Z,WANG L,et al.Zero-shot scene classification for high spatial resolution remote sensing images[J].IEEE Tran-sactions on Geoscience & Remote Sensing,2017,55(7):4157-4167. |
[3] | XIAN Y Q,AKATA Z,SHARMA G,et al.Latent embeddings for zero-shot classification[C]//Proceedings of Computer Vision and Pattern Recognition.LA USA:IEEE,2016:69-77. |
[4] | WANG D,LI Y,LIN Y,et al.Relational Knowledge Transfer for Zero-Shot Learning[C]//Proceedings of AAAI.CA USA:2016,2-7. |
[5] | ZHANG Z,SALIGRAMA V.Zero-shot learning via joint latent similarity embedding[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.LA USA:IEEE,2016:6034-6042. |
[6] | ZHANG Z,SALIGRAMA V.Zero-shot learning via semantic similarity embedding[C]//Proceedings of the IEEE InternationalConference on Computer Vision.Boston USA:IEEE,2015:4166-4174. |
[7] | WANG Q,CHEN K.Zero-shot visual recognition via bidirec- tional latent embedding[J].International Journal of Computer Vision,2017,124(3):356-383. |
[8] | LI Y,WANG D,HU H,et al.Zero-shot recognition using dual visual-semantic mapping paths[J].arXiv:1703.05002,2017. |
[9] | ZHAO B,WU B,WU T,et al.Zero-shot learning posed as a missing data problem[J].arXiv:1612.00560,2016. |
[10] | LAMPERT C H,NICKISCH H,HARMELING S.Attribute- based classification for zero-shot visual object categorization[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2014,36(3):453-465. |
[11] | SOCHER R,GANJOO M,MANNING C D,et al.Zero-shot learning through cross-modal transfer[C]//Proceedings of Advances in Neural Information Processing Systems.Lake Tahoe USA,ACM 2013:935-943. |
[12] | MIKOLOV T,CHEN K,CORRADO G,et al.Efficient estimation of word representations in vector space[J].arXiv:1301.3781,2013. |
[13] | SOCHER R,MANNING C D.Glove:Global vectors for word representation[C]//Empirical Methods in Natural Language Processing (EMNLP).2014:1532-1543 |
[14] | YANG M,CHANG H Y,LUO W X.Discriminative analysis-synthesis dictionary learning for image classification[J].Neurocomputing,2017,219:404-411. |
[15] | WANG J J,GUO Y Q,GUO J,et al.Synthesis linear classifier-based analysis dictionary learning for pattern classification [J].Neurocomputing,2017,238:103-113. |
[16] | RAVISHANKAR S,BRESLER Y.L0 sparsifying transform learning with efficient optimal updates and convergence guarantees[J].IEEE Transactions on Signal Processing,2015,63(9):2389-2404. |
[17] | YANG Y,NEWSAM S.Bag-of-visual-words and spatial extensions for land-use classification[C]//Proceedings of the 18th SIGSPATIAL International Conference on Advances In Geographic Information Systems.ACM,2010:270-279. |
[18] | XIA G S,HU J,HU F,et al.AID:A benchmark dataset for performance evaluation of aerial scene classification[J].IEEE Transactions on Geoscience and Remote Sensing,2017,55(7):3965-3981. |
[19] | ZOU Q,NI L,ZHANG T,et al.Deep learning based feature selection for remote sensing scene classification[J].IEEEGeo-science & Remote Sensing Letters,2015,12(11):2321-2325. |
[20] | SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for large-scale image recognition[J].arXiv:1409.1556,2014. |
[1] | 薛占熬, 张敏, 赵丽平, 李永祥. 集对优势关系下多粒度决策粗糙集的可变三支决策模型[J]. 计算机科学, 2021, 48(1): 157-166. |
[2] | 李亚男, 胡宇佳, 甘伟, 朱敏. 基于深度学习的miRNA靶位点预测研究综述[J]. 计算机科学, 2021, 48(1): 209-216. |
[3] | 顾秋阳, 琚春华, 吴功兴. 融入深度自编码器与网络表示学习的社交网络信息推荐模型[J]. 计算机科学, 2020, 47(11): 101-112. |
[4] | 张永安, 颜斌斌. 一种股票市场的深度学习复合预测模型[J]. 计算机科学, 2020, 47(11): 255-267. |
[5] | 唐雷明, 白沐尘, 何星星, 黎兴玉. 基于命题逻辑的完全标准矛盾体及最小标准矛盾体[J]. 计算机科学, 2020, 47(11A): 83-85. |
[6] | 纪明轩, 宋玉蓉. 一种基于对数位置表示和自注意力的机器翻译新模型[J]. 计算机科学, 2020, 47(11A): 86-91. |
[7] | 郑添健, 侯金宏, 张维, 王驹. 循环描述逻辑系统FL0最大不动点模型的有穷基[J]. 计算机科学, 2020, 47(11A): 92-96. |
[8] | 王赛男, 郑雄风. 基于边缘计算的图像语义分割应用与研究[J]. 计算机科学, 2020, 47(11A): 276-280. |
[9] | 周玉, 任钦差, 牛会宾. 训练样本数据选择方法研究综述[J]. 计算机科学, 2020, 47(11A): 402-408. |
[10] | 王晓晖, 张亮, 李俊清, 孙玉翠, 田捷, 韩睿毅. 基于遗传算法与随机森林的XGBoost改进方法研究[J]. 计算机科学, 2020, 47(11A): 454-458. |
[11] | 马创, 周代棋, 张业. 基于改进鲸鱼算法的BP神经网络水资源需求预测方法[J]. 计算机科学, 2020, 47(11A): 486-490. |
[12] | 赵霞, 李娴, 张泽华, 张晨威. 结合社区嵌入和节点嵌入的社区发现算法[J]. 计算机科学, 2020, 47(10): 121-125. |
[13] | 魏霖静, 宁璐璐, 郭斌, 侯振兴, 甘诗润. 基于混合蛙跳算法的K-mediods聚类挖掘与并行优化[J]. 计算机科学, 2020, 47(10): 126-129. |
[14] | 陈玉金, 徐吉辉, 史佳辉, 刘宇. 基于直觉犹豫模糊集的三支决策模型及其应用[J]. 计算机科学, 2020, 47(8): 144-150. |
[15] | 董明刚, 黄宇扬, 敬超. 基于遗传实例和特征选择的K近邻训练集优化方法[J]. 计算机科学, 2020, 47(8): 178-184. |
|