1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    计算机图形学& 多媒体 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于注意力机制的医学影像深度哈希检索算法
    朱承璋, 黄嘉儿, 肖亚龙, 王晗, 邹北骥
    计算机科学    2022, 49 (8): 113-119.   DOI: 10.11896/jsjkx.210700153
    摘要335)      PDF(pc) (1923KB)(536)    收藏
    针对现阶段医学影像检索中检索性能差、精度低、缺乏可解释性等一系列问题,提出了一种结合了注意力机制的医学影像检索算法。以深度卷积神经网络为基础,以贝叶斯模型为框架,所提算法引入了由语义特征引导的注意力机制模块,通过分类网络的引导,生成包含语义信息的局部特征描述子,同时使用全局特征与富含语义信息的局部特征作为哈希网络的输入,引导哈希网络从全局和局部的角度关注重要特征区域,增强了哈希编码的特征表达能力,并引入加权似然估计函数解决了正负样本对数量不均衡的问题。采用MAP和NDCG作为评价指标,选择ChestX-ray14数据集进行实验,将所提算法与目前常用的深度哈希方法进行对比。实验结果表明,本文算法在哈希编码不同码位下的MAP值和NDCG值都远优于现有的深度哈希方法,证明了其有效性。
    参考文献 | 相关文章 | 多维度评价
    2. 基于重参数化多尺度融合网络的高效极暗光原始图像降噪
    魏恺轩, 付莹
    计算机科学    2022, 49 (8): 120-126.   DOI: 10.11896/jsjkx.220200179
    摘要514)      PDF(pc) (2900KB)(613)    收藏
    实用的暗光降噪增强解决方案往往需要具备计算速度快、内存效率高、能够实现视觉上高质量的降噪等优点。现有方法大多以提升降噪质量为目标,因此在速度和内存要求上有所折中,这在很大程度上限制了其实用性。文中提出了一种新的深度降噪网络——重参数化多尺度融合网络,用于极暗光单张原始图像降噪,在不损失降噪性能的同时加快模型的推断速度并降低内存开销。具体地,在多尺度空间提取图像特征,利用轻量级的空间通道并行注意力模块动态自适应地聚焦于空间及通道中的核心特征;同时使用重参数化的卷积单元,在不增加任何推断计算量的情况下进一步丰富模型的表征能力。该模型在常见CPU上(如Intel i7-7700K)可以在1s左右恢复超高清4K分辨率图像,在普通GPU(如NVIDIA GTX 1080Ti)上以24帧率的速度运行,在几乎4倍快于现有先进方法(如UNet)的同时仍保持具有竞争力的恢复质量。
    参考文献 | 相关文章 | 多维度评价
    3. 基于Hachimoji DNA和QR分解的遥感图像可逆隐藏算法
    王坤姝, 张泽辉, 高铁杠
    计算机科学    2022, 49 (8): 127-135.   DOI: 10.11896/jsjkx.210700216
    摘要257)      PDF(pc) (5000KB)(469)    收藏
    近年来,随着云计算和人工智能的飞速发展,数字图像在多媒体、医疗和军事等领域中的应用越来越普遍。其中,遥感技术通过电磁波的理论可以对远距离目标进行探测处理,因此,遥感图像的传输安全变得尤为重要。为了解决数字图像信息的安全和隐私保护等问题,提出了一种基于新型Hachimoji脱氧核糖核酸(Deoxyribonucleic Acid,DNA)和QR分解的遥感图像可逆隐藏算法。首先利用遥感图像和宿主图像的信息熵更新耦合映像格子(Coupled Map Lattice,CML)的系统参数和初始值,将产生的混沌序列作为加密过程中一次一密的密钥流,增强抵抗已知攻击或选择明文攻击的能力。接着,根据Hachimoji DNA技术对遥感图像进行8位碱基编码,并利用密钥流对图像矩阵进行异或运算和循环移位操作。最后,将宿主图像分块并进行QR分解,并将加密后的遥感图像以DNA碱基的形式嵌入宿主块中。特别地,嵌入遥感信息后的宿主图像仍然有视觉意义,并且可以从中无损地提取出所嵌入的图像信息。实验仿真结果表明,所提算法嵌入效果良好、安全性高,具有较强的鲁棒性。
    参考文献 | 相关文章 | 多维度评价
    4. 基于边框距离度量的增量目标检测方法
    刘冬梅, 徐洋, 吴泽彬, 刘倩, 宋斌, 韦志辉
    计算机科学    2022, 49 (8): 136-142.   DOI: 10.11896/jsjkx.220100132
    摘要337)      PDF(pc) (2816KB)(582)    收藏
    增量学习在图像分类中已经获得了不错的效果,但是将增量学习技术直接应用于多类目标检测具有一定的挑战性。相比图像分类,目标检测是一项更复杂的任务,因为它结合了分类和边框回归的问题。目前最先进的增量目标检测器大多采用基于知识蒸馏的外部固定区域建议方法,该方法需耗费大量的时间和成本。由于单阶段检测器缺少旧类别的标注和区域建议信息,检测器通常会将旧类目标识别为背景,从而导致灾难性遗忘,因此提出了一种基于边框距离度量的标签选择算法。该算法利用旧模型检测结果和现有的数据集标签,通过度量边框重合度进行选择与合并,弥补了新数据集中旧类目标注释缺失的问题,缓解了灾难性遗忘。同时设计了一个注意力残差模块,该模块通过将注意力模块与残差模块相结合,在特征提取网络的不同深度均能提取可鉴别性特征,进一步提升了模型检测新旧类目标的精度。在单阶段检测框架中实现了该方法,同时在PASCAL VOC数据集上验证了该方法的有效性。与目前最好的方法相比,所提模型检测旧类别目标的平均精度值mAP高出了2.8%,总体的平均精度值mAP高出了2.1%。所提方法得到的伪标签有效缓解了遗忘问题,注意力残差模块的设计提升了模型的检测精度。
    参考文献 | 相关文章 | 多维度评价
    5. 三维激光雷达点云空间多特征分割
    杨文坤, 原晓佩, 陈小锋, 郭睿
    计算机科学    2022, 49 (8): 143-149.   DOI: 10.11896/jsjkx.210300275
    摘要291)      PDF(pc) (2871KB)(451)    收藏
    多线固态激光雷达已成为无人平台环境感知的重要工具,在车载环境建模中得到大量应用。但由于激光雷达分辨率较低、环境噪声敏感、场景复杂等问题,造成场景分割困难。针对实测车载多线激光雷达数据中建筑体点云及植被点云的曲率差异,提出了一种改进的多线激光雷达三维点云的快速分割方法。在曲率分割的基础上,采用加权欧聚类进行二次迭代分割,减少迭代的同时避免陷入局部最优。通过无人平台实测数据采集处理实验和公共数据实验,验证了空间多特征分割方法在激光雷达点云分割方面的有效性;针对场景最终的分割结果,在场景过分割率、欠分割率及正确分割率方面进行了统计,并与传统区域生长分割算法进行了对比分析,结果表明空间多特征分割算法在不同场景的分割中具有较强的适用性及分割准确度。
    参考文献 | 相关文章 | 多维度评价
    6. 基于局部梯度强度图的动态规划检测前跟踪算法
    陈莹, 郝应光, 王洪玉, 王坤
    计算机科学    2022, 49 (8): 150-156.   DOI: 10.11896/jsjkx.210700135
    摘要328)      PDF(pc) (3391KB)(627)    收藏
    针对传统动态规划检测前跟踪(DP-TBD)算法在背景复杂度高且信噪比低的红外弱小目标图像中检测概率低的问题,提出了一种基于局部梯度强度图的动态规划检测前跟踪(LIG-DP-TBD)算法。该算法首先采用局部梯度强度算法(LIG)对帧序列图像进行预处理,从而得到一个新的量测模型;再根据相邻帧值函数的相关性,构造一种全新的值函数;利用动态规划检测前跟踪算法(DP-TBD)对新的值函数进行多帧积累,从而实现对弱小目标的检测前跟踪。蒙特卡洛仿真实验结果表明,在信噪比低于4dB的情况下,该算法的检测概率较传统DP-TBD算法和DBT算法相比提高了约10%。同时,在背景复杂的真实红外弱小目标序列图像中,该算法可以在恒定虚警率条件下有效地进行弱小目标的检测前跟踪,提高了目标的检测概率。
    参考文献 | 相关文章 | 多维度评价
    7. 基于软标签和样本权重优化的Anchor Free目标检测算法
    王灿, 刘永坚, 解庆, 马艳春
    计算机科学    2022, 49 (8): 157-164.   DOI: 10.11896/jsjkx.210600240
    摘要253)      PDF(pc) (3142KB)(578)    收藏
    与Anchor Based目标检测算法类似,基于特征点的Anchor Free目标检测算法也面临着在正负样本划分中存在模糊样本的问题,即根据特定阈值和特征点位置划分非正即负的训练样本,网络在对特征点位置处在临界值附近的样本进行训练时会产生较大的损失,使得网络将注意力过于集中在这些模糊样本上,降低了网络的整体检测性能。针对此情况,提出从软标签、损失函数和权重优化3个方面对基于特征点的Anchor Free目标检测算法进行改进,通过充分利用Center Ness参数来缓解模糊样本对网络性能的影响,提高目标检测的准确率。为证明所提方法的有效性,分别在经典的Pascal VOC数据集和MS COCO数据集上使用FCOS目标检测器进行对比实验,最终将检测器在Pascal VOC数据集上的mAP提升至82.16%(提升约1.31%),在MS COCO数据集上的AP50-95提升至35.8%(提升约1.3%)。
    参考文献 | 相关文章 | 多维度评价
    8. 基于双目叠加仿生的微换衣行人再识别
    陈坤峰, 潘志松, 王家宝, 施蕾, 张锦
    计算机科学    2022, 49 (8): 165-171.   DOI: 10.11896/jsjkx.210600140
    摘要209)      PDF(pc) (2233KB)(443)    收藏
    微换衣行人再识别是以换衣幅度不大的情况为前提,从不同摄像头场景中查找某特定身份的行人的一项计算机视觉技术。现有行人再识别方法的实现通常是基于行人衣着不变的假设,因此它们依赖的是与衣着相关的特征。那么,当此假设不成立时,这些方法就难以实现理想的识别效果。考虑到行人换衣幅度不大时行人体态基本不发生改变这一重要特点,针对微换衣行人再识别展开研究。受生物视觉系统中双目叠加效应的启发,采取仿生思想提出一个自注意力孪生网络,类比生物双眼获取信息的过程。首先,该网络以同一行人不同衣着的两类图像作为双分支输入,并利用孪生架构实现叠加效应。随后对输出的多个特征进行对比学习和融合学习,进而得到具有身份辨别力的行人特征表示。最后,在微换衣行人再识别相关数据集上进行了充分实验,结果表明该方法可达到当前最好的识别性能。
    参考文献 | 相关文章 | 多维度评价
    9. 基于非局部注意力生成对抗网络的视频异常事件检测方法
    孙奇, 吉根林, 张杰
    计算机科学    2022, 49 (8): 172-177.   DOI: 10.11896/jsjkx.210600061
    摘要314)      PDF(pc) (2305KB)(549)    收藏
    针对异常事件的不确定性,文中选择使用未来帧预测的方式对视频进行异常事件检测。通过正常样本对预测模型进行训练,使模型能够准确预测不包含异常事件的未来帧,但对于包含未知事件的视频帧,模型无法进行预测,利用生成对抗网络以及表观约束和运动约束对用于预测的生成器模型进行训练。为了减少相关目标特征丢失,提出了非局部注意力U型网络生成器(Nonlocal Attention Unet Generator,NA-UnetG)模型,提升了生成器的预测精度,同时提升了视频异常事件检测的准确度。通过公开数据集CUHK Avenue和UCSD Ped2对所提方法进行实验验证,实验结果表明,所提方法的AUC指标优于其他方法,AUC分别达到了83.4%和96.3%。
    参考文献 | 相关文章 | 多维度评价
    10. 高分辨率斜视聚束SAR回波仿真加速算法研究
    郭拯危, 付泽文, 李宁, 白澜
    计算机科学    2022, 49 (8): 178-183.   DOI: 10.11896/jsjkx.210600066
    摘要242)      PDF(pc) (3290KB)(370)    收藏
    回波仿真是合成孔径雷达系统开发的前端工作,具有重要意义。针对高分辨率斜视聚束SAR,一般采用时域回波仿真的方法,但是其仿真效率过慢。为了高效实现高分辨率斜视聚束SAR的回波仿真,提出了一种有效的加速算法。结合斜视聚束SAR时域回波模型及其信号特性,对回波仿真过程中存在的距离徙动进行补偿,以减少冗余计算量并节省内存空间;采用数据自适应分块的方法,在图形处理器中分别计算分块后的子数据,利用GPU强大的计算能力进行加速;将子数据块进行传输,在内存中拼接。该算法提高了时域回波仿真的计算效率,解决了数据量大、GPU显存有限且显存与内存之间数据传输速度较慢的问题。点目标和面目标仿真的实验结果表明,该算法的加速比达到了219.8,验证了所提方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    11. 多检测器融合的深度相关滤波视频多目标跟踪算法
    沈祥培, 丁彦蕊
    计算机科学    2022, 49 (8): 184-190.   DOI: 10.11896/jsjkx.210600004
    摘要391)      PDF(pc) (3630KB)(421)    收藏
    在检测跟踪任务中,检测器存在误检和漏检目标的问题,导致依赖检测信息的视频多目标跟踪算法出现大量误跟和漏跟目标,这种漏跟和误跟会持续几十帧,降低了跟踪精度,为此提出了一种多检测器融合的深度相关滤波视频多目标跟踪算法。该算法融合多个检测器的信息,提出了一种新型融合机制,减少单个检测器的不足带来的漏检、误检数目,打破了单个检测器性能的局限性,使新生目标的获取更加可靠。此外,采用深度相关滤波算法ECO对目标进行逐个跟踪,并在原有ECO算法的基础上提出了一系列的改进方法,从而更贴合视频多目标跟踪任务,减少目标的漏跟数和身份标签跳变数。在MOT17数据集上进行实验,结果表明,与传统的视频多目标跟踪方法IOU17相比,所提算法的MOTA值从47.6提高至50.3,证明了所提方法在多目标跟踪研究上取得了很大的突破。
    参考文献 | 相关文章 | 多维度评价
    12. 基于感知损失的遥感图像全色锐化反馈网络
    王乐, 杨晓敏
    计算机科学    2021, 48 (8): 91-98.   DOI: 10.11896/jsjkx.200700112
    摘要321)      PDF(pc) (2909KB)(848)    收藏
    全色锐化旨在通过一个高分辨率的单通道全色图像(Panchromatic,PAN)锐化一个低分辨率的多通道多光谱图像(Multispectral,MS),得到一个高分辨率的多通道多光谱图像(High Resolution Multispectral,HRMS),这是遥感图像处理中的重要任务。文中提出了一个基于感知损失的反馈网络,首先对PAN图像和MS图像分别提取细节信息和光谱信息,然后将其合并后利用堆叠的上下采样层和密集连接进行信息融合,利用反馈连接使高层次的信息丰富低层次的信息,最后重建HRMS图像。与传统全色锐化算法相比,所提算法将PAN图像和HRMS图像一起作为网络输出的监督,通过求取PAN图像和网络重建HRMS图像的感知损失使输出图像含有更丰富的空间细节信息。无论是在客观指标还是视觉感受方面,与现有广泛使用的算法相比,所提算法都有更好的效果。
    参考文献 | 相关文章 | 多维度评价
    13. 基于随机森林的空域-频域联合特征全参考彩色图像质量评价方法
    杨小琴, 刘国军, 郭建慧, 马文涛
    计算机科学    2021, 48 (8): 99-105.   DOI: 10.11896/jsjkx.200700106
    摘要330)      PDF(pc) (2679KB)(600)    收藏
    文中旨在设计一种可以自动评估图像质量,并达到与人类视觉系统相一致的客观评价算法。针对大多数传统的全参考图像质量评价方法只在空域中分析图像,并且在池策略上存在不足,文中提出了一种基于随机森林的空域-频域联合特征全参考彩色图像质量评价方法。该方法首先在空域上提取色度和梯度特征,刻画图像的颜色信息和空间结构信息;在频域上提取log-Gabor滤波器组响应后的纹理细节信息以及空间频率特征,将二者作为联合特征;然后利用随机森林学习特征向量与主观意见得分之间的映射关系,预测客观质量得分。在TID2013,TID2008和CSIQ 3个标准数据库上的实验结果表明,所提方法的综合评价性能优于目前主流的全参考评价算法,尤其是在TID2013数据库上其皮尔逊线性相关系数值达到了0.9397。
    参考文献 | 相关文章 | 多维度评价
    14. 基于关键点检测的无锚框轻量级目标检测算法
    龚浩田, 张萌
    计算机科学    2021, 48 (8): 106-110.   DOI: 10.11896/jsjkx.200700161
    摘要454)      PDF(pc) (1891KB)(1020)    收藏
    针对基于关键点的目标检测参数量大、检测框误匹配的问题,提出一种轻量级的基于关键点检测的无锚框目标检测算法。首先将输入图片输入优化过的特征提取算法,通过级联角池化与中心池化,输出3个关键点的热力图与它们的嵌入向量;然后通过嵌入向量匹配热力图并画出检测框。文中的创新点在于将SqueezeNet中的轻量级模块firemodule适配至CenterNet,并用深度可分离卷积代替主干网的常规卷积,同时,针对CenterNet的检测框误匹配问题优化了算法输出形式与训练时的损失函数。实验结果表明,改良后的算法使得原有的CenterNet算法模型尺寸缩小为原来的1/7,同时检测精度与速度较YOLOv3,CornerNet-Lite等相同量级的算法仍有所提高。
    参考文献 | 相关文章 | 多维度评价
    15. 融合Tamura纹理特征的改进FCM脑MRI图像分割算法
    乔颖婧, 高保禄, 史瑞雪, 刘璇, 王朝辉
    计算机科学    2021, 48 (8): 111-117.   DOI: 10.11896/jsjkx.200700003
    摘要295)      PDF(pc) (3273KB)(691)    收藏
    针对FCM算法在分割脑MRI图像时存在噪声敏感性和初始聚类中心随机性的问题,提出一种融合图像Tamura纹理特征的改进FCM图像分割算法。首先提取图像的Tamura纹理特征,将其与灰度特征线性加权构成融合特征。然后使用模糊邻域关系计算像素点的密度,将其与距离关系结合自适应选取初始聚类中心。最后使用融合特征作为更新隶属度和聚类中心的特征约束。实验利用该方法与FCM,D-FCM,WKFCM方法对Brain Web脑MRI数据集中的图像进行分割,并在抗噪性、准确性和运行效率方面进行了比较。实验结果表明,所提算法能获取更优的初始聚类中心,在处理噪声和灰度不均匀图像上表现出更好的鲁棒性,能够快速有效地分割脑MRI图像。
    参考文献 | 相关文章 | 多维度评价
    16. 融合时序监督和注意力机制的脉络膜新生血管分割
    叶中玉, 吴梦麟
    计算机科学    2021, 48 (8): 118-124.   DOI: 10.11896/jsjkx.200600150
    摘要396)      PDF(pc) (2776KB)(1117)    收藏
    脉络膜新生血管(Choroidal Neovascularization,CNV)一般出现在老年性黄斑变性(Age-related macular degeneration,AMD)晚期,在光学相干断层成像(SD-OCT)中对CNV进行准确分割对AMD的诊疗具有重要意义。文中提出了一种融合时序模型与注意力机制的CNV分割网络。该方法将连续的SD-OCT图像输入分割网络,在编码器部分提取图片多尺度信息,为了更好地提取图片局部特征,又在跳跃连接部分加入注意力门;同时,为了解决分割不连续的问题,在分割网络池化后加入了时序约束网络以构建相邻帧连续性约束,并在损失函数中加入梯度约束以更好地保留病变边界;采用空间金字塔将两部分网络特征图融合以产生分割损失,提高了最终的分割精度。基于患者独立性对12名患者的200组眼睛数据进行实验,该方法的Dice系数为76.3%,overlap达到60.7%,能够在SD-OCT图像中对CNV进行可靠的分割。
    参考文献 | 相关文章 | 多维度评价
    17. 基于非凸低秩矩阵逼近和全变分正则化的高光谱图像去噪
    陶星朋, 徐宏辉, 郑建炜, 陈婉君
    计算机科学    2021, 48 (8): 125-133.   DOI: 10.11896/jsjkx.200400143
    摘要288)      PDF(pc) (4373KB)(1023)    收藏
    高光谱图像在采集过程中经常受到混合噪声的干扰,严重影响了图像后续应用的性能,因此图像去噪已成为一个极其重要的预处理过程。文中采用非凸正则项代替传统的核范数重新构造逼近问题,使稀疏正则项更贴近本质秩函数的属性,进而提出了一种将非凸代理函数、全变分正则项和l2,1范数集成于统一框架的混合噪声去除算法。所提算法旨在将退化的高光谱图像以矩阵的形式分解为低秩分量和稀疏项,并利用全变分正则化保持边缘信息,提高了高光谱图像的空间分段平滑性。最后利用非凸代理函数的特殊性质,采用一种基于增广拉格朗日乘子法的迭代算法进行变量优化求解。通过多组实验进行验证,结果表明所提算法不仅能有效地去除混合噪声,而且能较好地保持图像的结构和细节,与现有的其他高光谱去噪方法相比,其在视觉效果和定量评价结果上都明显提升。
    参考文献 | 相关文章 | 多维度评价
    18. 基于改进SIFT的无人机航拍图像快速配准研究
    胡育诚, 芮挺, 杨成松, 王东, 刘恂
    计算机科学    2021, 48 (8): 134-138.   DOI: 10.11896/jsjkx.200600140
    摘要262)      PDF(pc) (3750KB)(1031)    收藏
    为了提高无人机航拍图像配准的实时性,通过分析无人机巡航高度相对稳定及图像缺乏高频的细节信息的特点,提出了一种改进SIFT特征点检测方法,显著提高了图像的配准速度,并构建了一个用于图像拼接的航空影像数据集进行实验验证。首先分析了SIFT(Scale Invariant Feature Transform)算法关于特征点尺度不变性的理论依据及实现方法,提出了消除冗余性能的策略;然后采用减少高斯金字塔阶数与层数以及选择在每阶的第三层图像开始检测极值点,以减小差分尺度空间规模的方法;最后在数据集上进行了与现有图像配准方法的对比实验。实验结果证明,所提方法能够获得匹配稳健、鲁棒性高的特征点,匹配耗时只有经典SIFT的1/10,该方法为无人机航拍图像快速拼接提供了技术支持。
    参考文献 | 相关文章 | 多维度评价
    19. 基于通道注意递归残差网络的图像超分辨率重建
    郭琳, 李晨, 陈晨, 赵睿, 范仕霖, 徐星雨
    计算机科学    2021, 48 (8): 139-144.   DOI: 10.11896/jsjkx.200500150
    摘要337)      PDF(pc) (2691KB)(916)    收藏
    近年来,深度学习被广泛应用于图像超分辨率重建。针对基于深度学习的超分辨率重建方法存在的特征提取不充分、细节丢失和梯度消失等问题,提出一种基于通道注意的递归残差深度神经网络模型,用于单幅图像的超分辨率重建。该模型采用残差嵌套网络和跳跃连接构成一种简洁的递归残差网络结构,能够加快深层网络的收敛,同时避免网络退化和梯度问题。在特征提取部分,引入注意力机制来提升网络的判别性学习能力,以提取到更准确、有效的深层残差特征;随后结合并行映射重建网络,最终实现超分辨率重建。在数据集Set5,Set14,B100和Urban100上进行放大2倍、3倍和4倍的重建测试实验,并从客观指标和主观视觉效果上将所提方法与主流方法进行比较。实验结果显示,所提方法在全部4个测试数据集上的客观指标较对比方法均有明显提升,其中,相比插值法和SRCNN 算法,在放大2倍、3倍、4倍时所提方法的平均PSNR值分别提升了3.965dB和1.56dB、3.19dB和1.42dB、2.79dB和1.32dB。视觉效果对比也表明所提方法能更好地恢复图像细节。
    参考文献 | 相关文章 | 多维度评价
    20. 利用全局与局部帧级特征进行基于共享注意力的视频问答
    王雷全, 候文艳, 袁韶祖, 赵欣, 林瑶, 吴春雷
    计算机科学    2021, 48 (8): 145-149.   DOI: 10.11896/jsjkx.200800207
    摘要276)      PDF(pc) (2588KB)(862)    收藏
    视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。 此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获得高质量的答案。文中提出了一个通过利用局部和全局帧级别的视觉信息来进行视频问答的多共享注意力网络。具体来说,以不同帧率提取视频帧,并以此提取帧级的全局与局部视觉特征,这两种特征包含了多个帧级别特征,用于对视频时间动态建模,再以共享注意力的形式建模全局与局部视觉特征的相关性,然后结合文本问题来推断答案。在天池视频问答数据集上进行了大量的实验,验证了所提方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    21. 基于Graph Cuts多特征选择的双目图像分割方法
    金海燕, 彭晶, 周挺, 肖照林
    计算机科学    2021, 48 (8): 150-156.   DOI: 10.11896/jsjkx.200800221
    摘要260)      PDF(pc) (2739KB)(652)    收藏
    双目图像分割对后续立体目标合成与三维重建等应用至关重要。由于双目图像中包含场景深度信息,因此直接将单目图像分割方法应用于双目图像尚不能得到理想的分割结果。目前,大多数双目图像分割方法将双目图像的深度特征作为颜色特征的额外通道来使用,仅对颜色特征与深度特征做简单整合,未能充分利用图像的深度特征。文中基于多分类Graph Cuts框架,提出了一种交互式双目图像分割方法。该方法将颜色、深度和纹理等特征融合到一个图模型中,以更充分地利用不同特征信息。同时,在Graph Cuts框架中引入了特征空间邻域系统,增强了图像前景区域与背景区域内部像素点之间的关系,提高了分割目标的完整性。实验结果表明,所提方法有效提升了双目图像分割结果的精确度。
    参考文献 | 相关文章 | 多维度评价
    22. 基于深度学习SuperGlue算法的单目视觉里程计
    刘帅, 芮挺, 胡育成, 杨成松, 王东
    计算机科学    2021, 48 (8): 157-161.   DOI: 10.11896/jsjkx.200700134
    摘要394)      PDF(pc) (2794KB)(1278)    收藏
    基于特征点法的视觉里程计中,光照和视角变化会导致特征点提取不稳定,进而影响相机位姿估计精度,针对该问题,提出了一种基于深度学习SuperGlue匹配算法的单目视觉里程计建模方法。首先,通过SuperPoint检测器获取特征点,并对得到的特征点进行编码,得到包含特征点坐标和描述子的向量;然后,通过注意力GNN网络生成更具代表性的描述子,并创建M×N型得分分配矩阵,采用Sinkhorn算法求解最优得分分配矩阵,从而得到最优特征匹配;最后,根据最优特征匹配进行相机位姿恢复,采用最小化投影误差法进行相机位姿优化。实验结果表明,在无后端优化的条件下,该算法与基于ORB或SIFT算法的视觉里程计相比,不仅对视角和光线变化更鲁棒,而且其绝对轨迹误差和相对位姿误差的精度均有显著提升,进一步验证了基于深度学习的SuperGlue匹配算法在视觉SLAM中的可行性和优越性。
    参考文献 | 相关文章 | 多维度评价
    23. 基于U-Net特征融合优化策略的遥感影像语义分割方法
    王施云, 杨帆
    计算机科学    2021, 48 (8): 162-168.   DOI: 10.11896/jsjkx.200700182
    摘要458)      PDF(pc) (2839KB)(786)    收藏
    高分辨率遥感影像的空间分辨率高、地物信息丰富、复杂程度高、各类地物的大小尺寸不一,这为分割精度的提高带来了一定的难度。为提高遥感影像语义分割精度,解决U-Net模型在结合深层语义信息与浅层位置信息时受限的问题,文中提出了一种基于U-Net特征融合优化策略的遥感影像语义分割方法。该方法采用基于U-Net模型的编码器-译码器结构,在特征提取部分沿用U-Net模型的编码器结构,提取多个层级的特征信息;在特征融合部分保留U-Net的跳跃连接结构,同时使用提出的特征融合优化策略,实现了高层语义特征与底层位置特征的融合-优化-再融合。此外特征融合优化策略还使用空洞卷积获取了更多的全局特征,并采用Sub-Pixel卷积层代替传统转置卷积,实现了自适应上采样。所提方法在ISPRS的Potsdam数据集和Vaihingen数据集上得到了验证,其总体分割精度、Kappa系数和平均交并比mIoU 3个评价指标在Potsdam数据集上分别为86.2%,0.82,0.77,在Vaihingen数据集上分别为84.5%,0.79,0.69;相比传统的U-Net模型,所提方法的3个评价指标在Potsdam数据集上分别提高了5.8%,8%,8%,在Vaihingen数据集上分别提高了3.5%,4%,11% 。实验结果表明,基于U-Net特征融合优化策略的遥感影像语义分割方法,在Potsdam数据集和Vaihingen数据集上都能达到很好的语义分割效果,提高了遥感影像的语义分割精度。
    参考文献 | 相关文章 | 多维度评价
    24. 基于深层卷积残差网络的航拍图建筑物精确分割方法
    许华杰, 张晨强, 苏国韶
    计算机科学    2021, 48 (8): 169-174.   DOI: 10.11896/jsjkx.200500096
    摘要282)      PDF(pc) (2818KB)(781)    收藏
    针对建筑物3D建模场景下所需的建筑物主体轮廓俯视平面图获取成本较高、航拍图建筑物的分割精度低、建筑物屋顶存在干扰物影响分割等问题,文中提出了一种将5个点的位置表示为热图作为网络额外输入通道的基于深层残差网络的航拍图建筑物精确分割方法,该方法在航拍图建筑物的精确分割任务中取得了比较好的分割效果。实验结果表明,该方法具有比传统半自动分割方法Grabcut更高的分割精度和分割效率;具有比DEXTR方法更好的鲁棒性和抗干扰性。该方法可以为建筑物3D重建任务提供高精度的建筑物俯视轮廓图和建筑物顶部图片,还可以在航拍图建筑物数据集的制作过程中,作为一种准确和有效的掩码注释工具或半自动轮廓标注工具,以提高数据集的标注效率。
    参考文献 | 相关文章 | 多维度评价
    25. 具有旋转不变性的立体轨道积木编码系统
    周佳立, 冯媛媛, 武敏, 吴超
    计算机科学    2021, 48 (8): 175-184.   DOI: 10.11896/jsjkx.200400064
    摘要187)      PDF(pc) (3432KB)(543)    收藏
    因编码问题的目的和对象不同,需要针对问题调整编码方法。针对轨道积木的编码问题,文中提出了轨道积木的二维函数表示方法,并利用相位相关对积木进行识别。 首先,将三维轨道积木在二维极坐标系下展开,将轨道积木表示成二维离散函数,由于积木具有旋转不变性,同一积木的表示结果并不唯一,因此引入参数矩阵,以指定积木的标准型。 其次,采用相位相关算法判断两个积木的相似度。 最后,在二维离散函数表示的基础上,根据积木所包含的基础轨道和相对位置,对积木进行压缩编码。 实例表明,该方法能很好地支持内部空间结构的表示,并具有旋转不变性,相比传统的编码方法其更具延拓性。 这种编码问题和匹配问题的解决方案对于积木自主搭建及搭建优化问题具有更好的适应性。
    参考文献 | 相关文章 | 多维度评价
    26. 基于多判别器的多波段图像自监督融合方法
    田嵩旺, 蔺素珍, 杨博
    计算机科学    2021, 48 (8): 185-190.   DOI: 10.11896/jsjkx.200600132
    摘要332)      PDF(pc) (3955KB)(591)    收藏
    针对多波段图像融合领域利用深度学习方法进行融合时过度依赖标签图像导致融合结果受限的问题,文中提出了一种基于多判别器生成对抗网络的多波段图像自监督融合方法。首先,设计并构建反馈密集网络作为特征增强模块,分别提取多波段图像特征并进行特征增强;其次,将多波段图像特征增强结果合并连接,并通过设计的特征融合模块重构融合图像;最后,将初步融合结果与各波段源图像分别输入判别网络,通过多个判别器的分类任务来不断优化生成器,使生成器在输出最终结果的同时保留多个波段图像的特征,以达到图像融合的目的。实验结果表明,与当前代表性的融合方法相比,所提方法具有更好的清晰度和更多信息量,细节信息更丰富,更符合人眼的视觉特性。
    参考文献 | 相关文章 | 多维度评价
    27. 基于模糊颜色特征和模糊相似度的图像检索方法
    王春静, 刘丽, 谭艳艳, 张化祥
    计算机科学    2021, 48 (8): 191-199.   DOI: 10.11896/jsjkx.200800202
    摘要278)      PDF(pc) (3894KB)(607)    收藏
    基于内容的图像检索系统的性能主要依赖于两个关键技术:图像特征提取和图像特征匹配。文中提取了所有图像的颜色特征,并在颜色特征提取过程中采用了适当的模糊算法以得到图像的模糊颜色特征。图像特征匹配主要取决于两个图像特征向量之间的相似度,文中提出了一种新的模糊相似度衡量方法,该方法利用给定的查询图像与其k幅近邻图像之间的相似度构成查询图像的k维模糊特征向量,利用每幅被检索图像与查询图像的k幅近邻图像之间的相似度构成每幅被检索图像的k维模糊特征向量,计算查询图像的k维模糊特征向量与每幅被检索图像的k维模糊特征向量之间的模糊相似度,并将检索到的图像按照模糊相似度按从大到小的顺序反馈给用户。为了验证提出的模糊颜色特征的有效性,文中在WANG数据集上进行了一系列的实验对比;为了衡量基于不同相似度的图像检索系统的性能,文中在WANG,Corel-5k和Corel-10k数据集上分别进行了一系列的实验对比。实验结果表明,基于最大最小值的图像检索系统的性能优于基于其他3种常用相似度的图像检索系统的性能,而基于模糊相似度的图像检索系统的性能优于基于最大最小值的图像检索系统的性能。在WANG,Corel-5k和Corel-10k数据集上,基于模糊相似度的图像检索系统检索到的前20幅图像的平均查准率比基于最大最小值的图像检索系统检索到的前20幅图像的平均查准率分别高4.92%,17.11%和19.48%;基于模糊相似度的图像检索系统检索到的前100幅图像的平均查准率比基于最大最小值的图像检索系统检索到的前100幅图像的平均查准率分别高4.94%,22.61%和33.02%。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共27条记录