1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    图像处理& 多媒体技术 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于YOLO优化的轻量级目标检测网络
    许虞俊, 李晨
    计算机科学    2021, 48 (11A): 265-269.   DOI: 10.11896/jsjkx.201000152
    摘要432)      PDF(pc) (2226KB)(964)    收藏
    目标检测是计算机视觉领域中一个相当活跃的研究领域,通过设计大型的深度卷积神经网络来提高目标检测的精度是一种十分有效的方法,然而目前在内存受限的应用场景中并不支持部署大型目标检测网。针对以上问题,文中提出了一种基于You Only Look Once(YOLO)系列单镜头目标检测网络设计原则的轻量级目标检测网,融合了GhostNet中的Ghost Module模块,并参考了MobileNet-v3中的通道注意力模块SE(Squeeze-and-Excitation),在卷积块中加入更优的ECA(Efficient Channel Attention)模块可以更好地利用可用的网络容量,使得网络在减少体系结构和计算的复杂度以及提升模型性能之间实现强的平衡;并且采用了Distance-IoU loss来解决检测框定位不准的问题,有效地提升了网络的收敛速度。最终模型的参数数量被压缩到了1.54 MB,小于YOLO Nano(即4.0MB),并且在VOC2007测试集上的mAP达到了72.1%,高于现有的YOLO Nano(即69.1%)。
    参考文献 | 相关文章 | 多维度评价
    2. 基于LSTM神经网络的声纹识别
    刘晓璇, 季怡, 刘纯平
    计算机科学    2021, 48 (11A): 270-274.   DOI: 10.11896/jsjkx.210400041
    摘要657)      PDF(pc) (2406KB)(1092)    收藏
    声纹识别利用说话人生物特征的个体差异性,通过声音来识别说话人的身份。声纹具有非接触、易采集、特征稳定等特点,应用领域十分广泛。现有的统计模型方法具有提取特征单一、泛化能力不强等局限性。近年来,随着人工智能深度学习的快速发展,神经网络模型在声纹识别领域崭露头角。文中提出基于长短时记忆(Long Short-Term Memory,LSTM)神经网络的声纹识别方法,使用语谱图提取声纹特征作为模型输入,从而实现文本无关的声纹识别。语谱图能够综合表征语音信号在时间方向上的频率和能量信息,表达的声纹特征更加丰富。LSTM神经网络擅长捕捉时序特征,着重考虑了时间维度上的信息,相比其他神经网络模型,更契合语音数据的特点。文中将LSTM神经网络长期学习的优势与声纹语谱图的时序特征有效结合,实验结果表明,在THCHS-30语音数据集上取得了84.31%的识别正确率。在自然环境下,对于3 s的短语音,该方法的识别正确率达96.67%,与现有的高斯混合模型和卷积神经网络方法相比,所提方法的识别性能更优。
    参考文献 | 相关文章 | 多维度评价
    3. 基于图卷积神经网络的完全图人脸聚类
    王文博, 罗恒利
    计算机科学    2021, 48 (11A): 275-277.   DOI: 10.11896/jsjkx.201200102
    摘要197)      PDF(pc) (1708KB)(602)    收藏
    人脸聚类是根据不同身份对人脸图像进行分组的方法,主要用于人脸标注和图像管理等领域。针对现有方法中存在大量冗余数据的问题,文中使用一种基于完全图约束和上下文关系进行链接预测的方法。该聚类算法基于图卷积神经网络进行链接预测,结合完全图约束筛选数据,同时在预测的过程中对链接关系进行不断的更新。实验结果显示,结合完全图约束的人脸聚类方法能够在减少冗余数据、加快运行速度的同时,提升聚类的准确率,从而提高聚类的整体效果。
    参考文献 | 相关文章 | 多维度评价
    4. 基于U-net++网络的弱光图像增强方法
    李华基, 程江华, 刘通, 程榜, 赵康成
    计算机科学    2021, 48 (11A): 278-282.   DOI: 10.11896/jsjkx.210300111
    摘要355)      PDF(pc) (3715KB)(810)    收藏
    弱光图像增强是计算机视觉中最具挑战性的任务之一,现有算法存在亮度不均、对比度低、颜色失真和噪声严重等问题。文中提出了一种基于改进U-net++网络实现更为自然的暗光增强网络框架。首先,输入弱光图像至改进U-net++网络,利用各层密集连接以增强不同层次图像特征的关联性;其次,把各层次图像特征融合后输入卷积网络层进行细节重建。实验结果证明,该方法在提高图像亮度的同时,更好地恢复了弱光图像的细节特征,并且生成正常光图像的颜色特征更接近自然。在PASCAL VOC测试集上的测试结果显示结构相似度(SSIM)和峰值信噪比(PSNR)两个重要指标分别为0.87和26.36,比同类最优算法分别高出18.6%和11.4%。
    参考文献 | 相关文章 | 多维度评价
    5. 基于手机传感器轨迹的路面地物检测方法
    焦东来, 王浩翔, 吕海洋, 徐轲
    计算机科学    2021, 48 (11A): 283-289.   DOI: 10.11896/jsjkx.210200145
    摘要174)      PDF(pc) (5354KB)(660)    收藏
    针对传统路面地物信息采集方法存在的数据采集周期长、成本高等问题,提出了一种基于手机传感器轨迹的城市路面地物检测方法。利用手机记录车辆行驶过程中各传感器数据的变化,分析经过姿态校正后的加速度数据,研究加速度变化与路况之间的联系,构建BP神经网络模型,并使用已采集数据对模型进行训练,以识别路面地物。实验结果表明,基于手机传感器轨迹的路面地物检测方法具有快速准确地检测路面地物信息的能力,且地物检测准确率大于85%,能够较为准确地检测路面地物,文中基于手机姿态传感器对手机加速度传感器姿态进行了实时矫正,利用手机垂直于路面的加速度变化检测路面地物,因此所提方法具有手机加速度传感器姿态无关性,此外,所提方法对硬件设备要求低、数据采集效率高,降低了路面地物信息采集的成本,具有广泛的应用前景。
    参考文献 | 相关文章 | 多维度评价
    6. 基于YOLOv3算法的山区铁路边坡落石检测方法研究
    刘林芽, 吴送英, 左志远, 曹子文
    计算机科学    2021, 48 (11A): 290-294.   DOI: 10.11896/jsjkx.201200113
    摘要240)      PDF(pc) (3881KB)(1247)    收藏
    铁路沿线地段边坡落石检测对保障铁路沿线通车安全具有重要的现实意义。现有的检测方法存在检测成本高、操作复杂等缺点,针对以上问题,文中提出使用智能手机及民用相机结合补光器在实地多山地区采集多尺寸、多形状的各类岩石样本,利用深度卷积网络进行学习,提取落石样本相应特征进行训练,引入YOLOv3算法,构建山区铁路边坡落石检测深度学习模型,从而实现对山区铁路沿线地段边坡落石的实时检测,此外设置Faster RCNN算法作为平行对比实验。实验结果表明,两种检测算法都能达到较高的检测精度,YOLOv3算法较Faster RCNN算法的检测精度相对偏低,但其对体积较小的落石目标更加敏感,更具捕捉性,且检测速度更快,更能满足实际工程的需要。
    参考文献 | 相关文章 | 多维度评价
    7. 基于超分辨率重建的低质量视频人脸识别方法
    陆要要, 袁家斌, 何珊, 王天星
    计算机科学    2021, 48 (11A): 295-302.   DOI: 10.11896/jsjkx.201200159
    摘要205)      PDF(pc) (2420KB)(771)    收藏
    随着深度神经网络的兴起,人脸识别技术得到了飞速发展。但在光照条件差、低分辨率等情况下的低质量视频S2V(Still to Video)人脸识别由于存在低质量测试视频与样本库高清图像的异质匹配问题,仍然没有达到预期的效果。针对这个问题,提出一种基于超分辨率重建的低质量视频人脸识别方法。首先根据人脸姿态对低质量视频帧采用聚类算法和随机算法选取关键帧,然后建立一个面向低质量视频S2V人脸识别的超分辨率重建模型S2V-SR,对关键帧进行超分辨率重建,从而获得高分辨率且更多身份特征的超分辨率关键帧,最后使用视频人脸识别网络提取深度特征进行分类投票,得到最终的人脸识别结果。所提方法在COX视频人脸数据集上进行实验测试,在相对较高质量的cam1和cam3视频中获得了最好的识别准确率,即55.91%和70.85%,而在相对较低质量的cam2视频中获得了仅次于最好方法的识别准确率。实验结果证明,所提方法能够在一定程度上解决S2V人脸识别中异质匹配的问题,并且能够获得较高的识别准确性和稳定性。
    参考文献 | 相关文章 | 多维度评价
    8. 基于鲁棒低秩张量恢复的高光谱图像去噪
    巫勇, 刘永坚, 唐瑭, 王洪林, 郑建成
    计算机科学    2021, 48 (11A): 303-307.   DOI: 10.11896/jsjkx.210200103
    摘要227)      PDF(pc) (4436KB)(709)    收藏
    去噪是高光谱图像进一步分析的重要预处理步骤,许多去噪方法都被用于高光谱图像数据立方体的去噪。然而,传统的去噪方法对异常值和非高斯噪声很敏感。文中利用底层干净HSI的张量性质数据、异常值的稀疏性质和非高斯噪声,提出一个新的基于鲁棒低秩张量修复的模型,从而在保护HSI的同时删除离散值的全局结构和不同类型的噪声(高斯噪声、脉冲噪声、死线等)。该模型可以用非精确增广拉格朗日法求解,仿真和真实高光谱图像实验的结果表明,该方法对HSI去噪是有效的。
    参考文献 | 相关文章 | 多维度评价
    9. 基于三维图像的疤痕面积计算
    姚楠, 张征
    计算机科学    2021, 48 (11A): 308-313.   DOI: 10.11896/jsjkx.201100044
    摘要606)      PDF(pc) (4038KB)(739)    收藏
    目前法医鉴定受伤疤痕面积主要采用人工的方式,其存在一定的不稳定性和时耗问题。因此,提出了基于三维图像的疤痕面积计算的法医鉴定方法。首先使用三维激光扫描仪获取待鉴定皮肤的三维图像数据;其次对数据进行预处理,除去背景环境部分以及噪点,同时通过下采样调整点云分辨率;然后使用颜色区域生长方法,对伤疤进行自动区域分割,并辅以人工交互以调整目标疤痕区域;最后利用曲面重建后的目标区域来计算疤痕面积。实验结果表明,所提方法与当前法医数字化处理方法相比,误差保持在5%以内,耗时减少了20%以上。
    参考文献 | 相关文章 | 多维度评价
    10. 基于图像分割的自适应窗口双目立体匹配算法研究
    曹林, 于威威
    计算机科学    2021, 48 (11A): 314-318.   DOI: 10.11896/jsjkx.201200264
    摘要229)      PDF(pc) (3756KB)(594)    收藏
    针对传统双目立体匹配算法采用固定窗口导致弱纹理区域匹配精度较低的问题,提出了一种基于图像分割的自适应窗口立体匹配算法。首先,采用Mean-shift算法对图像进行分割,之后对分割图像进行局部子区灰度标准差统计,在此基础上提出了一种根据纹理丰富程度进行窗口大小自适应设定的算子。基于自适应窗口大小设定,组合使用Census变换和梯度值计算匹配代价,并分别通过自适应权重代价聚合及“胜者为王”策略进行初始视差计算,最后利用左右视差一致性原则和加权中值滤波得到稠密视差图。采用提出的自适应窗口匹配算法与固定窗口匹配算法对Middlebury数据集上的标准图片进行匹配实验,实验结果表明,所提算法的平均匹配错误率为2.04%,相比对比算法,所提方法的匹配错误率分别降低了4.5%和7.9%。
    参考文献 | 相关文章 | 多维度评价
    11. 基于LSTM神经网络的声发射信号识别研究
    周俊, 尹悦, 夏斌
    计算机科学    2021, 48 (11A): 319-326.   DOI: 10.11896/jsjkx.210700034
    摘要217)      PDF(pc) (4587KB)(898)    收藏
    声发射检测不需要进入被检对象中进行检测,与其他无损检测技术相比具有实时性、整体性和高灵敏度等独特优势。早期参数分析、小波分析等方法在声发射信号特征提取上缺乏理论指导,具有一定主观性,BP神经网络应用于声发射信号识别中时网络训练容易陷入局部极值,LSTM神经网络可以对输入序列数据进行逐层学习并自适应提取特征,避免了特征的人工选择和提取,较好地解决了存在的问题。文中提出一种基于LSTM的声发射信号识别模型,在声发射信号z-score标准化基础上,对比不同学习算法、隐层神经元数、正则化dropout rate下的测试集正确识别率,优化声发射信号识别模型,与BP神经网络的声发射信号识别准确率进行对比,实验结果表明,LSTM神经网络在Adam算法中,当隐层神经元数为250,dropout rate为0.5时,声发射信号识别率最高且为76.51%,优于BP神经网络53.9%的最高识别率。
    参考文献 | 相关文章 | 多维度评价
    12. 基于光源区域自适应的夜间去雾方法
    王同森, 史勤忠, 王得法, 董硕, 杨国为, 于腾
    计算机科学    2021, 48 (11A): 327-333.   DOI: 10.11896/jsjkx.210300072
    摘要396)      PDF(pc) (4975KB)(687)    收藏
    夜间有雾图像会导致图像质量下降,主要体现在夜间有雾图像光照不均、对比度较低且色偏严重,而人工光源的存在更是使得环境光呈现出不均匀性。现有的主流算法主要是针对白天图像进行处理,并不适用于夜间场景去雾处理,导致夜间去雾难度加大。针对上述问题,通过深入分析夜间有雾图像的成像特点,提出了一种新的夜间图像去雾算法。针对夜间有雾图像的色偏问题,提出了改进的暗通道先验算法(MRP)进行颜色校正,该方法单独操作每一个颜色通道进行颜色校正,从而可以减少由MRP引起的光源区域周围的光晕效应;针对夜间场景环境光不均匀性的特点,提出了基于有雾图像低频分量的最小-最大值滤波方法,以此来实现局部环境光的估计;针对最大反射率先验(DCP)估计透射率在光源处失效的问题,提出了一种基于光源区域自适应的透射率估计算法。实验结果表明,该算法在抑制光晕和光源区域发散的同时,能够较好地重现暗部细节,恢复图像具有较好的亮度和对比度,且色彩自然。相比暗通道先验,所提方法的峰值信噪比(PSNR)与结构相似性值(SSIM)平均提升了81.8%和26.5%。
    参考文献 | 相关文章 | 多维度评价
    13. SCTD1.0:声呐常见目标检测数据集
    周彦, 陈少昌, 吴可, 宁明强, 陈宏昆, 张鹏
    计算机科学    2021, 48 (11A): 334-339.   DOI: 10.11896/jsjkx.210100138
    摘要1547)      PDF(pc) (4260KB)(1574)    收藏
    近年来,卷积神经网络(CNN)在大规模自然图像数据集(如ImageNet,COCO)中获得了广泛应用,但在声呐图像检测识别领域的应用研究较缺乏,其存在声呐图像目标检测和分类数据集缺乏且水下目标样本往往面临样本稀少、不平衡等问题。针对这一问题,在进行广泛收集声呐图像的基础上,构建了一个完全公开的、可以用于开展声呐图像检测和分类研究的声呐常见目标检测数据集SCTD1.0,该数据集目前已包含水下沉船、失事飞机残骸、遇难者3类典型目标,共计596个样本。在SCTD1.0的基础上,文中采用迁移学习的方式测试了检测和分类的基准,具体来说:针对检测任务,使用特征金字塔网络对多尺度特征进行组合利用,比较了YOLOv3,Faster R-CNN,Cascade R-CNN这3种检测框架在本数据集上的性能表现;针对分类任务,对比了VGGNet,ResNet50,DenseNet 3种网络的分类性能,分类准确率达到了90%左右。
    参考文献 | 相关文章 | 多维度评价
    14. 基于质心法的车联网目标跟踪方法与应用
    叶阳, 卢奇, 程时伟
    计算机科学    2021, 48 (11A): 340-344.   DOI: 10.11896/jsjkx.210200004
    摘要377)      PDF(pc) (2693KB)(627)    收藏
    车辆目标跟踪是实现车联网不可或缺的一环,旨在获取车辆的动态信息,以提高交通运行效率。其核心是对大量监控探头采集的视频图像进行分析处理,实现车辆的实时检测与跟踪。为了进一步提高目标检测效率,降低硬件成本,文中提出了基于二帧差分法的前景检测方法,以及基于质心法的车辆轮廓检测与跟踪方法。基于OpenCV3.4.1和VS2017进行验证实验和仿真测试,结果表明,该算法对车辆跟踪的精确率达到89.1%,平均处理耗时42.63 ms,具有较好的实时性和鲁棒性,可在车联网嵌入式设备上进行部署和应用。
    参考文献 | 相关文章 | 多维度评价
    15. 基于LeNet-5卷积神经网络和颜色特征的限速标志识别
    王济民, 魏怡, 周宇, 孙傲, 刘源升
    计算机科学    2021, 48 (11A): 345-350.   DOI: 10.11896/jsjkx.201200213
    摘要340)      PDF(pc) (4992KB)(738)    收藏
    限速标志识别是智能驾驶的重要组成部分,文中分析了现有方法存在的问题,为了提高神经网络在中国限速标志上的泛用性和准确率,针对限速标志的检测部分,提出了一种基于颜色空间的新型筛选方法;针对限速标志的识别部分,在现有LeNet-5架构的基础上对神经网络进行了改进,并将德国交通标志数据集(GTSRB)和清华交通标志数据集(TT100K)中限速标志数据融合,经过数据扩增后制作成新的数据集送入神经网络来训练模型。通过多次超参数优化,采用swish激活函数,在测试集上得到的最优识别准确率为99.62%,且模型抗干扰能力强,具有较强的实用性能。
    参考文献 | 相关文章 | 多维度评价
    16. 基于局部加权表示的线性回归分类器及人脸识别
    杨章静, 王文博, 黄璞, 张凡龙, 王昕
    计算机科学    2021, 48 (11A): 351-359.   DOI: 10.11896/jsjkx.210100173
    摘要189)      PDF(pc) (5142KB)(517)    收藏
    线性回归分类器(Linear Regression Classifier,LRC)是一种有效的图像分类算法,然而LRC未关注数据的局部结构信息,忽略了类内样本之间的差异性,因此当人脸图像存在表情、光照、角度、遮挡等变化时分类性能不佳。针对此问题,文中提出了一种基于局部加权表示的线性回归分类器(Local WeightedRepresentation based Linear Regression Classifier,LWR-LRC)。LWR-LRC首先以测试样本与所有样本的相似性为度量,构建每类样本的加权代表样本;然后将测试样本分解为加权代表样本的线性组合;最后将测试样本分类到重构系数最大的类别。LWR-LRC考虑了样本的局部结构,构建了每类样本的最优代表样本,使用代表样本进行计算,在提高鲁棒性同时,大幅缩短了计算时间。在AR,CMU PIE,FERET和GT数据集上的实验的结果表明,LWR-LRC与NNC,SRC,LRC,CRC,MRC,LMRC等算法相比,在性能上有很强的优越性。
    参考文献 | 相关文章 | 多维度评价
    17. 多尺度U网络实现番茄叶部病斑分割与识别
    顾兴健, 朱剑峰, 任守纲, 熊迎军, 徐焕良
    计算机科学    2021, 48 (11A): 360-366.   DOI: 10.11896/jsjkx.201000166
    摘要184)      PDF(pc) (2998KB)(712)    收藏
    随着深度学习技术的迅速发展,卷积神经网络成为研究植物叶部病害识别与病斑分割的主流方法。针对番茄叶部病斑大小不一、形状不规则、病斑分割需要大量像素级标记等问题,文中提出一种多尺度U网络,以同时实现番茄叶部病斑分割与病害识别。在病害特征提取阶段采用多尺度残差模块组合不同尺寸的感受野来提取病害特征,以适应病斑大小和形状的动态变化。引入CB模块(Classifier and Bridge)将病害特征提取阶段与病斑分割阶段连接,对病害特征进行分类,并根据分类结果反向映射出特定类的激活图,此激活图包含特定类别病斑的关键信息。在分割阶段采用上采样与卷积相结合的方法对特定类的激活图进行反卷积,利用跳跃连接方式将反卷积特征与低层特征融合,以补充更多的图像细节信息,获取病斑分割的灰度图。为了使分割的病斑定位更加精确,利用少量像素级标记,对每个像素点采用二分类交叉熵损失函数进行监督训练,同时更好地引导特征提取网络关注病斑部位。利用原始测试集与模拟噪声和光照强度的干扰测试集分别验证模型的病斑分割与病害分类性能。在原始测试样本集上多尺度U网络的平均像素准确率、平均交并比和频权交并比分别达到了86.15%,75.25%和90.27%;在降低30%亮度和添加椒盐噪声的干扰测试集上,模型的识别准确率分别为95.10%和99.20%。实验结果表明,所提方法可以实现番茄叶部病斑分割与识别效果的共同提升。
    参考文献 | 相关文章 | 多维度评价
    18. 基于弱监督的深度学习胸部X光疾病诊断与定位方法
    康明
    计算机科学    2021, 48 (11A): 367-369.   DOI: 10.11896/jsjkx.201200152
    摘要316)      PDF(pc) (1791KB)(609)    收藏
    胸部疾病是最常见的疾病之一,胸部X光是检查和诊断胸部疾病的重要方法。构建一个高度准确的胸部诊断预测模型通常需要大量的标签和异常位置的手工标注。然而,获取这种带标注的数据是很困难的,特别是带有位置标注的数据。因此,构建一个仅只使用少量位置标注就能正常工作的方法成为当前面临的主要问题。虽然目前已经有一些弱监督方法来解决这个问题,但是它们大多只关注于图像信息,很少考虑到图像间的关系信息。因此,提出一种基于弱监督深度学习的胸部X光疾病诊断与定位模型,在运用深度学习方法提取图像信息的同时,引入了图结构,运用哈希编码衡量图像本身的相似度,并将图像的相关信息也加入到学习过程中,在不需要额外标注的情况下,能够通过少量的标注达到很好的识别和定位效果。经过在Chest X-ray数据集上验证,在仅使用3%带位置标签的数据的情况下,定位准确率(IoU)达到44%。这表明,该方法能够有效识别和定位胸部X光病灶,为医生提供用于筛查的候选区域,辅助医生进行胸部疾病的诊断。
    参考文献 | 相关文章 | 多维度评价
    19. 基于YOLOv3与分层数据关联的多目标跟踪算法
    刘彦, 秦品乐, 曾建朝
    计算机科学    2021, 48 (11A): 370-375.   DOI: 10.11896/jsjkx.201000115
    摘要187)      PDF(pc) (2632KB)(644)    收藏
    为了缓解多目标跟踪算法中实时性的问题以及在跟踪过程中目标由于外观相似度太高和误检数量过多而造成的跟踪困难问题,提出了一种多目标跟踪算法,该算法基于改进YOLOv3与分层数据关联。由于轻量级网络MobileNet使用了深度可分离卷积对原有网络进行压缩,达到了减少网络参数的目的,因此文中在保留YOLOv3网络多尺度预测部分的情况下,利用MobileNet替换YOLOv3网络的主体结构,实现降低网络的复杂度,使算法达到实时的要求。与其他多目标跟踪算法中使用的检测网络相比,该算法提出的检测网络模型的大小为91 M,而单张检测时间可以达到3.12 s。同时,该算法引入基于目标外观特征和运动特征的分层数据关联方法。与仅使用外观特征进行关联的方法相比,分层数据关联方法使得算法的评价指标MOTA提升6.5%,MOTP提升1.7%。在MOT16数据集上跟踪精度可以达到77.2%,同时具备良好的抗干扰能力与实时性。
    参考文献 | 相关文章 | 多维度评价
    20. 基于U-Net优化的SAR遥感图像语义分割
    王鑫, 张昊宇, 凌诚
    计算机科学    2021, 48 (11A): 376-381.   DOI: 10.11896/jsjkx.210300260
    摘要460)      PDF(pc) (2840KB)(995)    收藏
    多光谱图像的分割是遥感图像解译的重要基础环节,SAR遥感图像中包含着复杂的地物目标信息,传统的分割方法存在耗时长、效率低等问题,导致传统图像分割方法的应用受限。近年来,深度学习算法在计算机视觉方向的应用取得了较好的成果,针对多光谱遥感影像语义分割问题,使用深度学习的语义分割方法来实现遥感影像的高性能分割,在U-Net网络结构上添加激活层、Dropout层、卷积层,提出一种基于U-Net优化的深度卷积神经网络,在少量数据集的基础上实现了对以SAR图像合成的多光谱影像中耕地、建筑、河流的快速检测,整体分割准确率达94.6%。与U-Net,SegNet的对照实验结果表明,所提方法的分割准确率相比U-Net,SegNet整体较优,相比U-Net和SegNet分别提升了2.5%与5.8%。
    参考文献 | 相关文章 | 多维度评价
    21. 基于改进DeeplabV3+的地物分类方法研究
    朱戎, 叶宽, 杨博, 谢欢, 赵蕾
    计算机科学    2021, 48 (11A): 382-385.   DOI: 10.11896/jsjkx.201100184
    摘要470)      PDF(pc) (2451KB)(736)    收藏
    原始DeeplabV3+算法对无人机航拍图像中的地物边缘分割不够准确,对道路的分割存在不连续的情况。因此,针对这些问题,文中对DeeplabV3+算法进行了改进。首先,在编码阶段进行特征融合,增强浅层特征图的语义信息;其次,在分割网络结构中添加边界提取分支模块,并采用Canny边缘检测算法提取真实的边界信息进行监督训练,使网络对地物边缘的分割更为精细;最后,在网络的解码阶段,融合更多的浅层特征。实验结果表明,所提方法的mIoU值为80.92%,比DeeplabV3+算法提升了6.35%,能够有效进行地物分类。
    参考文献 | 相关文章 | 多维度评价
    22. 基于光照叠加的颜色恒常计算方法
    冯一凡, 赵雪青, 师昕, 杨坤
    计算机科学    2021, 48 (11A): 386-390.   DOI: 10.11896/jsjkx.210200053
    摘要211)      PDF(pc) (3008KB)(693)    收藏
    颜色恒常性是人类视觉系统对外界视觉刺激中色彩感知的一种心理倾向,人类视觉的这种认知功能能够自适应地忽略外界光照变化,具有稳定的颜色感知能力。受到人类视觉系统对颜色感知的启发,针对如何有效消除外界光照对成像质量的影响,还原物理场景真实颜色并提供稳定的颜色特征这一问题,文中提出了一种基于光照叠加的颜色恒常计算方法,旨在有效消除外界光照的光谱成分变化对物体颜色的影响。首先,提出了MAX-MEAN方法对场景中的光照进行估计(简称MM估计),即通过场景中所有物体表面的平均反射和最大反射来估计场景中的光照;然后,基于MM估计提出了光照叠加的颜色恒常计算方法,得到最终的无色偏图像,并在公开的数据集SFU Gray-ball上包含11 346幅室内室外场景图像进行仿真验证。实验结果表明,文中提出的光照叠加颜色恒常计算方法能够有效地估计光照信息并实现无色偏图像的计算。
    参考文献 | 相关文章 | 多维度评价
    23. 基于流形结构神经网络的服装图像集分类方法
    程铭, 马佩, 何儒汉
    计算机科学    2021, 48 (11A): 391-395.   DOI: 10.11896/jsjkx.201200127
    摘要161)      PDF(pc) (2693KB)(735)    收藏
    随着大规模时尚数据集的公开,基于深度学习的服装图像分类得到快速发展。然而,目前服装图像分类多数是在同一件服装具有单张的、正面或接近正面的图像的场景下进行分类,这导致了当视角发生变化时常出现服装图像误分类的情况,现实中服装具有的形变大、遮挡严重等特性进一步加剧了该问题。基于上述问题,提出了一种基于流形结构神经网络的服装图像集分类方法,利用流形空间更好地表示服装的内部结构特征。该方法选用多视角度服装图像集作为实验数据集,首先通过卷积神经网络提取服装图像集的浅层特征,再通过协方差池化将欧氏数据转换为流形数据,最后通过基于流形结构的神经网络学习服装图像集的内部结构特征,获取准确的分类结果。实验结果表明,所提方法在MVC数据集上的Precision、Recall和F-1指标可达到89.64%,89.12%和88.69%,与现有的图像集(视频)分类算法相比,其分别获得了2.04%,2.65%和2.70%的提升,该方法比已有算法更加准确、高效、鲁棒。
    参考文献 | 相关文章 | 多维度评价
    24. 改进穿线法与HOG+SVM结合的数码管图像读数研究
    宋一言, 唐东林, 吴续龙, 周立, 秦北轩
    计算机科学    2021, 48 (11A): 396-399.   DOI: 10.11896/jsjkx.210100123
    摘要289)      PDF(pc) (2695KB)(551)    收藏
    针对传统投影分割方法在提取单个数码管数字图像时过于依赖图像二值化及图像倾斜校正效果的问题,采用一种基于轮廓提取和轮廓排序相结合的数码管图像分割方法,实验证明该方法相比投影分割法在对数字区域的分割成功率上提高了13.5%;针对传统穿线法对数码管数字1识别度较低和机器学习算法运行用时较长的问题,提出一种基于六段数码管特征的改进穿线法与HOG+SVM方法相结合的数码管数字识别方法,该方法对数码管数字的识别准确率比传统穿线法提高了约4.5%,且平均运行时间仅为HOG+SVM方法的1/5。实验结果证明了这种方法在进行数码管读数时的可靠性和优越性。
    参考文献 | 相关文章 | 多维度评价
    25. 基于深度信念网络的视觉人体动作识别
    洪耀球
    计算机科学    2021, 48 (11A): 400-403.   DOI: 10.11896/jsjkx.210200079
    摘要289)      PDF(pc) (2800KB)(477)    收藏
    为实现互联网上大量背景复杂、视点变化的视频中人体动作的识别,提出了一种使用无监督的深度信念网络(DBNs)进行人体动作识别的创新方法。该方法采用深度信念网络(DBNs)和受限玻耳兹曼机进行无约束视频的动作识别,利用无监督深度学习模型自动提取合适的特征表示,不需要任何先验知识。在一个具有挑战性的 UCF 体育数据集上进行实验,证明了该方法准确有效。同时该方法也适用于其他视觉识别任务,并在未来可扩展到非结构化的人体活动识别。
    参考文献 | 相关文章 | 多维度评价
    26. 基于目标轨迹空间关系的视频摘要方法
    曲智国, 谭贤四, 唐瑭, 郑建成, 费太勇
    计算机科学    2021, 48 (11A): 404-408.   DOI: 10.11896/jsjkx.210100125
    摘要308)      PDF(pc) (3738KB)(479)    收藏
    碰撞现象是视频摘要中需要避免的问题,在轨迹重排时一般通过碰撞代价函数进行约束,但是现有视频摘要方法在轨迹重排优化过程中需要重复计算轨迹间的碰撞代价,存在大量冗余运算量,为此提出了一种基于目标轨迹空间关系的视频摘要方法。该方法通过分析目标轨迹间的空间关系,可以在轨迹重排前预先判断两条轨迹是否会发生碰撞,据此定义了3种轨迹关系,并给出了碰撞代价的快速计算方法,从而较好地降低了现有视频摘要方法优化过程中的冗余计算,提高了视频摘要中轨迹重排的运算速度。实验结果验证了所提方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    27. 基于多特征融合的人脸活体检测算法
    栾晓, 李晓双
    计算机科学    2021, 48 (11A): 409-415.   DOI: 10.11896/jsjkx.210100181
    摘要261)      PDF(pc) (2282KB)(1174)    收藏
    近年来,随着人脸识别系统的不断发展,各种假冒合法用户的欺骗手段不断出现。基于单一差异线索进行的活体检测,已经不能满足当前复杂环境下提高人脸活体检测方法性能的需求。基于此,文中提出多特征融合的方法,使用卷积神经网络从人脸图像的不同线索中学习多个特征来进行活体检测,深度图在空间上能够区分真假人脸之间的深度信息;光流图在时间上能够区分真假人脸之间的动态信息;残差噪声图根据真人脸的一次成像和假冒人脸的二次成像噪声成分的不同进行区分。文中融合3种特征,不仅利用空间、时间多维度线索弥补了单一线索的不足,同时也提高了模型的泛化能力。相比现有的方法,所提方法无论是在同一个数据库还是跨数据库的情况下,均有较好的实验结果。具体而言,所提方法在CASIA数据集、REPLAY-ATTACK数据集和NUAA数据集上的错误率分别为0.11%,0.06%和0.45%。
    参考文献 | 相关文章 | 多维度评价
    28. 基于行列解耦采样的轻量车道线检测模型
    陈浩楠, 雷印杰, 王浩
    计算机科学    2021, 48 (11A): 416-419.   DOI: 10.11896/jsjkx.201100206
    摘要158)      PDF(pc) (2142KB)(593)    收藏
    随着深度学习的发展,基于深度卷积神经网络的车道线检测模型在自动驾驶系统和高级辅助驾驶系统中得到了广泛的应用。这些模型虽然有较高的精度,但通常计算量大且运行速度慢。为了解决该问题,提出了一种车道线检测任务专用的轻量神经网络模型。首先,提出了一种行列解耦采样的卷积模块,该模块利用图像中车道线区域的行列可分解性对传统的残差卷积模块进行了合理的优化。其次,利用深度可分离卷积技术进一步降低行列解耦采样卷积模块的计算量。此外,还设计了一种金字塔空洞卷积模块来增加模型的感受野。在CULane数据集上的实验的结果表明,文中提出的轻量车道线检测模型与之前最好的SCNN模型相比,浮点计算量降低了95.2%,F1分数提高了1.0%,在保持较高精度的前提下显著降低了车道线检测模型的计算量。
    参考文献 | 相关文章 | 多维度评价
    29. 利用透射率与场景深度实现带雾图像能见度检测
    张鼎, 蒋慕蓉, 黄亚群
    计算机科学    2021, 48 (11A): 420-423.   DOI: 10.11896/jsjkx.210200072
    摘要360)      PDF(pc) (2278KB)(765)    收藏
    能见度检测是计算机视觉与交通视频图像处理的热点问题。针对传统检测方法存在硬件成本高、适用范围小、检测效率低等不足,给出一种利用透射率和场景深度获取单幅图像能见度的检测方法。首先根据Koschmieder定律和ICAO推荐的对比阈值推导出能见度检测公式,然后根据大气衰减模型得到消光系数,利用暗通道先验理论获取透射率值,结合SFS(从阴影恢复形状)和双目模型获取场景深度值,最后通过求解消光系数反演图像的能见度。实验结果验证了该方法的有效性,精确度和检测效率有较大提高,且不需要相机内部参数,也不需要拍摄同一场景的多幅图像,操作简单、适用范围较广。
    参考文献 | 相关文章 | 多维度评价
    30. 超分辨率重构遥感图像分类研究
    谢海平, 李高源, 杨海涛, 赵洪利
    计算机科学    2021, 48 (11A): 424-428.   DOI: 10.11896/jsjkx.210300132
    摘要179)      PDF(pc) (2421KB)(674)    收藏
    通常情况下,超分辨率技术能够使图像获得更好的视觉质量,从而有利于图像的目视解译。然而,超分辨率技术能否提升图像在应用于分类、识别等其他更高级计算机视觉任务时的效果呢?结合计算机视觉技术的发展现状,首先训练一个具有良好性能的图像分类模型,用于对经过不同超分辨率方法处理后的图像进行分类。利用分类准确率来衡量超分辨率重构处理对图像分类任务的影响。在遥感分类数据集上的实验显示,相比插值方法,经过超分辨率处理的图像在分类模型中取得了更高的分类准确率。这一结果说明,经过良好设计的超分辨率模型不仅能使低质图像获得更好的视觉质量,在分类模型中也能够被更准确地归入所属类别。证实了经过良好设计的超分辨率模型对于图像分类任务具有促进作用,并且还能有效提升低质图像在计算机视觉中的感知效果。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共31条记录