1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    图像处理& 多媒体技术 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 基于YOLO优化的轻量级目标检测网络
    许虞俊, 李晨
    计算机科学    2021, 48 (11A): 265-269.   https://doi.org/10.11896/jsjkx.201000152
    摘要 (43)   PDF (2226KB) (205)  
    目标检测是计算机视觉领域中一个相当活跃的研究领域,通过设计大型的深度卷积神经网络来提高目标检测的精度是一种十分有效的方法,然而目前在内存受限的应用场景中并不支持部署大型目标检测网。针对以上问题,文中提出了一种基于You Only Look Once(YOLO)系列单镜头目标检测网络设计原则的轻量级目标检测网,融合了GhostNet中的Ghost Module模块,并参考了MobileNet-v3中的通道注意力模块SE(Squeeze-and-Excitation),在卷积块中加入更优的ECA(Efficient Channel Attention)模块可以更好地利用可用的网络容量,使得网络在减少体系结构和计算的复杂度以及提升模型性能之间实现强的平衡;并且采用了Distance-IoU loss来解决检测框定位不准的问题,有效地提升了网络的收敛速度。最终模型的参数数量被压缩到了1.54 MB,小于YOLO Nano(即4.0MB),并且在VOC2007测试集上的mAP达到了72.1%,高于现有的YOLO Nano(即69.1%)。
    参考文献 | 相关文章 | 多维度评价
    2. 基于LSTM神经网络的声纹识别
    刘晓璇, 季怡, 刘纯平
    计算机科学    2021, 48 (11A): 270-274.   https://doi.org/10.11896/jsjkx.210400041
    摘要 (43)   PDF (2406KB) (81)  
    声纹识别利用说话人生物特征的个体差异性,通过声音来识别说话人的身份。声纹具有非接触、易采集、特征稳定等特点,应用领域十分广泛。现有的统计模型方法具有提取特征单一、泛化能力不强等局限性。近年来,随着人工智能深度学习的快速发展,神经网络模型在声纹识别领域崭露头角。文中提出基于长短时记忆(Long Short-Term Memory,LSTM)神经网络的声纹识别方法,使用语谱图提取声纹特征作为模型输入,从而实现文本无关的声纹识别。语谱图能够综合表征语音信号在时间方向上的频率和能量信息,表达的声纹特征更加丰富。LSTM神经网络擅长捕捉时序特征,着重考虑了时间维度上的信息,相比其他神经网络模型,更契合语音数据的特点。文中将LSTM神经网络长期学习的优势与声纹语谱图的时序特征有效结合,实验结果表明,在THCHS-30语音数据集上取得了84.31%的识别正确率。在自然环境下,对于3 s的短语音,该方法的识别正确率达96.67%,与现有的高斯混合模型和卷积神经网络方法相比,所提方法的识别性能更优。
    参考文献 | 相关文章 | 多维度评价
    3. 基于图卷积神经网络的完全图人脸聚类
    王文博, 罗恒利
    计算机科学    2021, 48 (11A): 275-277.   https://doi.org/10.11896/jsjkx.201200102
    摘要 (30)   PDF (1708KB) (77)  
    人脸聚类是根据不同身份对人脸图像进行分组的方法,主要用于人脸标注和图像管理等领域。针对现有方法中存在大量冗余数据的问题,文中使用一种基于完全图约束和上下文关系进行链接预测的方法。该聚类算法基于图卷积神经网络进行链接预测,结合完全图约束筛选数据,同时在预测的过程中对链接关系进行不断的更新。实验结果显示,结合完全图约束的人脸聚类方法能够在减少冗余数据、加快运行速度的同时,提升聚类的准确率,从而提高聚类的整体效果。
    参考文献 | 相关文章 | 多维度评价
    4. 基于U-net++网络的弱光图像增强方法
    李华基, 程江华, 刘通, 程榜, 赵康成
    计算机科学    2021, 48 (11A): 278-282.   https://doi.org/10.11896/jsjkx.210300111
    摘要 (28)   PDF (3715KB) (87)  
    弱光图像增强是计算机视觉中最具挑战性的任务之一,现有算法存在亮度不均、对比度低、颜色失真和噪声严重等问题。文中提出了一种基于改进U-net++网络实现更为自然的暗光增强网络框架。首先,输入弱光图像至改进U-net++网络,利用各层密集连接以增强不同层次图像特征的关联性;其次,把各层次图像特征融合后输入卷积网络层进行细节重建。实验结果证明,该方法在提高图像亮度的同时,更好地恢复了弱光图像的细节特征,并且生成正常光图像的颜色特征更接近自然。在PASCAL VOC测试集上的测试结果显示结构相似度(SSIM)和峰值信噪比(PSNR)两个重要指标分别为0.87和26.36,比同类最优算法分别高出18.6%和11.4%。
    参考文献 | 相关文章 | 多维度评价
    5. 基于手机传感器轨迹的路面地物检测方法
    焦东来, 王浩翔, 吕海洋, 徐轲
    计算机科学    2021, 48 (11A): 283-289.   https://doi.org/10.11896/jsjkx.210200145
    摘要 (30)   PDF (5354KB) (73)  
    针对传统路面地物信息采集方法存在的数据采集周期长、成本高等问题,提出了一种基于手机传感器轨迹的城市路面地物检测方法。利用手机记录车辆行驶过程中各传感器数据的变化,分析经过姿态校正后的加速度数据,研究加速度变化与路况之间的联系,构建BP神经网络模型,并使用已采集数据对模型进行训练,以识别路面地物。实验结果表明,基于手机传感器轨迹的路面地物检测方法具有快速准确地检测路面地物信息的能力,且地物检测准确率大于85%,能够较为准确地检测路面地物,文中基于手机姿态传感器对手机加速度传感器姿态进行了实时矫正,利用手机垂直于路面的加速度变化检测路面地物,因此所提方法具有手机加速度传感器姿态无关性,此外,所提方法对硬件设备要求低、数据采集效率高,降低了路面地物信息采集的成本,具有广泛的应用前景。
    参考文献 | 相关文章 | 多维度评价
    6. 基于YOLOv3算法的山区铁路边坡落石检测方法研究
    刘林芽, 吴送英, 左志远, 曹子文
    计算机科学    2021, 48 (11A): 290-294.   https://doi.org/10.11896/jsjkx.201200113
    摘要 (28)   PDF (3881KB) (78)  
    铁路沿线地段边坡落石检测对保障铁路沿线通车安全具有重要的现实意义。现有的检测方法存在检测成本高、操作复杂等缺点,针对以上问题,文中提出使用智能手机及民用相机结合补光器在实地多山地区采集多尺寸、多形状的各类岩石样本,利用深度卷积网络进行学习,提取落石样本相应特征进行训练,引入YOLOv3算法,构建山区铁路边坡落石检测深度学习模型,从而实现对山区铁路沿线地段边坡落石的实时检测,此外设置Faster RCNN算法作为平行对比实验。实验结果表明,两种检测算法都能达到较高的检测精度,YOLOv3算法较Faster RCNN算法的检测精度相对偏低,但其对体积较小的落石目标更加敏感,更具捕捉性,且检测速度更快,更能满足实际工程的需要。
    参考文献 | 相关文章 | 多维度评价
    7. 基于超分辨率重建的低质量视频人脸识别方法
    陆要要, 袁家斌, 何珊, 王天星
    计算机科学    2021, 48 (11A): 295-302.   https://doi.org/10.11896/jsjkx.201200159
    摘要 (33)   PDF (2420KB) (70)  
    随着深度神经网络的兴起,人脸识别技术得到了飞速发展。但在光照条件差、低分辨率等情况下的低质量视频S2V(Still to Video)人脸识别由于存在低质量测试视频与样本库高清图像的异质匹配问题,仍然没有达到预期的效果。针对这个问题,提出一种基于超分辨率重建的低质量视频人脸识别方法。首先根据人脸姿态对低质量视频帧采用聚类算法和随机算法选取关键帧,然后建立一个面向低质量视频S2V人脸识别的超分辨率重建模型S2V-SR,对关键帧进行超分辨率重建,从而获得高分辨率且更多身份特征的超分辨率关键帧,最后使用视频人脸识别网络提取深度特征进行分类投票,得到最终的人脸识别结果。所提方法在COX视频人脸数据集上进行实验测试,在相对较高质量的cam1和cam3视频中获得了最好的识别准确率,即55.91%和70.85%,而在相对较低质量的cam2视频中获得了仅次于最好方法的识别准确率。实验结果证明,所提方法能够在一定程度上解决S2V人脸识别中异质匹配的问题,并且能够获得较高的识别准确性和稳定性。
    参考文献 | 相关文章 | 多维度评价
    8. 基于鲁棒低秩张量恢复的高光谱图像去噪
    巫勇, 刘永坚, 唐瑭, 王洪林, 郑建成
    计算机科学    2021, 48 (11A): 303-307.   https://doi.org/10.11896/jsjkx.210200103
    摘要 (35)   PDF (4436KB) (78)  
    去噪是高光谱图像进一步分析的重要预处理步骤,许多去噪方法都被用于高光谱图像数据立方体的去噪。然而,传统的去噪方法对异常值和非高斯噪声很敏感。文中利用底层干净HSI的张量性质数据、异常值的稀疏性质和非高斯噪声,提出一个新的基于鲁棒低秩张量修复的模型,从而在保护HSI的同时删除离散值的全局结构和不同类型的噪声(高斯噪声、脉冲噪声、死线等)。该模型可以用非精确增广拉格朗日法求解,仿真和真实高光谱图像实验的结果表明,该方法对HSI去噪是有效的。
    参考文献 | 相关文章 | 多维度评价
    9. 基于三维图像的疤痕面积计算
    姚楠, 张征
    计算机科学    2021, 48 (11A): 308-313.   https://doi.org/10.11896/jsjkx.201100044
    摘要 (86)   PDF (4038KB) (68)  
    目前法医鉴定受伤疤痕面积主要采用人工的方式,其存在一定的不稳定性和时耗问题。因此,提出了基于三维图像的疤痕面积计算的法医鉴定方法。首先使用三维激光扫描仪获取待鉴定皮肤的三维图像数据;其次对数据进行预处理,除去背景环境部分以及噪点,同时通过下采样调整点云分辨率;然后使用颜色区域生长方法,对伤疤进行自动区域分割,并辅以人工交互以调整目标疤痕区域;最后利用曲面重建后的目标区域来计算疤痕面积。实验结果表明,所提方法与当前法医数字化处理方法相比,误差保持在5%以内,耗时减少了20%以上。
    参考文献 | 相关文章 | 多维度评价
    10. 基于图像分割的自适应窗口双目立体匹配算法研究
    曹林, 于威威
    计算机科学    2021, 48 (11A): 314-318.   https://doi.org/10.11896/jsjkx.201200264
    摘要 (44)   PDF (3756KB) (95)  
    针对传统双目立体匹配算法采用固定窗口导致弱纹理区域匹配精度较低的问题,提出了一种基于图像分割的自适应窗口立体匹配算法。首先,采用Mean-shift算法对图像进行分割,之后对分割图像进行局部子区灰度标准差统计,在此基础上提出了一种根据纹理丰富程度进行窗口大小自适应设定的算子。基于自适应窗口大小设定,组合使用Census变换和梯度值计算匹配代价,并分别通过自适应权重代价聚合及“胜者为王”策略进行初始视差计算,最后利用左右视差一致性原则和加权中值滤波得到稠密视差图。采用提出的自适应窗口匹配算法与固定窗口匹配算法对Middlebury数据集上的标准图片进行匹配实验,实验结果表明,所提算法的平均匹配错误率为2.04%,相比对比算法,所提方法的匹配错误率分别降低了4.5%和7.9%。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共4页 共32条记录