1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    计算机图形学 & 多媒体 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 基于深度学习的行为识别算法综述
    赫磊, 邵展鹏, 张剑华, 周小龙
    计算机科学    2020, 47 (6A): 139-147.   https://doi.org/10.11896/JsJkx.190900176
    摘要 (195)   PDF (2463KB) (2397)  
    行为识别是计算机视觉领域的基本问题之一,基于深度学习的行为识别算法是当前行为识别的主流算法。在已有的研究中,传统特征提取方法一般是通过人工观察和设计,手动设计出能够表征视频动作的特征。然而,在手工特征表达的基础上构建复杂分类模型的方法已经不能适应高识别精度和应用性的要求,而深度学习的引入为行为识别带来了新的发展方向。文中主要综述了基于深度学习的行为识别算法,首先介绍了行为识别的研究背景和意义,并分别对行为识别的传统学习方法和深度学习方法进行了介绍;然后对深度学习下的算法模型结构进行分类介绍,包括Two-Stream、3D-ConvNet、融合CNN-LSTM 3种算法模型结构;最后介绍了目前常用的公开验证数据集,并主要针对基于两种数据模态的识别算法进行了横向比较,一种是基于RGB视频的UCF101和HMDB51数据集,一种是基于人体骨架序列视频的NTU RGB+D数据集。实验结果表明:深度学习方法已经取得了很大的进步,卷积神经网络的应用极大地促进了行为识别算法的发展,逐步替代了基于手工提取特征的传统方法,尤其采用了卷积神经网络算法之后在行为数据集上的准确率有了显著提高。对于RGB视频而言,Two-Stream和3DConvNet是算法模型结构的主流,对于骨架序列视频而言,Two-Stream和融合时空图模型是算法模型结构的主流。
    参考文献 | 相关文章 | 多维度评价
    2. 深度学习在光声成像中的应用现状
    孙正, 王新宇
    计算机科学    2020, 47 (6A): 148-152.   https://doi.org/10.11896/JsJkx.190700046
    摘要 (135)   PDF (2829KB) (674)  
    光声成像(Photoacoustic Imaging,PAI)是一种多物理场耦合的无创生物医学功能成像技术,它将纯光学成像的高对比度与超声成像的高空间分辨率相结合,可同时获得生物组织的结构和功能成分信息。近年来,随着深度学习算法在医学图像处理中的广泛应用,基于深度学习的光声成像算法也成为该领域的研究热点。对深度学习在PAI图像重建中的应用现状进行综述,归纳和总结现有的算法,分析目前存在的问题,并展望未来可能的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    3. 基于扩展Haar特征和DBSCAN的钢轨识别算法
    罗晋楠, 张济民
    计算机科学    2020, 47 (6A): 153-156.   https://doi.org/10.11896/JsJkx.200100008
    摘要 (75)   PDF (3338KB) (253)  
    障碍物对列车的正常运营构成了极大的安全隐患,钢轨识别是实现障碍物检测的关键步骤。钢轨识别算法需要能够快速有效地检测列车前方钢轨的位置,同时不能占用过多的计算资源,影响障碍物检测程序的运行速度。为解决上述问题,文中提出一种基于扩展Haar特征提取和DBSCAN密度聚类的钢轨识别算法。首先通过仿射变换、池化、灰度均衡化、边缘检测等算法对图像进行预处理,然后基于扩展Haar特征提取图像中钢轨的特征点,最后利用DBSCAN算法对特征点进行聚类,提取出有效的特征数据点进行曲线拟合,从而识别钢轨的位置。通过车载实验结果表明,该方法能够在列车运行过程中有效检测到钢轨的位置,满足多场景、多工况的实际使用需求。
    参考文献 | 相关文章 | 多维度评价
    4. 融合多颜色空间信息的彩色图像色差校正算法
    唐佳林, 张冲, 郭岩锋, 苏秉华, 苏清朗
    计算机科学    2020, 47 (6A): 157-160.   https://doi.org/10.11896/JsJkx.190800026
    摘要 (92)   PDF (3805KB) (682)  
    智能相机在获取图像时,由于成像条件的限制,容易导致彩色图像的颜色与物体本身的颜色偏差较大;为了减少两者的偏差,提高颜色的还原性,文中提出了一种新的颜色校正方法。该方法先在RGB颜色空间中以最小二乘法求出最逼近的Color Matrix,再在L*ab颜色空间中对其进行优化。通过该方法获得的颜色矩阵,改进了在RGB空间中以穷举方式逼近目标值的方式。为验证新算法的有效性,以标准D65光源为照明光源,Color Check24色卡/ColorCheck+Vectorscope为实验对象,来衡量校正结果。实验结果表明,色块区域使用新方法后的色彩均衡效果优于传统的颜色矩阵计算方法。
    参考文献 | 相关文章 | 多维度评价
    5. 全局双边网络的语义分割算法
    任天赐, 黄向生, 丁伟利, 安重阳, 翟鹏博
    计算机科学    2020, 47 (6A): 161-165.   https://doi.org/10.11896/JsJkx.191200127
    摘要 (107)   PDF (2662KB) (279)  
    语义分割任务是对图像中的物体按照类别进行像素级别的预测,其难点在于在保留足够空间信息的同时获取足够的上下文信息。为解决这一问题,文中提出了全局双边网络语义分割算法。该算法将大尺度卷积核融入BiSeNet网络中,在BiSeNet网络原有的空间路径和上下文路径两条分支的基础上增加全局路径分支,使网络能够捕获更多的上下文信息,同时提出将BiSeNet网络中的注意力优化模块和特征融合模块中的全局池化模块替换为全局卷积模块,进一步提高了网络获取上下文信息的能力,从而使预测结果更加准确。实验结果表明,该算法在Cityscapes数据集上将交并比(MIoU)指标提高了0.84%,获得了优于BiSeNet网络的表现。
    参考文献 | 相关文章 | 多维度评价
    6. 多尺度膨胀卷积在图像分类中的应用
    吴昊昊, 王方石
    计算机科学    2020, 47 (6A): 166-171.   https://doi.org/10.11896/JsJkx.190600179
    摘要 (108)   PDF (5538KB) (413)  
    在采用深度学习进行图像分类时,为减少下采样导致的空间信息损失,往往采用膨胀卷积代替下采样,但尚未有文献研究膨胀卷积作用于不同网络层的性能差异。文中进行了大量图像分类实验,找到了适宜膨胀卷积作用的最佳网络层。 但使用膨胀卷积会丢失近邻点的相关信息,导致网格现象,造成图像部分局部信息的丢失。为消除网格现象,又提出在前述最佳网络层采用多尺度膨胀卷积构建神经网络的方法。实验结果表明,所提出的构建网络方法在图像分类中取得了较好的效果。
    参考文献 | 相关文章 | 多维度评价
    7. 基于卷积神经网络的半监督手术视频流程识别
    祁宝莲, 钟坤华, 陈芋文
    计算机科学    2020, 47 (6A): 172-175.   https://doi.org/10.11896/JsJkx.190500154
    摘要 (108)   PDF (2256KB) (462)  
    实时鲁棒的开放性外科手术视频流程自动识别检测将是未来人工智能医疗手术室的核心组成部分,这一关键技术结合其他AI(Artificial Intelligence)技术就可以帮助医护人员自动化、智能化地完成多项术中的常规活动。利用人工智能和计算机视觉的方法进行手术流程识别检测需要对大量的数据进行学习,为了训练这种方法,需要大量地标记手术视频数据,然而在医学领域,对外科手术视频数据的标记需要专家知识,收集足够数量的标记外科手术视频数据是困难且耗时的。因此,文中以腹腔镜胆囊切除术视频数据为研究对象,通过半监督学习方法卷积自编码器对视频进行空间特征提取,结合从同视频上下文中的一对视频帧进行时序特征提取,将非结构化的手术视频数据结构化,从而构建低层手术视频特征到高层外科手术流程语义之间的桥梁,以低代价实现对手术视频流程的智能化识别检测,高效判定手术流程进展。在开源数据集上的实验的结果表明,使用该模型Jacc系数达到71.3%,准确率为86.6%,取得了较好的实验效果。
    参考文献 | 相关文章 | 多维度评价
    8. 基于改进YOLO-V2算法的遥感图像目标检测技术研究
    张曼, 李杰, 丁荣莉, 成昊天, 沈霁
    计算机科学    2020, 47 (6A): 176-180.   https://doi.org/10.11896/JsJkx.191100206
    摘要 (164)   PDF (4252KB) (554)  
    传统遥感图像目标检测方法的时间复杂度高且精准率低,如何快速准确地检测遥感图像中的特定目标成为当前的研究热点。为解决这一问题,文中在YOLO-V2目标检测算法的基础上进行改进,减少了卷积层数与维度,并结合特征金字塔思想,增加了检测尺度,达到了提高检测精度的目的。同时给出了一种基于深度学习的遥感图像目标检测算法的通用处理框架,解决了无法直接处理大幅遥感图像的问题。在DOTA数据集上进行对比实验,结果表明改进YOLO-V2算法在15个类别上的精准率和召回率均优于YOLO-V2算法,mAP值提高了0.12。在时间复杂度方面,所提方法略低于YOLO-V2算法;在大小为416×416的图像小块上,改进YOLO-V2算法相比YOLO-V2检测时间缩短了0.1ms。
    参考文献 | 相关文章 | 多维度评价
    9. 基于多尺度自适应权重的稀疏表示目标跟踪算法
    程中建, 周双娥, 李康
    计算机科学    2020, 47 (6A): 181-186.   https://doi.org/10.11896/JsJkx.190500093
    摘要 (94)   PDF (4387KB) (308)  
    目标跟踪是计算机视觉中的一个重要研究领域,在交通导航、自动驾驶、机器人技术等众多方面有着广泛应用。基于局部稀疏表示的生成式模型算法ASLA的速度快、跟踪准确性高,但是在复杂跟踪环境下,例如目标局部遮挡、目标外观剧烈变化等,往往会丢失目标。文中分析原算法跟踪原理得到了产生目标跟踪丢失的原因。基于ASLA算法,提出了3点改进方法:1)适应跟踪目标区域大小,采用多尺度分块方式,获取互补的目标局部信息;2)在ASLA特征池化过程中根据分块重构误差建模分块自适应权重,以区分不同分块中包含的判别信息,且在多尺度池化特征中引入不同尺度下的目标遮挡信息作为权重;3)在模板更新时,利用最近帧跟踪结果的稀疏表示权重,使更新模板更相似最近跟踪结果,提高了算法的鲁棒性。实验结果表明,该算法在复杂跟踪环境下相比ASLA等具有更高的跟踪准确度,能够实时、准确地跟踪到目标。
    参考文献 | 相关文章 | 多维度评价
    10. 结合EHHT和CI的精神分裂症语音自动检测算法
    田维维, 周悦, 尹旺, 何凌, 邓丽华, 李元媛
    计算机科学    2020, 47 (6A): 187-195.   https://doi.org/10.11896/JsJkx.190900064
    摘要 (83)   PDF (4853KB) (297)  
    通过对精神分裂症语音的临床特点进行研究,实验采集了14个精神分裂症患者的686个元音数据样本和14个与之性别、年龄、文化程度相匹配的健康对照组的793个元音数据样本,来建立病理语音数据库,利用结合集成希尔伯特黄变换(Ensemble Hilbert-Huang Transform,EHHT)和倒谱内插(Cepstrum Interpolation,CI)的改进共振峰提取算法,来获取反映精神分裂症语音音质情感变化的声学特征参数集,结合支持向量机(Support Vector Machine,SVM)分类器来进行分类,实现了精神分裂症患者语音和健康对照组语音的自动检测,并设计实验讨论了白噪声的次数和方差、IMF分量个数、窗长4个因素对检测效果的影响,以及与经典的共振峰估算方法的比较。实验结果表明,文中提出的算法的检测正确率可以达到98.8%,精神分裂症患者在体现音质特征的共振峰语音声学参数上与健康对照组存在显著差异,并有可能为精神分裂症的临床辅助诊断研究提供一个全新、客观、定量和高效的指标。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共3页 共22条记录