1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2018 中国多媒体大会 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 基于深度残差网络的HEVC压缩视频增强
    何晓艺,段凌宇,林巍峣
    计算机科学    2019, 46 (3): 88-91.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.011
    摘要 (197)   PDF (2331KB) (762)  
    文中提出了一种基于深度残差网络的HEVC压缩视频增强方法。该方法利用一系列级联的残差模块来完成特征提取,然后基于这些特征进行视频的质量增强。与现有的方法相比,所提方法能够捕捉到压缩视频帧更清晰和泛化的特征。实验结果表明,所提方法在20个通用的测试视频序列上能够实现平均6.92%的BD-rate增益,是所有参与比较的方法中效果最好的。
    参考文献 | 相关文章 | 多维度评价
    2. 一种融合深度基于灰度共生矩阵的感知模型
    叶鹏, 王永芳, 夏雨蒙, 安平
    计算机科学    2019, 46 (3): 92-96.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.012
    摘要 (197)   PDF (1545KB) (328)  
    恰可察觉失真模型(JND)是一种人眼感知模型,它是图像/视频压缩中去除冗余最为有效的方法之一。针对现有JND模型对比掩盖效应(CM)的计算不够完善及深度信息的考虑不够准确的问题,文中提出了一种融合深度基于灰度共生矩阵的JND模型。首先,采用总变分分解模型将图像分解为结构部分和纹理部分,对结构部分采用Canny算子处理,对纹理部分采用灰度共生矩阵处理,两个部分形成更准确的CM模型;结合背景亮度掩盖效应,建立了一种基于灰度共生矩阵的像素域JND模型。然后,在对人眼深度感知进行研究的基础上,引入新的深度加权模型。最后,建立了一种新的融合深度基于灰度共生矩阵的感知模型。实验结果表明,所提出的模型更一致于人的视觉感知。相对于已有的JND模型,所提JND模型能够容忍更多的失真,且拥有更好的感知质量。
    参考文献 | 相关文章 | 多维度评价
    3. 一种基于2D和3D联合信息的改进MDP跟踪算法
    王正宁, 周阳, 吕侠, 曾凡伟, 张翔, 张锋军
    计算机科学    2019, 46 (3): 97-102.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.013
    摘要 (248)   PDF (2271KB) (326)  
    在线多目标跟踪算法是自动驾驶和辅助驾驶系统的重要组成部分。目前,大部分多目标跟踪方法集中于图像域跟踪。虽然通过建立自适应在线模型或最小化能量函数可以解决大多数跟踪问题,但是如何处理复杂交通场景下目标的相互遮挡仍是研究者们面临的难题。文中基于2D和3D联合信息提出了一种改进的基于马尔科夫决策过程(MDP)的跟踪算法,通过将原始MDP跟踪算法的相似性特征由图像域拓展到空间域,使用一种新的光流特征描述子即多图像前后向跟踪误差(Multi-image FB error)来代替原算法的多区域前后向跟踪误差(Multi-aspect FB error),取得了良好的跟踪效果。最后,采用KITTI数据库对本文算法进行测试,结果显示其综合性能相较于原算法有显著提升。
    参考文献 | 相关文章 | 多维度评价
    4. 基于用户偏好的多内容移动视频传输系统的效益优化
    许精策, 梁冰, 李梦楠, 纪雯, 陈益强
    计算机科学    2019, 46 (3): 103-107.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.014
    摘要 (201)   PDF (1477KB) (271)  
    近年来,4G和5G网络的出现大大提高了移动设备数据传输的带宽,同时视频播放设备的性能也不断提高,使得用户对视频流媒体质量的要求不断提升。因此,提升移动视频传输系统的效益变得越来越重要。文中从用户偏好的角度出发,分析多内容移动视频传输系统中用户偏好对系统效益的影响,同时考虑流量价格对用户效益的影响,建立了基于用户偏好的用户效益模型,将多内容移动视频传输系统的效益优化问题转化为加权用户总效益的优化问题。考虑到拥有不同偏好的用户对用户总效益的影响不同,文中提出了一种基于偏好-码率比的用户权重选择方法,以此来选取当前用户偏好下的最优权重。文中通过求解最优加权用户总效益优化问题,得到了当前用户偏好下的最优视频传输码率。实验结果表明,所提方法相比现有效益优化方法提升了5%~10%的系统总效益。
    参考文献 | 相关文章 | 多维度评价
    5. 一种基于参考质量的帧间自适应加权预测
    杨敏捷, 朱策, 郭红伟, 蒋妮
    计算机科学    2019, 46 (3): 108-112.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.015
    摘要 (132)   PDF (1340KB) (307)  
    帧间双向预测在目前的主流视频编码标准中扮演着重要的角色,该技术主要利用时域相关性去除图像间的冗余信息。帧间双向加权预测仅对两个运动补偿块做简单的加权平均(即权值为0.5)。但当参考帧与编码帧之间的亮度发生剧烈变化,或由于诸如量化等因素导致生成预测块的质量不同时,采用现有的方法将会产生严重的失真。因此文中提出了基于参考质量的帧间自适应加权预测方法来解决上述问题。在本方案中,当前编码块参考的质量越好,则分配的权值越大,反之亦成立。实验结果显示,在编解码复杂度可接受的情况下,采用两种方法计算的权值在随机接入(RA)配置下和低时延B帧(LDB)配置下,相比于JEM5.0.1参考软件的基准平均码率分别节省约0.25%和0.3%。
    参考文献 | 相关文章 | 多维度评价
    6. 基于深度学习的视频转码快速算法
    徐婧瑶, 王祖林, 徐迈
    计算机科学    2019, 46 (3): 113-118.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.016
    摘要 (250)   PDF (1725KB) (547)  
    由于良好的率失真表现,新一代视频压缩标准HEVC(High Efficiency Video Coding)得到了越来越多终端设备的支持。然而目前仍有大量的H.264码流存在,因此H.264到HEVC的高效视频转码具有重要的实际意义。实现H.264到HEVC转码最简单的方法,是将H.264解码端和HEVC编码端直接级联起来。由于HEVC编码过程的复杂度较高,这种方法的转码时间较长。针对H.264到HEVC转码耗时的问题,文中提出一种基于深度学习的方法来预测HEVC的CTU(Coding Tree Unit)块划分结果,从而避开HEVC对CTU所有块划分情况循环遍历以寻找率失真最优划分结构的过程,实现H.264到HEVC的快速转码。首先建立了一个H.264到HEVC转码的大型数据库,为训练深度学习模型提供数据保障;随后对H.264压缩域特征和HEVC的CTU块划分模式进行相关性分析,并发掘了CTU块划分模式在时序上的相似性,进而提出基于时间递归神经网络LSTM(Long Short-Term Memory)的三级分类器来预测HEVC的CTU划分。实验结果表明,与直接级联转码器相比,文中提出的H.264到HEVC快速转码算法实现了60%的时间节省,同时峰值信噪比仅下降了0.039kdB,其性能胜过近年来的转码算法的性能。
    参考文献 | 相关文章 | 多维度评价
    7. 深度卷积先验引导的鲁棒图像层分离方法及其应用
    姜智颖, 刘日升
    计算机科学    2019, 46 (3): 119-124.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.017
    摘要 (196)   PDF (3044KB) (477)  
    图像层分离是根据任务需要将观测图像分解成两个独立且具有实际意义的组成成分。图像恢复领域中的很多问题在本质上都可以被理解为两个不同层的分离,如自然图像去雨、本质图像分解、反射层去除等。因此,做好图像层分解工作对解决这些问题有极大的推动作用。由于这个问题的求解具有病态性,已有的方法大多都是通过设计一个复杂的模型先验来约束所需要的两层。然而,复杂的先验会导致目标函数难以被优化求解,算法的有效性也不能很好地发挥出来。更重要的是,这些方法只能针对其中某一个特定的任务,不能迁移到其他应用上,泛化能力不强。为了弥补上述不足,文中提出了一个自适应的灵活优化框架,将深度网络整合到图像层分离迭代过程中。近年来,深度学习在特征提取上的优势逐步体现,在低级图像处理领域也越来越多地被采用。因此,该算法使用深度结构替代传统模型先验来刻画不同层的特征,同时,为了减少网络对训练数据的依赖并提升算法的有效性,将深度信息与传统优化框架相结合。具体来讲,首先基于MAP(最大后验概率)建立能量函数。然后使用ADMM(交替方向乘子法)将该模型分解成3个子问题。前两个子问题用来估计分离的两层,其中鉴于卷积操作在特征刻画上的优势,使用其作为隐式先验刻画问题属性;最后一个子问题通过优化的手段得到最终的精确结果。通过深度卷积先验引导优化迭代,既保持了深度结构对特征的刻画优势,又保留了传统模型优化的稳定性。最后,将所提方法应用到多种图像恢复问题上,包括自然图像去雨和反射层去除。与同类方法的定性与定量比较表明,所提方法在可视效果和数值结果上均表现出了极大的优势,证明了该方法具有强大的泛化能力和有效性。
    参考文献 | 相关文章 | 多维度评价
    8. 基于改进多尺度LBP算法的肝脏CT图像特征提取方法
    刘晓虹, 朱玉全, 刘哲, 宋余庆, 朱, 彦, 袁德琪
    计算机科学    2019, 46 (3): 125-130.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.018
    摘要 (185)   PDF (2200KB) (695)  
    针对高阶方向导数局部二值模式(DLBP)算法会丢失部分高尺度邻域信息的缺陷,提出一种基于改进多尺度LBP算法(MSLBP)的肝脏CT图像特征提取方法。该方法首先对肝脏CT图像进行预处理,并提取正异常ROI区域,然后利用改进的多尺度LBP特征提取方法提取特征,将高阶尺度采样点信息融合其邻域相关点信息作为该采样点的最终信息参与运算,同时利用对角线区域求平均操作,突出了邻域像素点之间的关系特征,从更大范围描述肝脏图像的纹理信息,最后进行分类。实验结果表明:所提方法的准确率可达到90.1%,相比原始的LBP特征提取方法提高了8.7%,有一定的临床应用意义,可用于医生的辅助诊断。
    参考文献 | 相关文章 | 多维度评价
    9. 基于镜头分割与空域注意力模型的视频广告分类方法
    谭凯, 吴庆波, 孟凡满, 许林峰
    计算机科学    2019, 46 (3): 131-136.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.019
    摘要 (168)   PDF (3571KB) (358)  
    随着视频广告在检索和用户推荐等领域的广泛应用,视频广告的分类成为一个重要问题。与现有视频分类任务不同,视频广告有其自身的特点:1)在时域上,产品对象在广告视频中的出现具有非周期性和稀疏性的特点,这使得分类任务需要排除大量与视频类别不相关的视频帧的干扰,利用少数相关视频帧进行分类;2)在空域上,视频帧中除产品外,还包含复杂背景的问题,这使得有效捕捉产品信息变得困难。为了解决上述问题,文中提出了一种基于镜头分割和空域注意力模型的视频广告分类方法,简称SSSA。针对视频中存在的大量干扰帧,文中使用基于镜头切换的分割方法采样视频帧。针对视频帧中包含复杂背景,文中在网络中引入视觉注意力机制帮助网络从产品相关区域提取判别性的特征。为了验证所提方法的有效性,构建了一个包含1k000多个视频广告的数据库(简称TAV)并收集了眼动数据来训练注意力模型。实验结果显示,提出的SSSA视频分类方法比现有的视频分类方法在性能上提升了10%。
    参考文献 | 相关文章 | 多维度评价
    10. 实时高置信度更新补充学习跟踪
    范蓉蓉, 樊佳庆, 刘青山
    计算机科学    2019, 46 (3): 137-141.   https://doi.org/10.11896/j.issn.1002-137X.2019.03.020
    摘要 (170)   PDF (3056KB) (439)  
    为解决补充学习跟踪算法(Staple)在目标被部分遮挡时存在的跟踪失败问题,文中提出了一种简单而有效的高置信度补充学习跟踪算法(High-confidence updata Complementary Learner Tracker,HCLT)。首先,输入当前帧,得到标准相关滤波分类器的检测响应值;然后,计算相关滤波响应的置信度,若计算结果大于阈值则当前帧更新滤波器,否则停止更新;接着,计算出持续不更新的帧数,如果有连续10帧不更新,则强制更新;最后,通过融合颜色补充学习器的响应,得到总的响应结果,其中,响应中最大值的位置即为跟踪结果。将所提算法与补充学习跟踪(Correlation Filter Net tracker,Staple)、端到端表示跟踪(CFNet)、注意力相关滤波网络跟踪(Attentional Correlation Filter Network tracker,ACFN)和对冲深度跟踪(Hedged Deep Tracking,HDT)等先进算法进行实验对比。在OTB100和VOT2016数据集上的结果表明,所提算法在成功率和预期覆盖率方面分别超过基准补充学习跟踪算法(Staple)1.0个百分点和0.4个百分点。另外,在严重遮挡和剧烈光照变化的视频集上的良好表现也充分说明了所提算法在处理表观剧烈变化的情况时很有效。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共14条记录