1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    2017 中国多媒体大会 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 联合自适应梯度稀疏和通道相关性的简单透镜成像去模糊
    王新灵, 付莹, 黄华
    计算机科学    2018, 45 (8): 1-6.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.001
    摘要 (110)   PDF (2621KB) (345)  
    成像过程中的光学像差,使得简单透镜成像系统只能获得低质量的模糊图像。针对这类模糊问题,提出一种联合自适应梯度稀疏和通道间相关性的去模糊算法。该算法对模糊图像3个颜色通道的平滑区域点和边缘点采用不同的稀疏约束,同时利用3个通道间的相关性,借助某个通道保留的边缘信息来复原其他通道的边缘信息。仿真实验结果表明,该方法对简单透镜获得的模糊图像复原质量较高,能取得较好的视觉效果。
    参考文献 | 相关文章 | 多维度评价
    2. 无线网络用户的Wi-Fi指纹匿名化研究
    韩秀萍, 王智, 裴丹
    计算机科学    2018, 45 (8): 7-12.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.002
    摘要 (124)   PDF (1846KB) (229)  
    如今,上亿的Wi-Fi热点被广泛部署,用于给人们提供Wi-Fi连网服务。为了加快Wi-Fi连接的速度,移动设备会发送探测请求帧来发现附近的无线热点,并且保存曾经连接过的AP的SSID,即首选网络列表 (PNL)。已有研究表明,由探测请求帧发出的SSID构成的Wi-Fi指纹会泄露用户的隐私信息。基于对现实情况中Wi-Fi指纹所造成的隐私泄露程度的分析,提出了数据驱动的隐私保护方案。首先,针对4个城市中2700万用户连接400万Wi-Fi热点的行为进行了测量研究,并证明了在很多场景下Wi-Fi指纹都可以用来区分用户。基于对Wi-Fi指纹中SSID语义信息的研究,可以推断出这些用户的身份信息(如工作信息)。其次,提出了一种基于协同过滤的启发式方法,它通过给用户的PNL中添加伪SSID来模糊其信息,并使得附近的人彼此之间的PNL与Wi-Fi指纹都更加相似。最后,基于真实的Wi-Fi连接数据验证了上述策略的有效性,实验结果表明,修改PNL不仅能保护用户隐私,而且能保证快速的Wi-Fi连接。
    参考文献 | 相关文章 | 多维度评价
    3. 基于视觉的地理定位中PnP算法的精度评估方法
    桂逸男, 老松杨, 康来, 白亮
    计算机科学    2018, 45 (8): 13-16.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.003
    摘要 (139)   PDF (3775KB) (791)  
    近年来,基于地理位置服务的需求的飞速增长催生了定位技术的发展。基于视觉的方法利用多幅图像的拍摄参数关系能够恢复较精确的相机位姿,但目前并没有统一的评估方法对其性能进行定量评价。现今主流的相机位姿精度评估方法是与GPS进行比较,由于照片自带的GPS标签存在噪声,且不同坐标系之间的转换存在误差,将照片标签中的GPS作为真实值评估恢复的相机位姿精度不够客观。通过计算得到的位姿来建立参考平面,将PnP算法得到的相机位姿通过相同方法投影至参考平面进行评估,该精度评估方法客观可行。
    参考文献 | 相关文章 | 多维度评价
    4. 可伸缩模块化CNN人群计数方法
    李云波, 唐斯琪, 周星宇, 潘志松
    计算机科学    2018, 45 (8): 17-21.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.004
    摘要 (155)   PDF (2601KB) (278)  
    本文目标是根据任意视角、任意人群密度的图像信息,估计真实场景中的人群密度。但三维空间景物投影到二维空间时会造成透视失真和人群遮挡问题,导致难以区分个体与个体、个体与背景的差异。为此,提出一种灵活高效的可伸缩模块化卷积神经网络(CNN)的架构,允许直接输入任意大小和分辨率的图像,不额外计算视角变化信息,通过生成密度图的方式来估计人群数量。架构的每个模块采用不同卷积核的多列结构,可以拟合不同远近的个体信息;并结合前后两层的特征信息,减少了梯度消失造成的精度下降损失。实验证明,在ShanghaiTech PartA和PartB数据集上,所提方法的准确率比之前最好的MCNN方法分别提高了14.58%,40.53%,均方根误差分别降低了23.89%,33.90%。
    参考文献 | 相关文章 | 多维度评价
    5. 一种基于RGB-D特征融合的人体行为识别框架
    毛峡, 王岚, 李建军
    计算机科学    2018, 45 (8): 22-27.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.005
    摘要 (203)   PDF (2786KB) (382)  
    人体行为识别是计算机视觉和模式识别领域内一个重要的研究方向。人体行为的复杂性和不同人执行同一动作的差异性,使得行为识别仍然是一个具有挑战性的课题。采用新一代传感技术的RGB-D相机能够同时记录RGB图像和深度图像,并能够实时提取骨骼点信息。充分利用以上信息,成为行为识别领域的研究热点和突破点。文中提出了一种新的基于高斯加权金字塔式梯度方向直方图的RGB图像特征提取方法,并构建了一种多模特征融合的行为识别框架。在UTKinect-Action3D,MSR-Action 3D和Florence 3D Actions 3个数据库上对本研究所提特征和框架进行实验,结果表明,所提框架在3个行为数据库上的识别正确率分别达到了97.5%,93.1%,91.7%,从而证明了该行为识别框架的有效性。
    参考文献 | 相关文章 | 多维度评价
    6. 基于中心一致性敏感直方图的图像联合分割算法
    毛峡, 王岚, 李建军
    计算机科学    2018, 45 (8): 28-35.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.006
    摘要 (113)   PDF (4250KB) (261)  
    图像联合分割是计算机视觉领域的一个研究热点。有能力在分割过程中利用相似对象的信息是联合分割相比于其他分割算法的一个优势,与此同时,建立对应对象的相似性也成为了一项具有挑战性的任务。文中为图像联合分割算法提出一个新的中心一致性敏感直方图。传统的图像直方图通过为每个出现在图像中的像素在该像素的对应灰度级计数器上加一的方式计算得出。与传统的图像直方图不同,中心敏感直方图在每个像素处计算,并且它是为每个出现的像素在其对应的灰度级计数器上加一个浮点数,这个浮点数服从对应像素与计算该直方图位置处的像素之间的空间一致性。因此,该直方图不仅从灰度级角度考虑了像素的分布,而且也将像素的空间相对位置信息考虑在内。基于该中心一致性敏感直方图,文中提出了一种强健的图像联合分割算法,其强健性主要体现在的对处于不同光照条件下和形状发生变化的相似对象进行较好的分割。基于大量的测试数据集对所提出的算法进行验证,实验结果表明,所提方法的分割正确率相比现有技术的平均水平提高了3个百分点左右,尤其当测试数据集中各个前景对象处于不同光照条件下或具有不同形状时效果更佳。
    参考文献 | 相关文章 | 多维度评价
    7. 基于Bottom-hat频谱方法的运动模糊参数估计方法
    方正, , 曹铁勇, 付铁连
    计算机科学    2018, 45 (8): 36-40.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.007
    摘要 (139)   PDF (3653KB) (418)  
    运动模糊是由于物体与成像系统间的相对运动而形成的,匀速直线模糊图像的复原需要得到精确的模糊参数。根据理论,匀速直线运动模糊的模糊参数与频谱中的零点有关,其频谱暗线数目与模糊尺度有关,且频谱暗线与角度垂直。在检测频谱暗线时,由于受到图像结构或者噪声影响,难以准确定位频谱暗线;同时,图像长宽比的不同也会影响频谱结构。针对以上问题,文中利用形态学中的Bottom-hat操作对模糊图像频谱进行处理,并对处理后的频谱采用霍夫变换得到模糊角度,再利用模糊角度和中心零点距离得出模糊尺度。实验结果表明,该方法检测模糊尺度的误差小于0.25个像素,角度小于0.6°,且拥有较好的稳定性,可以正确检测不同尺度和内容模糊图像的模糊参数。
    参考文献 | 相关文章 | 多维度评价
    8. 基于区域的年龄估计模型研究
    孙劲光, 荣文钊
    计算机科学    2018, 45 (8): 41-49.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.008
    摘要 (111)   PDF (1947KB) (435)  
    随着年龄特征提取和年龄特征分类模式研究的不断深入,为了进一步满足基于年龄信息的人机交互系统在现实生活中的应用需求,构建有效的机器学习算法已成为人脸图像年龄估计技术的研究热点之一。首先,通过分析人脸图像的多个区域特征随年龄变化的规律,将面部分为前额区域、眼部区域、面中部区域及人脸整体区域,并分别构建深度卷积神经网络特征提取模型,实现每个区域年龄的特征提取;其次,以 Morph人脸库为样本集,将其划分为10~19岁、20~29岁、30~39岁、40~49岁、50~59岁、60岁以上6个年龄段,完成多区域年龄特征提取网络模型的训练及测试;最后,依据多区域网络年龄特征分类的准确率,确定基于区域的动态权值年龄估计模型。实验表明:所提模型在Morph人脸库中的年龄估计准确率达到72.6%,也将该人脸库的年龄分类类别由4个提升到6个。
    参考文献 | 相关文章 | 多维度评价
    9. 两阶段的视频字幕检测和提取算法
    王智慧, 李佳桐, 谢斯言, 周佳, 李豪杰, 樊鑫
    计算机科学    2018, 45 (8): 50-53.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.009
    摘要 (148)   PDF (3427KB) (551)  
    视频字幕检测和提取是视频理解的关键技术之一。文中提出一种两阶段的字幕检测和提取算法,将字幕帧和字幕区域分开检测,从而提高检测效率和准确率。第一阶段进行字幕帧检测:首先,根据帧间差算法进行运动检测,对字幕进行初步判断,得到二值化图像序列;然后,根据普通字幕和滚动字幕的动态特征对该序列进行二次筛选,得到字幕帧。第二阶段对字幕帧进行字幕区域检测和提取:首先,利用Sobel边缘检测算法初检文字区域;然后,利用高度约束等剔除背景,并根据宽高比区分出纵向字幕和横向字幕,从而得到字幕帧中的所有字幕,即静止字幕、普通字幕、滚动字幕。该方法减少了需要检测的帧数,将字幕检测效率提高了约11%。实验对比结果证明,相比单一使用帧间差和边缘检测的方法,该方法在F值上提升约9%。
    参考文献 | 相关文章 | 多维度评价
    10. 改进的混合蛙跳算法及其在多阈值图像分割中的应用
    张新明, 程金凤, 康强, 王霞
    计算机科学    2018, 45 (8): 54-62.   https://doi.org/10.11896/j.issn.1002-137X.2018.08.010
    摘要 (101)   PDF (2463KB) (345)  
    针对混合蛙跳算法(Shuffled Frog Leaping Algorithm,SFLA)存在的计算复杂度高、优化效率不理想等问题,提出了一种改进的混合蛙跳算法(Improved Shuffled Frog Leaping Algorithm,ISFLA)。在原始 SFLA的基础上进行如下改进:首先,将其中每次只更新组内最差青蛙的方式改为更新组内所有青蛙的方式,这既增大了获得优质解的概率,又省去了调整组内迭代次数的步骤,从而提升了优化效率和可操作性;其次,将基于局部最优更新的方法和基于全局最优更新的方法融合为一种混合扰动更新方法,从而避免了复杂条件的选择步骤,进一步提升了优化效率;最后,去掉随机更新方式,以免优质解被破坏,从而提高了整体的优化性能。将 ISFLA 用于 CEC2005和CEC2015连续基准函数的优化测试和基于Renyi 熵的灰度和彩色图像分割的多阈值选择实验中,结果表明,与 SFLA 和state-of-the-art的LSFLA 相比,ISFLA 具有更高的优化效率,更适用于多阈值图像分割的阈值选择。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共12条记录