栏目文章

Select

1. 一种基于CSI的非合作式人体行为识别方法

李晓薇, 余江, 常俊, 杨锦朋, 冉亚鑫

计算机科学 2019, 46 (12): 266-271. DOI: 10.11896/jsjkx.190200349

摘要（573）

PDF（pc）（3080KB）（1160）

目前,基于Wi-Fi的无线人员感知技术被广泛应用于防入侵安全监测、人类健康护理、步态识别等领域,对此提出了一种基于无设备的非合作式人体行为识别方法,利用Wi-Fi信号的信道状态信息CSI来识别5个动态活动:行走、坐-站、深蹲、跳跃和跌倒。该方法利用SIMO系统采集CSI数据,在对CSI幅度和相位分别进行预处理之后,实施3个步骤来降低计算开销机制:子载波融合、基于移动方差阈值的不良数据链路剔除以及基于小波变换的动态时间窗口的数据分割。在经过前期的各项预处理后提取动作特征,从时域扩展到频率域,通过分析多普勒功率谱的特性来提高CSI信号的利用率。实验结果表明,总体识别率随着使用特征维度的增加而上升;组合分类器加权投票方法经过两轮投票优化,把对5个动作的总体识别率提高到90.3%,且相较于RSSI,CSI在人体行为识别领域的优势更加明显。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于深度学习的交通信号灯快速检测与识别

钱弘毅, 王丽华, 牟宏磊

计算机科学 2019, 46 (12): 272-278. DOI: 10.11896/jsjkx.190400026

摘要（660）

PDF（pc）（2494KB）（2308）

交通信号灯检测与识别技术能够辅助司机做出正确的驾驶决策,减少交通事故的发生,为无人驾驶的实现提供安全保障。针对交通信号灯检测场景复杂多变、目标通常占检测数据集图片的比例极小等技术难点,提出了一种基于深度学习的交通信号灯快速检测与识别算法。整体框架包括如下3部分:基于启发式的图像预分割,用于缩小搜索范围,提升信号灯面板在输入图像中的相对大小和检测精度;基于深度学习的检测与识别,利用卷积神经网络准确地检测与识别信号灯;利用NMS(Non-Maximum Suppression)算法去除上一阶段中重复的检测框。提出的Split-CS-Yolo模型在LISA数据集上取得了96.08%的mAP和2.87%的漏检率,相比Yolo系列的其他方法,其不仅有更高的准确率和更低的漏检率,还将模型大小缩小到原始Yolov2的8.6%,使得检测速度提升了63%。

参考文献 | 相关文章 | 多维度评价

Select

3. 使用模糊聚类的胶囊网络在图像分类上的研究

张天柱, 邹承明

计算机科学 2019, 46 (12): 279-285. DOI: 10.11896/jsjkx.190200315

摘要（462）

PDF（pc）（1422KB）（1172）

胶囊网络中动态路由的本质就是聚类算法思想的实现。考虑到已有胶囊网络中的聚类方式需要数据满足一定的分布才能达到最好的效果,且图像特征比较复杂,于是将一种普适性更好的模糊聚类算法作为胶囊网络中的特征整合方式,并添加了一个使用信息熵来度量不确定性的激活值,以区分同一级别胶囊层特征的显著性。同时,借鉴特征金字塔网络的思想,将不同胶囊层的特征采样成相同尺度,然后进行融合独立训练。基于Keras框架进行实验,其结果表明,相比原来的胶囊网络,这种具有新型结构的胶囊网络在MNIST和CIFAR-10上有更高的识别准确率。对比实验证明了模糊聚类算法在胶囊网络上的应用潜力,其改善了原胶囊网络中聚类算法存在局限的问题;也证明了对胶囊网络中不同层的特征进行融合,能够获得包含信息更丰富且表达能力更强的特征。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于词向量融合的遥感场景零样本分类算法

吴晨, 袁昱纬, 王宏伟, 刘宇, 刘思彤, 全吉成

计算机科学 2019, 46 (12): 286-291. DOI: 10.11896/jsjkx.181202257

摘要（497）

PDF（pc）（3163KB）（1017）

零样本分类算法无须标注要识别的类别样本,因而能大幅度降低实际应用成本,近年来受到广泛关注。遥感场景类别的语义词向量与图像特征空间原型的结构不一致问题,严重影响了遥感场景零样本的分类效果。利用不同词向量间的互补性,文中提出一种基于语义词向量融合的遥感场景零样本分类算法,即耦合式解析字典学习(Coupled Analysis Dictionary Learning,CADL)方法。首先,采用稀疏编码效率较高的解析字典学习方法获取各语义词向量的稀疏系数,以减少冗余信息;然后,将对应的稀疏编码系数串接后作为融合语义词向量表示,并将融合语义词向量线性映射到图像特征空间,与图像特征空间场景类别原型表示进行结构对齐,以降低结构差异性;最后,计算得到要识别的场景类别的图像特征原型,并采用最近邻分类器在图像特征空间完成分类。在UCM和AID数据集上对多种语义词向量的融合进行定量实验,同时将RSSCN7数据集作为已知场景类别的数据集来对两幅实际遥感图像进行定性实验。在UCM和AID上的定量实验分别获得了最高总体分类准确度48.40%和60.23%,相比于典型零样本分类方法的总体分类准确度分别提升了4.80%和6.98%。对两幅实际遥感图像的定性实验,同样获得了最佳零样本的分类效果。实验结果表明,多种语义词向量融合,可以获得与图像特征空间原型结构更一致的语义词向量,且显著提升了遥感场景零样本分类的准确度。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于可穿戴设备的心电图自适应分类算法研究

樊敏, 王晓锋, 孟小峰

计算机科学 2019, 46 (12): 292-297. DOI: 10.11896/jsjkx.190500181

摘要（606）

PDF（pc）（1597KB）（1463）

目前,心血管疾病已成为全球人类非传染性死亡的主要原因,死亡人数约占全球死亡总人数的1/3,且患病人数逐年增加。可穿戴设备被用于对心电图进行自动分类,以实现对心血管疾病的早监测、早预防。随着边缘机器学习和联邦学习的兴起,小型机器学习模型成为了人们关注的热点。针对可穿戴心电图设备低配置、低功耗及个性化的特点,文中研究了一种基于LSTM的轻量级网络结构,并采用自适应算法来优化病人个体的心电图分类模型。该模型利用MIT-BIH公开数据集开展实验,将VEB和SVEB的分类效果与其他相关研究进行了比较。实验结果表明,所提算法的模型结构简单且分类识别率高,能够满足可穿戴设备对病人心电图监测的需求。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于无监督学习的二维工程CAD模型端到端检索算法

曾凡智, 周燕, 余家豪, 罗粤, 邱腾达, 钱杰昌

计算机科学 2019, 46 (12): 298-305. DOI: 10.11896/jsjkx.190900003

摘要（418）

PDF（pc）（2795KB）（1140）

针对企业产品制造过程中海量的计算机辅助设计(Computer Aided Design,CAD)模型的高效检索难题,文中研究了一种基于二维CAD模型内容特征的检索算法,构建了一个可用于CAD的DXF格式源文件模型库的检索系统原型。首先,通过对二维CAD模型的DXF文件结构进行分析,来研究模型中的图元规律并进行形状重构;其次,依据图元特点,提出了基于统计直方图、二维形状分布和傅里叶变换共3类内容特征的提取方法;最后,设计了基于无监督学习的多特征融合框架及相似度计算方法,从而提取出了模型的融合特征描述子并实现了二维CAD模型检索。实验结果表明,文中提取的融合特征相较于单一特征包含了更加丰富的内容特征且具有高效的鉴别力。该系统可以直接应用于产品个性化定制、设计重用等方面,有助于企业进一步提升智能制造能力。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于领域偏好的可变时间窗口时序数据主题模式识别算法

王一博, 彭广举, 何远舵, 王亚沙, 赵俊峰, 王江涛

计算机科学 2019, 46 (11): 251-259. DOI: 10.11896/jsjkx.191100505C

摘要（632）

PDF（pc）（2389KB）（948）

随着传感器的普及,智慧城市、普适计算等领域应用不断涌现,对时序数据处理的需求也在不断增长。时序数据中反复出现的高度相似的模式被称为主题模式。时序数据的主题模式蕴含有了大量的信息,对主题模式的识别是时序数据处理的重要分支领域。现有主题模式识别算法无法根据特定应用或领域的知识来指定主题模式识别的偏好,从而难以发现对分析领域问题最具价值的模式。针对这一问题,文中给出了一种可以根据领域偏好定义子序列相似性的机制,并设计了一种针对上述相似性度量机制的可变时间窗口主题模式识别加速剪枝算法。实验证明,所提方法在多个公开数据集上,能高效且准确地发现具有领域偏好的主题模式。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于快速自适应的二维经验模态分解的图像去噪算法

刘佩, 贾建, 陈莉, 安影

计算机科学 2019, 46 (11): 260-266. DOI: 10.11896/jsjkx.190400159

摘要（611）

PDF（pc）（4225KB）（1323）

为了能够对图像进行自适应的分解,并准确刻画分解系数的分布状态,提出了一种新的基于快速自适应二维经验模态分解的图像去噪算法。该算法首先对图像进行快速自适应二维经验模态分解,通过确定分解后以噪声主导的子带的个数,进一步利用正态逆高斯模型对以噪声主导的子带系数分布进行建模;然后使用贝叶斯最大后验概率估计理论从模型导出相应的阈值;最后采用最优线性插值阈值函数算法完成去噪。仿真结果表明,对于添加不同标准差大小高斯白噪声的测试图像,所提算法在峰值信噪比上相比sym4小波去噪、双变量阈值去噪、邻近算子的全变分算法和重叠组稀疏的全变分算法分别平均提高了4.36dB,0.85dB,0.78dB和0.48dB,结构相似性指数也有不同程度的提高,有效地保留了更多的图像细节。实验结果证明,所提算法在视觉性能和评价指标方面均优于对比算法。

参考文献 | 相关文章 | 多维度评价

Select

9. 基于双向KNN排序优化的行人再识别算法

包宗铭, 龚声蓉, 钟珊, 燕然, 戴兴华

计算机科学 2019, 46 (11): 267-271. DOI: 10.11896/jsjkx.181001861

摘要（639）

PDF（pc）（1462KB）（812）

在跨摄像头的行人再识别任务中,光照、视角以及遮挡物等成像因素导致行人外观在不同视角下呈现出巨大变化,这使得对目标行人的再识别工作变得十分困难。利用重排序算法虽然可以在一定程度上提高行人再识别的准确率,但增加了时间成本和人力成本,且容易引入新的噪声。为此,文中提出了一种基于双向KNN排序优化的行人再识别算法。首先,采用预训练加微调的策略来提取行人的深度特征;然后,利用XQDA和KISSME两种度量学习方法来比较特征间的距离,计算初始排名;最后,根据查询图像和候选图像间的双向KNN关系计算Jaccard距离,并将其与初始距离加权求和作为重排序的参照,计算出新的排名。在CUHK03,Market1501和PRW 3个数据集上的实验表明,文中提出的重排序算法在Rank1和mAP两个评价指标上分别获得了12.2%和13.4%的提升。实验数据充分说明,基于双向KNN排序优化的行人再识别算法可以有效降低重排序时引入噪声的概率,从而提高行人再识别的准确率。

参考文献 | 相关文章 | 多维度评价

Select

10. 融合权重与卷积核删减的SSD网络压缩

韩佳林, 王琦琦, 杨国威, 陈隽, 王以忠

计算机科学 2019, 46 (11): 272-276. DOI: 10.11896/jsjkx.180901630

摘要（826）

PDF（pc）（1726KB）（807）

目标检测是计算机视觉领域中重要的研究方向。近几年,深度学习在基于视频的目标检测领域取得了突破性研究进展。深度学习强大的特征学习和特征表达能力,使其能够自动学习和提取相关特征并加以利用。然而,复杂的网络结构使得深度学习模型具有参数规模大、计算需求高、占用存储空间大等问题。基于深度神经网络的单发多框检测器(Single-shot Multi-box Detector 300,SSD300)能够对视频中的目标进行实时检测,但无法移植到嵌入式设备或移动终端以满足实际应用中的需求。为了解决该问题,文中提出了一种权重删减和卷积核删减融合的方法。首先,针对深度卷积神经网络模型权重参数过多导致模型过大的问题,采用权重删减的方法移除各卷积层中的冗余权重,确定各层权重的稀疏度;然后,针对卷积层计算量大的问题,根据各卷积层中的权重稀疏度对冗余卷积核进行删减,以减少冗余参数和计算量;最后,对删减后的神经网络进行训练,以恢复其检测精度。为验证该方法的有效性,在卷积神经网络框架caffe平台上对SSD网络模型进行验证。结果表明,压缩加速后的SSD300网络模型的大小为12.5MB,检测速度最高可达50FPS (frames per second)。实验实现了在网络检测准确率下降尽量小的前提下,将SSD300网络压缩了8.4×,加速了2×。权重删减和卷积核删减融合的方法为SSD300网络在视频检测中的智能化应用提供了可行性方案。

参考文献 | 相关文章 | 多维度评价

Select

11. 高分影像复杂背景下的城市水体自动提取方法

王卫红, 陈骁, 吴炜, 高星宇

计算机科学 2019, 46 (11): 277-283. DOI: 10.11896/jsjkx.181001985

摘要（581）

PDF（pc）（3109KB）（1240）

城市水体分布信息对于理解城市水循环、热岛效应等地理现象具有重要意义。利用高分辨率影像进行水体提取和水体制图是常用的信息获取方式。由于城市环境背景复杂、高分影像光谱通道少以及水体在影像上分布比例不均匀等原因,将高分影像应用于水体自动提取仍存在较大难度。对此,基于国产高分影像发展一种面向复杂环境的城市水体自动化提取方法。首先,根据水体近红外通道灰度值较低的特征,自适应选取阈值进行分割,获取初始水体;其次,对初始水体进行缓冲以得到靶区域,使用高斯混合模型来表达其整体分布,通过改进期望最大算法估计水体类别分布参数后,使用最大似然法进行水体自动提取;在此基础上,针对粗提取水体中混杂阴影的问题,提出了融合特征方法来去除阴影,从而获得准确的水体提取结果。对上海市金山区的水体提取实验表明,使用所提方法可以有效提取实验影像中占比较小的水体结构,整体精度较目前常用的自动提取算法有明显提升。

参考文献 | 相关文章 | 多维度评价

Select

12. 基于多任务学习的多模态情绪识别方法

吴良庆, 张栋, 李寿山, 陈瑛

计算机科学 2019, 46 (11): 284-290. DOI: 10.11896/jsjkx.180901665

摘要（816）

PDF（pc）（2194KB）（2631）

情绪分析是自然语言处理的一项基本任务,目前在单模态信息(文本)上的研究已经相当成熟。但是对于包含文本、图像和语音3种模态信息的多模态内容(如视频)来说,额外增加的模态信息让情绪分析变得更具挑战性。为了提升多模态情绪识别任务的性能,文中提出了一种基于多任务学习的神经网络方法,该方法在考虑模态内部信息的同时,充分结合了3种模态之间的联系。具体而言,首先对3种模态信息进行预处理,得到相应的特征表示;其次,分别为每个模态构建私有的双向LSTM,从而获得单模态的内部信息;分别为两两组合(文本-图像、文本-语音和图像-语音)的双模态信息构建共享的双向LSTM层,以学习双模态之间的动态交互信息;接着,为3种模态组合的信息构建一个共享的双向LSTM,从而捕捉3种模态之间的动态交互信息;最后,把网络层中得到的单模态的内部信息和多模态的动态交互信息进行融合,通过全连接层和Sigmoid层获取最终的情绪识别结果。在单模态实验中,相比于目前的最佳方法,所提方法在文本、图像和语音3个方面对所有情绪识别的效果分别平均提高了6.25%,0.75%和2.38%;在多模态实验中,该方法在情绪识别任务中达到了平均65.67%的准确率,相比其他基准方法有了明显的提升。

参考文献 | 相关文章 | 多维度评价

Select

13. 基于改进双流卷积网络的火灾图像特征提取方法

徐登, 黄晓东

计算机科学 2019, 46 (11): 291-296. DOI: 10.11896/jsjkx.180901640

摘要（406）

PDF（pc）（2147KB）（1375）

基于图像处理技术的火灾监测,是近年来火灾监控领域的重要分支。对于开阔场景的火灾监测,利用火灾发生时产生的烟雾和火焰的动、静特性,以双流(Two-Stream)卷积神经网络作为理论基础对火灾进行检测识别。双流卷积神经网络采用空间流与时序流分别提取视频中的空间信息与时序信息,然而火灾初期的信息较为微弱,特征不够明显。为进一步提高初期的识别率,提出一种空间增强网络作为双流卷积神经网络的空间流来提取并增强视频的空间信息。空间增强网络同时对当前帧图片V_t和上一帧图片V_t－1做卷积,用V_t的卷积特征与V_t－1的卷积特征做减法,保留卷积特征差异性,再将卷积特征差与当前帧V_t的卷积特征相加,从而增强对V_t的空间特征卷积;双流卷积网络的时间卷积流对当前帧的光流图片V_t′进行时序特征卷积;最后将增强后的空间特征与时序特征融合进行分类。实验结果表明,改进后的双流卷积网络的识别率比原始的双流卷积网络提高了6.2%,且在公开数据集上的测试准确率达到了92.15%,从而证明了该方法的有效性和优越性。此外,与其他方法相比,该网络具有低深度、高识别率的特征,不仅能提高火灾和烟雾的识别率,而且实现了火灾的早期发现,缩短了检测时间。

参考文献 | 相关文章 | 多维度评价

Select

14. 一种深度图像帧内编码单元快速划分算法

朱威, 易瑶, 王图强, 郑雅羽

计算机科学 2019, 46 (10): 286-294. DOI: 10.11896/jsjkx.180701337

摘要（357）

PDF（pc）（2752KB）（964）

新一代的三维视频编码标准——3D-HEVC (3D High Efficient Video Coding)为了显著减少视点个数,增加了包含视频场景几何信息的深度图像,但深度图像编码的计算复杂度非常高,其编码时间是彩色图像的4倍左右。为了降低深度图像编码的计算复杂度,文中提出了一种基于纹理特征分析的深度图像帧内编码单元(CU)快速划分算法。首先,对深度图像的编码树单元(CTU)进行初级纹理特征分析,根据深度图像的纹理变化特征,在大津法的基础上对全局灰度进行分级,再通过判断CTU内采样点的纹理复杂度以及纹理方向标识来确定当前CTU的划分趋势。然后,对纹理复杂度高的CTU进行CU级别的精细纹理特征分析,利用CU内部像素分布的统计特征,自底向上计算不同尺寸的CU的纹理划分标识。最后,根据CTU的纹理复杂度、纹理方向标识以及CU的纹理划分标识预测当前CTU的划分深度范围,并判断是否提前终止CU划分。实验结果表明,与3D-HEVC参考模型中的原始算法相比,所提算法在平均增加0.8%左右码率的同时,能够降低45%左右的编码时间,同时保持了良好的编码率失真性能;与现有的3种快速算法相比,所提算法在整体序列上分别降低了约12%,3%,4%的编码时间,而在大分辨率序列上则分别降低了14%,11%,10%的编码时间,并具有相近的编码率失真性能。

参考文献 | 相关文章 | 多维度评价

Select

15. 基于余弦测度的Web指纹识别算法的研究与改进

汤文亮, 汤树芳, 张平

计算机科学 2019, 46 (10): 295-398. DOI: 10.11896/jsjkx.180801473

摘要（385）

PDF（pc）（1276KB）（1002）

为了在Web指纹数据库中实现对Web指纹的准确识别,需要对Web指纹识别算法进行研究。采用当前识别算法对Web指纹数据库中的Web指纹进行识别时,识别的结果与实际结果之间存在误差、识别所用的时间较长,因此存在识别准确率低和识别效率低的问题。在余弦测度的基础上提出了一种Web指纹识别算法,在结构特征、静态文件、Cookie设计和关键字4个方面采用源码审计方法完成了对Web指纹的选取,建立了Web指纹数据库。首先提取Web指纹数据库中数据的特征,根据特征提取结果剔除Web指纹数据库中存在的异常数据;然后将余弦距离函数当作相似性度量函数,采用K-means算法对Web指纹数据库中的Web指纹进行聚类;最后根据聚类结果完成对Web指纹的识别。实验结果表明,所提方法可在较短的时间内准确地完成对Web指纹数据库中Web指纹的识别,具有识别准确率高和识别效率高的优点。

参考文献 | 相关文章 | 多维度评价

Select

16. 基于行为关键语句特征的停车场异常行为识别方法

汪鸿年, 苏菡, 龙刚, 王雁飞, 尹宽

计算机科学 2019, 46 (10): 299-306. DOI: 10.11896/jsjkx.180901750

摘要（662）

PDF（pc）（4057KB）（879）

随着技术的发展和摄像头的普及,人们对智能视频监控的需求越来越高,其中异常行为识别是智能监控系统的关键部分,对维护社会安全有着重要的作用。针对视频数据的时空特性,文中提出了将行为表示为具有时间序列性的关键语句的方法,并将这些关键语句称为行为关键语句。通过对行为关键语句的学习,实现了对停车场场景的异常行为识别。首先,对行为图像序列进行分割,提取前景目标并计算前景目标的运动周期曲线;然后,依据运动周期曲线采用动态时间规整(Dynamic Time Warping,DTW)的方法提取行为关键帧;最后,基于自然语言处理领域中的语义理解的方法,将行为关键帧表征为一系列行为关键语句进行识别。针对关键语句的时序性,采用擅长处理时序数据的长短时记忆神经网络(Long Short-Term Memory Network,LSTM)对行为关键语句进行分类。此外,为解决现有的数据不平衡问题,采用生成对抗网络(Generative Adversarial Networks,GAN)等方法扩充训练集,以增大样本空间,平衡不同类别数据量的差异。在中国科学院CASIA行为数据库和自建行为数据库上的验证结果表明,所提方法对异常行为的平均识别率达到了97%,相比于以前的方法有了明显的提升,证明了行为关键语句能更好地表征行为信息且LSTM模型更适用于学习时序数据背后的模式,因此该方法在停车场场景的异常行为识别任务上具有有效性。

参考文献 | 相关文章 | 多维度评价

Select

17. 基于自适应加权子模式判别邻域投影的人脸识别方法

杨柳, 陈丽敏, 易玉根

计算机科学 2019, 46 (10): 307-310. DOI: 10.11896/jsjkx.190300061

摘要（312）

PDF（pc）（1899KB）（658）

人脸识别是图像处理和模式识别中的研究热点问题之一,对此,文中提出了一种基于自适应加权子模式判别邻域投影的人脸识别方法。该方法首先将人脸图像划分成较小的人脸图像块,并将相同位置的子图像构建成子模式集;其次,为了提高低维特征的判别能力,同时考虑数据的局部结构信息和类别标签信息,对于每个子模式集,构建一个局部判别邻域图;最后,考虑不同子模式集对人脸图像识别的贡献,引入一个非负权值向量结合所有子模式集的局部散度矩阵,以找出同幅人脸图像的不同子图像之间的互补信息。实验结果表明,相比于其他方法,所提方法的性能更优。

参考文献 | 相关文章 | 多维度评价

Select

18. 非限定条件下无约束的多姿态人脸关键特征自动识别算法

赵志伟, 倪桂强

计算机科学 2019, 46 (9): 250-253. DOI: 10.11896/j.issn.1002-137X.2019.09.037

摘要（675）

PDF（pc）（1419KB）（757）

多姿态人脸关键特征的自动识别,对处理人脸数据库中的图像具有重要意义。为了保证人脸关键特征被准确识别,需要对人脸关键特征进行提取。传统算法对多姿态人脸关键特征进行自动识别时有效性差、识别率低、效率低。为此,文中提出了一种基于向量机的多姿态人脸关键特征自动识别算法,利用相机的焦距将人脸关键特征图像的三维坐标表示出来,计算出多姿态人脸关键特征的三维信息。利用滤波器处理多姿态人脸的关键特征并对其进行提取,最后根据向量机的权值,对人脸关键特征的目标函数和特征中的噪声进行分析,计算人脸自动识别的条件概率和迭代次数,实现非限定条件下无约束多姿态人脸关键特征的自动识别。实验结果表明,所提算法能够对多姿态人脸关键特征进行自动识别,并且具有较高的识别率。

参考文献 | 相关文章 | 多维度评价

Select

19. 基于显著稀疏表示和邻域信息的多聚焦图像融合

张冰, 谢从华, 刘哲

计算机科学 2019, 46 (9): 254-258. DOI: 10.11896/j.issn.1002-137X.2019.09.038

摘要（613）

PDF（pc）（6228KB）（826）

针对多聚焦图像融合算法中边缘模糊和重影的问题,文中提出了一种基于显著稀疏表示模型的多聚焦图像融合方法。首先,根据显著稀疏表示将图像分解为公共稀疏部分、独有稀疏部分和细节信息。其次,利用独有的特征和细节信息检测图像的聚焦区域。最后,利用图像的细节和邻域信息更精确地划分聚焦区域和散焦区域,将不同的源图像的聚焦区进行融合。大量实验结果表明,该方法对多聚焦图像实现了有效融合。与几种最先进的融合算法相比,该方法处理后的图像保留了更多的源图像信息和边缘信息,减少了未配准图像的重影,提高了图像的融合效果。

参考文献 | 相关文章 | 多维度评价

Select

20. 基于卷积神经网络的图像局部风格迁移

缪永伟, 李高怡, 鲍陈, 张旭东, 彭思龙

计算机科学 2019, 46 (9): 259-264. DOI: 10.11896/j.issn.1002-137X.2019.09.039

摘要（805）

PDF（pc）（3509KB）（1996）

图像风格迁移是计算机图形学和计算机视觉的一个研究热点。针对现有的图像风格迁移方法中难以对内容图局部区域进行风格迁移的难点,提出了一种基于卷积神经网络的图像局部风格迁移框架。首先,根据输入的内容图和风格图,利用图像风格迁移网络生成全局风格迁移图;然后,利用图像语义分割网络,通过自动语义分割生成的掩码确定图像前景区域与背景区域;最后,利用掩码图确定风格迁移区域并融合未迁移区域得到图像局部风格迁移结果,同时提出一种基于曼哈顿距离的图像融合算法以优化局部风格迁移对象与未迁移区域之间边界的衔接和平滑过渡。该框架综合考虑了目标区域和边界带的像素值、位置等细节信息,在3个公开的图像数据集上进行实验,结果表明该方法能够高效、快速并自然地实现输入内容图的局部风格迁移,生成艺术性与真实性和谐并存的视觉效果。

参考文献 | 相关文章 | 多维度评价

Select

21. 基于多路卷积神经网络的多光谱场景识别方法

江泽涛, 秦嘉奇, 胡硕

计算机科学 2019, 46 (9): 265-270. DOI: 10.11896/j.issn.1002-137X.2019.09.040

摘要（684）

PDF（pc）（2489KB）（1344）

现有的基于卷积神经网络的场景识别算法无法处理目标场景图形是多光谱图像的情况,在数据量较小的情况下,该算法的识别率不高。针对以上问题,提出一种基于多路卷积神经网络的多光谱场景识别方法。多路卷积神经网络接受三通道可见光彩色图像(RGB图像)以及单通道的近红外图像(NIR图像)共四通道输入。所提方法能够有效提取可见光图像特征、红外光图像特征以及可见光和红外光图像之间的关联特征,并将特征在全连接层进行融合,合理利用了各个光谱图像之间的相关信息,并通过结合预训练的方法来提高识别精度。在NIR_RGB数据集上的实验表明,与AlexNet、InceptionNet、ResNet以及人工设计特征描述子方法相比,该网络的平均识别率较高。并且,对此网络稍加改动,就能将其推广到其他多光谱图像分类任务中。

参考文献 | 相关文章 | 多维度评价

Select

22. 基于核相关滤波器和分层卷积特征的长时间目标跟踪

陈威, 李决龙, 邢建春, 杨启亮, 周启臻

计算机科学 2019, 46 (9): 271-276. DOI: 10.11896/j.issn.1002-137X.2019.09.041

摘要（430）

PDF（pc）（3363KB）（845）

针对长时间目标跟踪中出现的目标形变、尺度变化、目标遮挡以及离开视野等问题,提出一种基于核相关滤波器和分层卷积特征的长时目标跟踪算法。首先,利用预训练的卷积神经网络模型提取分层卷积特征来训练核相关滤波器,进行位置估计。其次,构建目标尺度金字塔,进行尺度估计。最后,为了应对目标遮挡以及离开视野导致跟踪失败的情况,训练一个在线支持向量机进行目标再检测,从而实现长时间目标跟踪。在长时间目标跟踪数据集上的测试结果表明:所提算法的精度分别比其他几种主流跟踪算法HCF,LCT,DSST,KCF和TLD高出7%,15%,17%,21%和50%。

参考文献 | 相关文章 | 多维度评价

Select

23. 基于卷积网络的边缘保持滤波方法

石晓红, 黄钦开, 苗佳欣, 苏卓

计算机科学 2019, 46 (9): 277-283. DOI: 10.11896/j.issn.1002-137X.2019.09.042

摘要（745）

PDF（pc）（3305KB）（1680）

边缘保持滤波是计算机视觉、图像处理领域的重要基础理论研究,作为图像预处理操作对后续的处理结果有着重要影响。区别于传统滤波方法,边缘保持滤波方法不仅注重图像的平滑处理,还注重保持边缘细节。卷积神经网络在很多领域得到了应用,并取得显著的成果。本文将卷积神经网络引入边缘保持滤波,利用卷积神经网络的良好扩展性和灵活性来构建深度卷积神经网络模型(Deep Convolutional Neural Network,DCNN),通过3种类型的网络堆叠层,采用反向传播迭代更新网络参数,训练残差图像,实现基于DCNN的边缘保持滤波方法;还构建了基于梯度域的卷积神经网络模型(Gradient CNN,GCNN),对彩色图像的梯度信息进行学习,通过三层卷积对梯度图进行边缘保持平滑操作,得到边缘保持平滑梯度图,进而利用输入图像引导平滑梯度图进行彩色重建,得到彩色滤波图像。最后通过实验与常见的边缘保持滤波方法进行主观和客观评价对比。DCNN不仅在视觉上达到了其他滤波的效果,同时在处理时间上也存在较大优势,表明DCNN可以通过大量的数据训练有效地拟合出多种边缘保持滤波算法。与其他边缘保持滤波结果相比,GCNN在视觉上可以保持颜色风格与输入图像整体一致,而且图像相似度评价指标也更好,表明GCNN解决了部分滤波处理出现颜色偏差、梯度反转等问题,而且提高了处理效率。

参考文献 | 相关文章 | 多维度评价

Select

24. 一种基于三维眼球模型和Snakuscule的虹膜中心定位算法

周小龙, 姜嘉祺, 林家宁, 陈胜勇

计算机科学 2019, 46 (9): 284-290. DOI: 10.11896/j.issn.1002-137X.2019.09.043

摘要（740）

PDF（pc）（3128KB）（1243）

为提高视线估计中人眼虹膜中心定位的准确性,提出了一种基于三维眼球模型和Snakuscule的新型虹膜中心定位算法。首先,通过人脸对齐方法获取面部特征点,利用特征点初步求得虹膜中心粗定位点;然后,通过判断眼部区域状态降低图像带来的误差;接着,针对Snakuscule能量模型进行改进,通过初始化一个半径固定的Snakuscule模型,对虹膜轮廓进行迭代更新。通过改进的Snakuscule模型结合三维眼球模型获得能量值,其中三维眼球模型反映了虹膜中心、眼球中心和虹膜边界之间组成的几何关系,根据所求能量值不断迭代更新虹膜轮廓,求得最终虹膜中心精确定位点。最后,在BioID 脸部数据库上的实验验证了所提算法的有效性和优越性,该算法的最大标准误差在e≤0.05,e≤0.1和e≤0.25内分别达到了85.0%,97.8%和99.8%。

参考文献 | 相关文章 | 多维度评价

Select

25. 基于改进蚁群算法的轨道缺陷图像分类

曹义亲, 武丹, 黄晓生

计算机科学 2019, 46 (8): 292-297. DOI: 10.11896/j.issn.1002-137X.2019.08.048

摘要（424）

PDF（pc）（2081KB）（887）

针对传统方法分类准确性低、分类速度慢且不同轨道缺陷类型的识别准确性有很大差异的弊端,提出一种新的基于改进蚁群算法的轨道缺陷图像分类方法。对轨道缺陷图像进行预处理,利用竖直投影法对轨道表面区域进行提取,将模糊理论和超熵理论结合在一起获取最佳分割阈值,完成图像分割。结合自适应阈值Canny边缘检测算子和Hough转换法,确定轨道缺陷部分。对缺陷部分的边缘细节进行改进,使轨道缺陷部分的轮廓更加显著。对轨道缺陷特征进行提取,在此基础上分析了基本蚁群算法,针对基本蚁群算法容易陷入局部最优的弊端进行改进,将与特征相似性最高作为判别函数,采用改进蚁群算法对轨道缺陷图像进行分类。实验结果表明,所提方法的分类准确度高,且分类速度快。

参考文献 | 相关文章 | 多维度评价

Select

26. 基于层级聚类回归模型的人脸超分辨率重建算法

王淑云, 干宗良, 刘峰

计算机科学 2019, 46 (8): 298-302. DOI: 10.11896/j.issn.1002-137X.2019.08.049

摘要（501）

PDF（pc）（6466KB）（828）

人脸超分辨率重建是指从一幅低分辨率人脸图像重建出相应的高分辨率图像的过程。大部分的人脸超分辨率重建算法都假设输入图像是对齐且不含噪声的。当输入的人脸图像为非对齐时,超分辨率重建的性能将降低。为此,提出一种基于学习的层级聚类回归算法,其主要针对非对齐的单帧人脸图像的超分辨率重建。该算法分为两部分:聚类和回归。聚类阶段,将训练样本的尺寸统一成某个小尺寸的人脸图像,用于训练人脸图像字典。该字典的字典原子为聚类中心,对原始的人脸图像进行聚类,得到各个子空间的人脸图像簇。该算法充分利用了人脸结构的先验信息,能获得更准确的聚类结果。在回归阶段,仅需要训练一个全局字典,各个子空间的人脸图像共享这些字典原子。在每个簇内,搜索各个驻点的邻域,以生成对应的邻域子空间。然后,学习低分辨率与高分辨率样本特征之间的映射关系,以得到每个子空间的回归模型。该算法的核心是所有的人脸图像类共享一个全局字典,但对于同一个驻点,在不同的人脸图像簇内,邻域样本各不相同,这样能够更准确地学习局部映射关系。该算法不仅可以缩短训练时间,还可以提高人脸超分辨率重建的质量。对比实验的结果表明,该算法的PSNR至少可以提升0.39dB,SSIM可以提升0.01~0.18。

参考文献 | 相关文章 | 多维度评价

Select

27. 时空约束下的三维动态模型一致性对应

程志豪, 潘翔, 郑河荣

计算机科学 2019, 46 (8): 303-309. DOI: 10.11896/j.issn.1002-137X.2019.08.050

摘要（457）

PDF（pc）（5063KB）（984）

已有对应算法由于局部几何特征不稳定而存在错误映射。文中针对三维动态数据,提出了时空约束下的一致性对应算法。首先,算法以相邻帧数据的时空一致性为约束条件,结合非刚性变形理论构建能量最小化方程。其次,通过能量方程约束求解得到稀疏对应关系。最后,针对变形跟踪所导致的对应丢失问题,所提算法结合曲面采样和等距映射完成紧密对应。针对不同的三维动态数据进行实验分析和量化比较,结果所提算法明显优于类似的算法。

参考文献 | 相关文章 | 多维度评价

Select

28. 基于小波与分形相结合的图像压缩编码

张晶晶, 张爱华, 纪海峰

计算机科学 2019, 46 (8): 310-314. DOI: 10.11896/j.issn.1002-137X.2019.08.051

摘要（394）

PDF（pc）（2730KB）（741）

分形图像编码在较高的压缩比下,可以保持较好的重构图质量;但也存在计算复杂度高和编解码时间长的缺点。因此,在定义一种新的子块特征——框点和的基础上,结合连续小波变换的平滑特性,提出了基于小波与分形相结合的图像压缩编码。该算法充分利用子带的相关性来提高重构图像的质量,将全局搜索转换为近邻搜索,缩小了搜索范围,从而减少了编解码时间。仿真实验结果表明,与基本分形算法和其他算法相比,新算法的性能更优,不仅缩短了编解码时间,而且提高了重构图像的质量。

参考文献 | 相关文章 | 多维度评价

Select

29. 适于移动终端字符识别环境的自适应多阈值二值化方法

朱德利, 杨德刚, 胡蓉, 万辉

计算机科学 2019, 46 (8): 315-320. DOI: 10.11896/j.issn.1002-137X.2019.08.052

摘要（323）

PDF（pc）（2338KB）（744）

为了解决移动终端字符识别应用中光照不均匀、环境不可控而导致的图像二值化效果不佳的问题,提出一种基于积分图快速计算的多阈值自适应二值化方法。该方法首先以待求点为中心设置一个特定尺寸的滑窗,计算该滑窗内所有点的均值,再根据高斯函数加权计算当前滑窗的两个前置滑窗的均值。设置均值松弛因子来衡量当前点的光照情况。像素点的松弛阈值依据该点的松弛因子和光照情况的评价综合计算获得。以Lenovo ZUK Z2 Pro作为实验设备,在Android操作系统中编写程序,进行文字识别精度的测试。所提算法对前景划分的平均召回率为95.5%,平均准确率为91%。调用Tesseract 4.0的原生OCR识别引擎进行验证,在不规则阴影、多层次光照、线性光线变化等环境下,算法的文字识别准确率分别为96.8%,98.2%和93.2%,高于其他预处理算法。所提算法具有较强的鲁棒性和自适应能力,能满足移动终端字符识别应用的图像预处理要求。

参考文献 | 相关文章 | 多维度评价

Select

30. 一种医学肾动态显像自动化定量评估方法

柴锐, 薛凡, 曾建潮, 秦品乐

计算机科学 2019, 46 (8): 321-326. DOI: 10.11896/j.issn.1002-137X.2019.08.053

摘要（393）

PDF（pc）（2555KB）（1092）

目前,临床上肾动态显像评估肾功能的方法过多依赖于手动获取感兴趣区域(Region of Interest,ROI),时间效率较低。针对这一问题,提出一种肾动态显像自动化定量评估的方法。首先,对肾动态显像不同阶段的图像进行预处理;其次,利用改进水平集模型获取肾功能成像中肾脏的ROI,并通过形态学方法得到本底ROI,再对肾血流灌注成像中主动脉的ROI进行定位和获取;最后,结合Gates法计算分肾、总肾的肾小球滤过率(Glomerular Filtration Rate,GFR),根据ROI区域内的放射性计数绘制时间-放射性曲线,实现一体化、自动化的肾功能评估。临床实验结果表明,所提自动化评估方法能够在较短的时间内提升自动化水平,并提高评估精度,该方法可以为临床诊断和辅助治疗提供有效帮助。

参考文献 | 相关文章 | 多维度评价