Toggle navigation
计算机科学
首页
关于本刊
期刊介绍
学术指标
学术荣誉
编委会
主编
编委会成员
道德声明
OA政策
期刊订阅
联系我们
English
1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
作者中心
投稿/查询
投稿模板
处理流程
投稿指南
审稿中心
审稿登录
审稿专家申请
审稿要求/审稿单
编辑中心
编辑登录
图像处理&多媒体技术 栏目所有文章列表
(按年度、期号倒序)
一年内发表的文章
|
两年内
|
三年内
|
全部
Please wait a minute...
选择:
导出引用
EndNote
Ris
BibTeX
显示/隐藏图片
Select
1.
基于改进多层卷积神经网络的水体富营养化遥感监测算法研究
封雷, 封丽, 方芳, 郭劲松, 潘江, 余由, 陈瑜
计算机科学 2022, 49 (
11A
): 210200160-5. DOI:
10.11896/jsjkx.210200160
摘要
(
55
)
PDF(pc)
(2979KB)(
74
)
可视化
收藏
随着水环境质量监测技术的高速发展,水环境质量数据的种类、数量均都呈现爆炸式增长。原位监测与遥感监测是水环境监测的重要数据来源,如何快速高效地理解海量的监测数据是人工智能技术在生态环境研究领域的热点。因此,以三峡库区境内的国家良好水体——长寿湖为例,研究改进WRCNN卷积神经网络算法模型直接对遥感影像中的水环境数据进行特征提取,结合原位在线监测数据对遥感影像数据进行标注,增加CNN网络的宽度,提高遥感数据的水环境特征提取的能力,消除函数选择的不确定性,减少参数确定带来的计算步骤和抑制过拟合的影响,实现对大尺度水环境遥感特征的利用。结果表明,改进WRCNN卷积神经网络算法模型能有效识别长寿湖富营养化表征指标叶绿素a的浓度,为库区水体富营养化监测提供高效手段。
参考文献
|
相关文章
|
多维度评价
Select
2.
基于YOLOv3与改进VGGNet的车辆多标签实时识别算法
顾曦龙, 宫宁生, 胡乾生
计算机科学 2022, 49 (
11A
): 210600142-7. DOI:
10.11896/jsjkx.210600142
摘要
(
129
)
PDF(pc)
(2663KB)(
80
)
可视化
收藏
为了能快速、有效地识别视频中的车辆信息,文中结合YOLOv3算法和CNN算法的优点,设计了一种能实时识别车辆多标签信息的算法。首先,利用具有较高识别速度和准确率的YOLOv3实现对视频流中车辆的实时监测和定位。在获得车辆的位置信息后,再将车辆信息传入经过简化与优化的类VGGNet多标签分类网络中,对车辆进行多标签标识。最后将标签信息输出至视频流,得到对视频中车辆的实时多标签识别。文中训练与测试数据集来源为KITTI数据集和通过Bing Image Search API获取的多标签数据集。实验结果证明,所提方法在KITTI数据集上的mAP达到了91.27,多标签平均准确率达到80%以上,视频帧率达到35 fps,在保证实时性的基础上取得了较好的车辆识别和多标签分类效果。
参考文献
|
相关文章
|
多维度评价
Select
3.
基于PCPNET的点云特征线提取算法
喻孟娟, 聂建辉
计算机科学 2022, 49 (
11A
): 210800017-6. DOI:
10.11896/jsjkx.210800017
摘要
(
58
)
PDF(pc)
(4104KB)(
63
)
可视化
收藏
特征线提取是几何模型处理的基础操作,其对三维模型的表达具有重要意义。文中基于PCPNET提出了一种对噪声和非均匀采样具有鲁棒性的曲率值和主曲率方向的计算方法,并在其基础上提出了一种特征线提取算法。该算法利用加权二次曲线拟合局部曲率分布,并通过判定在最大主曲率方向上与二次曲线极值点的距离来实现脊谷特征点的识别;最后,通过建立细化后潜在特征点的最小生成树(MST)实现特征点的连接,完成特征线的提取。实验结果表明,所提算法能够利用PCPNET对点云曲率和主曲率方向信息进行较为准确的估计,并且根据所提出的特征点识别方法可以弥补传统采用简单阈值截断导致平坦区域特征线线无法正常提取的缺陷,最终能准确、完整地从清洁点云和噪声点云中提取特征线。
参考文献
|
相关文章
|
多维度评价
Select
4.
基于多尺度特征融合和双重注意力机制的肝脏CT图像分割
黄扬林, 胡凯, 郭建强, 彭诚
计算机科学 2022, 49 (
11A
): 210800162-9. DOI:
10.11896/jsjkx.210800162
摘要
(
66
)
PDF(pc)
(3598KB)(
78
)
可视化
收藏
肝脏疾病是医学上最常见的疾病之一,对其进行精确的分割是辅助肝脏疾病诊断及手术规划的必要步骤。然而,由于肝脏CT图像的复杂性,肝脏分割仍然是一个极具挑战性的问题。以往的研究大多简单地使用拼接或求和操作来融合不同语义,导致无法充分利用其互补性。针对这一问题,提出了一种基于多尺度特征融合和双重注意力机制的网络模型MD-AUNet。首先利用分层多尺度注意力下采样模块中分层级的双重注意力机制有效地融合不同尺度特征信息,提取富含空间信息的特征表示。然后通过全局注意力上采样模块获取高层特征的全局上下文用于对低层特征信息加权,从而选择更为精确的空间信息。同时在网络训练时采用深层监督策略,以学习不同解码层的层次表示。最后提出了一种简洁有效的后处理方法,用于进一步细化MD-AUNet粗分割结果。在医院采集的肝脏数据集(经专家手动标注)上的实验结果表明,所提算法在主观视觉感受和客观评价指标方面均优于其他现有肝脏分割算法,其平均像素精度、平均交并比和Dice相似系数分别为97.6%,95.4%和95.5%。
参考文献
|
相关文章
|
多维度评价
Select
5.
简单背景下基于OpenCV的静态手势识别
徐玥, 周辉
计算机科学 2022, 49 (
11A
): 210800185-6. DOI:
10.11896/jsjkx.210800185
摘要
(
85
)
PDF(pc)
(3000KB)(
85
)
可视化
收藏
手势识别是人机交互中极为重要的一项技术,具有较高的理论和实践探究价值。但由于手势所处背景的复杂性、个体的差异性等原因,手势识别成为一个富有挑战性的课题。因此迫切需要设计一种高效准确的手势识别算法,用以对目标手势进行有效的检测和识别。文中提出了一种改进的手势分割和手势特征提取方法,利用SVM分类器构建手势模型,对手势进行分类识别。在YCrCb颜色空间的基础上,融合OTSU阈值处理法选取阈值分割手势,提高分割的准确度;在边缘检测的基础上,使用椭圆傅里叶描述子拟合边缘,提取手势特征。实验结果表明,运用上述算法所建立的系统能够十分高效地提取手势特征信息,且在简单背景下对13种常见手势的平均识别准确率达到89.96%,能够基本满足对手势识别的精确度和稳定性的要求。
参考文献
|
相关文章
|
多维度评价
Select
6.
结合稳像补帧与VIBE算法的抖动视频前景目标提取方法
刘新富, 蒋慕蓉, 黄亚群, 张占伟, 周莹瑛
计算机科学 2022, 49 (
11A
): 210800195-8. DOI:
10.11896/jsjkx.210800195
摘要
(
58
)
PDF(pc)
(6642KB)(
74
)
可视化
收藏
在动态场景下进行目标检测与跟踪处理时,提取的前景目标往往会因受到背景抖动干扰而出现目标误判、轮廓不完整等问题,为此提出结合稳像与补帧、VIBE算法与连通域修正的抖动视频前景目标提取方法。首先利用ORB对相邻两帧图像进行特征匹配,使用RANSAC剔除误匹配点,以运动目标为中心调整图像边距,裁剪与修补不重合的部分,通过统计法求相邻两帧的偏移均值,完成视频稳像处理;其次利用稠密光流法计算相邻两帧图像的位移,通过位置重映射生成中间帧,实现视频补帧;然后将VIBE算法增加形态学处理与连通域修正,结合Canny算子进行边缘检测,增加目标轮廓的完整性;最后使用视频实例进行测试,与其他视频目标提取算法进行比较分析,精度、召回率至少提高10%,漏检率、错分率至少降低15%。实验结果表明,所提方法能有效去除抖动带来的影响,提取的目标完整性较高。
参考文献
|
相关文章
|
多维度评价
Select
7.
基于t-SVD的结构保持多视图子空间聚类
张华伟, 陆新东, 朱小明, 孙军涛
计算机科学 2022, 49 (
11A
): 210800215-6. DOI:
10.11896/jsjkx.210800215
摘要
(
46
)
PDF(pc)
(2521KB)(
52
)
可视化
收藏
针对基于张量的多视图子空间聚类算法不能很好地保持样本之间的流形几何结构和多视图之间相似性的缺点,提出了一种结构保持的t-SVD多视图子空间聚类算法。首先将重构系数作为数据构造描述流形结构的邻接矩阵,其次通过图正则限制多视图数据的重构系数,然后利用各个视图的重构系数计算描述视图之间关系的相似矩阵,最后通过交替优化的方式来分别优化邻接矩阵及相似矩阵和多视图数据的重构系数,直至收敛。在3个数据库上分别进行了聚类实验,准确率分别达到了97.25%,96.97%,100%。实验结果表明,所提算法在聚类任务上具有较高的准确率。
参考文献
|
相关文章
|
多维度评价
Select
8.
基于卷积神经网络的乳腺癌组织病理学图像分类研究综述
张喜科, 马志庆, 赵文华, 崔冬梅
计算机科学 2022, 49 (
11A
): 210800232-9. DOI:
10.11896/jsjkx.210800232
摘要
(
82
)
PDF(pc)
(2708KB)(
61
)
可视化
收藏
乳腺癌组织病理学检查是确诊乳腺癌的“金标准”。基于卷积神经网络的乳腺癌组织病理学图像分类已经成为医学图像处理与分析领域的研究热点之一。自动且精确的乳腺癌组织病理学图像分类在临床上具有重要的应用价值。首先介绍了两个目前广泛应用于乳腺癌组织病理学图像分类的公开数据集及各自的评价标准。然后,重点阐述了卷积神经网络在两个数据集上的研究进展。在描述研究进展的过程中,分析了部分模型准确率较低的原因,并对提升模型性能给出了一些建议。最后,讨论了乳腺癌组织病理学图像分类目前存在的问题及对未来的展望。
参考文献
|
相关文章
|
多维度评价
Select
9.
基于注意力机制与混合监督学习的钢轨表面缺陷检测模型
赵晨阳, 张辉, 廖德, 李晨
计算机科学 2022, 49 (
11A
): 210800241-6. DOI:
10.11896/jsjkx.210800241
摘要
(
63
)
PDF(pc)
(4781KB)(
77
)
可视化
收藏
钢轨表面缺陷检测是保障铁路安全运行的重要一环,通过分析钢轨表面缺陷检测的必要性和现有检测方法的不足,提出了一种基于注意力机制与混合监督学习的钢轨表面缺陷检测模型。针对现有模型参数量大、部署成本高的问题,提出了端到端的钢轨缺陷检测模型,利用注意力模块引导特征丛的生成,提高缺陷检测速度,降低模型部署成本;针对实际应用中存在的异常样本少、标注成本高等问题,研究粗糙标签与混合监督对模型的影响,对像素级标签进行数据处理,使标签的不同区域获得不同的关注,降低模型对标签的依赖性。最终在实际钢轨数据集上进行实验验证,结果表明在图像级标签样本中加入少量像素级标签样本的混合监督学习可获得与全监督学习相当的性能,模型的分类准确率达99.7%。
参考文献
|
相关文章
|
多维度评价
Select
10.
面向算法模型的语音数据集质量评估方法研究
李荪, 曹峰, 刘姿杉
计算机科学 2022, 49 (
11A
): 210800246-6. DOI:
10.11896/jsjkx.210800246
摘要
(
55
)
PDF(pc)
(4253KB)(
57
)
可视化
收藏
随着智能语音技术和产品应用大规模的成熟落地,对高质量语音数据集的需求与日俱增。目前,针对结构化数据的质量评估方法有一定的研究,但尚未形成面向非结构化的语音数据集质量评估标准。通过研究语音算法模型的构建原理,分析语音数据集的建设需求,建设统一的语音数据集质量评估体系。该评估体系从4个维度对面向算法模型训练的语音数据集进行质量评价,包括广度覆盖性、选集区分性、领域深入性和数据完整性。通过提出具体的语音数据集质量评估指标、计算方法和评估步骤等,对车载应用领域语音数据集的质量进行评估并对结果进行分析,对评估语音数据集质量、促进数据集建设提供参考。考虑了语音数据集构建的多样化适用能力、隐私问题、效率要求、自动化需求等,提出了构建高质量的语音数据集的未来发展建议。
参考文献
|
相关文章
|
多维度评价
Select
11.
MIF-CNNIF:一种基于CNN的交叉特征的多分类图像数据框架
王盼红, 朱昌明
计算机科学 2022, 49 (
11A
): 210800267-8. DOI:
10.11896/jsjkx.210800267
摘要
(
55
)
PDF(pc)
(3241KB)(
43
)
可视化
收藏
近年来,图像多分类任务和深度学习受到越来越多学者的重视,基于卷积神经网络(Convolutional Neural Network,CNN)的多分类图像数据框架也得到了广泛应用。传统的基于卷积神经网络的多分类图像数据学习(MIF-CNN)普遍存在图像处理复杂、特征维数大、时间复杂度高等问题。针对这一问题,提出了一种基于CNN的交叉特征的多分类图像数据框架(MIF-CNNIF)。MIF-CNNIF是一种基于多种特征选择算法得到相交特征并以此交叉特征代替原特征集处理图像多分类任务的框架。在10个多类图像数据集上进行了丰富的对比实验,结果验证了MIF-CNNIF的有效性。MIF-CNNIF的贡献在于:1)使用预先训练好的CNN模型,避免了设置过多参数;2)与MIF-CNN相比,有效降低了特征维度和时间复杂度;3)具有比MIF-CNN更好的平均分类准确率;4)在多分类图像数据集上成功验证了组合特征算法的有效性。
参考文献
|
相关文章
|
多维度评价
Select
12.
有监督相似性保持的深度二阶哈希方法
张建新, 吴悦, 张强, 魏小鹏
计算机科学 2022, 49 (
11A
): 210900021-8. DOI:
10.11896/jsjkx.210900021
摘要
(
52
)
PDF(pc)
(4705KB)(
68
)
可视化
收藏
近年来深度哈希方法因其存储效率高和查询速度快的优势在大规模图像检索领域受到了广泛关注。为改善深度成对有监督哈希方法在图像检索上的性能,从提高深度哈希获取图像特征的全局性和同类样本相似性角度出发,提出了一种有监督相似性保持的深度二阶哈希方法。该方法采用成对样本图像进行特征建模,并利用协方差估计来捕获样本图像的深度二阶信息,以获取具有良好全局表达能力的深度二阶哈希码;在此基础上,借鉴类哈希近似二值化来解决哈希映射过程中的非凸性问题,以更好地避免量化误差,同时基于多损失函数集成思想构建类别监督和相似性保持的联合约束,进而采用交替迭代的优化方式实现网络的端到端训练,最终确定样本图像的最优哈希码。在3个通用数据集上进行了广泛的实验,结果有效表明了所提出有监督相似性保持的深度二阶哈希方法的有效性。
参考文献
|
相关文章
|
多维度评价
Select
13.
基于数据增强和监督均衡的鱼眼图像行人检测优化方法
司绍峰, 张赛强, 李庆, 陈本瑶
计算机科学 2022, 49 (
11A
): 210900070-6. DOI:
10.11896/jsjkx.210900070
摘要
(
72
)
PDF(pc)
(3277KB)(
65
)
可视化
收藏
近年来,由于鱼眼相机被广泛应用于智能监控领域,不少学者提出了针对鱼眼图像的行人检测算法。然而,鱼眼图像场景复杂且存在畸变,其导致的数据集样本分布和算法监督分配的不均衡问题会降低检测器性能。针对上述问题,首先提出了一种针对鱼眼图像行人检测任务的数据增强方法,该方法由模式采样增强和角度直方图增强两部分组成。其中模式采样增强专注于鱼眼图像难例样本挖掘,生成的新样本丰富了鱼眼图像中心附近的行人模式;角度直方图增强基于直方图均衡的思想,对鱼眼图像样本角度分布做平滑处理,缓解了检测器对单一场景的过拟合问题。此外,基于鱼眼图像Anchor-Free行人检测器,提出将定位质量预测与监督信息融合,将Focal Loss推广到连续域用以优化检测器定位分支的监督分配。实验结果表明,所提数据增强算法能够有效缓解鱼眼图像数据集的分布不均衡,在Anchor-Based和Anchor-Free检测网络上均展现了较好的效果;连续Focal Loss结合定位质量优化监督,在不增加Anchor-Free检测器推理计算复杂度的前提下,将整体性能提升了3.8%。
参考文献
|
相关文章
|
多维度评价
Select
14.
基于点云数据的交通环境下单阶段三维目标检测方法
车爱博, 张辉, 李晨, 王耀南
计算机科学 2022, 49 (
11A
): 210900079-6. DOI:
10.11896/jsjkx.210900079
摘要
(
70
)
PDF(pc)
(3342KB)(
61
)
可视化
收藏
文中在CIA-SSD单阶段三维目标检测模型的基础上,将模型中空间语义特征融合方式进行改进,通过一种基于注意力机制的多通道融合模块对两特征进行融合,提出了单阶段检测方法TFAF-SSD(Two-Feature Attentional Fusion Single-Stage object Detector),该方法主要由流形稀疏卷积网络提取点云的稀疏特征后,再由空间语义卷积层分别提取检测对象的空间语义特征,对融合后的输出特征进行预测,最后通过检测头输出最终的检测框。同时,文中还运用了不同于以往方法的数据增强方法,增强了模型的泛化性能,达到了提升检测精度的效果。在KITTI 3D公开数据集上进行了验证,在测试集中汽车检测方面得到了中等检测难度AP值为83.77%的检测结果,相比CIA-SSD模型的80.28%,所提方法提升了3.49%。
参考文献
|
相关文章
|
多维度评价
Select
15.
基于时空图卷积网络的语音驱动个人风格手势生成方法
张斌, 刘长红, 曾胜, 揭安全
计算机科学 2022, 49 (
11A
): 210900094-5. DOI:
10.11896/jsjkx.210900094
摘要
(
45
)
PDF(pc)
(2611KB)(
50
)
可视化
收藏
人们在发言时的手势动作往往具有自己独特的个人风格,研究者们提出了基于生成式对抗网络的语音驱动个人风格手势生成的方法,然而所生成的动作不自然,存在时序上动作不连贯的问题。针对该问题,文中提出了一种基于时空图卷积网络的语音驱动个人风格手势生成的方法,引入以时空图卷积网络为基础的时序动态性判别器,构建手势动作关节点之间空间和时间上的结构关系,并通过时空图卷积网络捕获手势动作关节点在空间上的相关性和提取时序上的动态性特征,使所生成的手势动作保持时序上的连贯性,以更符合真实手势的行为和结构。在Ginosar等构建的语音手势数据集上进行实验验证,与相关方法相比,正确关键点百分比指标提高了2%~5%,所生成的手势动作更自然。
参考文献
|
相关文章
|
多维度评价
Select
16.
基于多模态表示学习的情感分析框架
胡新荣, 陈志恒, 刘军平, 彭涛, 叶鹏, 朱强
计算机科学 2022, 49 (
11A
): 210900107-6. DOI:
10.11896/jsjkx.210900107
摘要
(
68
)
PDF(pc)
(2371KB)(
84
)
可视化
收藏
在多模态表示对整体损失的学习过程中,重构损失对模型的依赖性相对较小,导致隐含表示无法有效捕捉它们各自模态的细节。文中提出了一个基于多模态表示学习的多子空间情感分析框架。首先将每个模态投射到模态不变和模态特定两种不同的话语表示中,在模态不变表示中构建主共享子空间以及帮助该子空间减少模态差距的辅助共享子空间,在模态特定表示中构建私有子空间以捕获每个模态独有的特征,将所有子空间中的隐藏向量作为解码函数的输入并重构模态向量,以实现对重构损失的优化。然后,在融合阶段对每个模态表示执行基于Transformer的自注意力,使每个表示能从对整体情感取向具有协同作用的其他跨模态表示中获取潜在信息。最后,通过串联生成联合向量并利用全连接层生成任务预测。在两个公开数据集MOSI和MOSEI上的实验结果表明,该框架在大多数评价指标上都优于基线模型。
参考文献
|
相关文章
|
多维度评价
Select
17.
基于深度神经网络的块压缩感知图像重构
潘泽民, 覃亚丽, 郑欢, 王荣芳, 任宏亮
计算机科学 2022, 49 (
11A
): 210900118-9. DOI:
10.11896/jsjkx.210900118
摘要
(
98
)
PDF(pc)
(6444KB)(
70
)
可视化
收藏
压缩感知(CS)是根据由信号的线性投影获得的少量测量值有效地重建信号的一种信号处理框架,用低的采样率重构出高质量图像,是基于CS的计算成像实用化的持续挑战。图像重构模型的改进多是在信号稀疏约束下加入更多稀疏先验,其迭代优化过程复杂且耗时。神经网络作为深度学习的应用模型,可实现对任意复杂函数的逼近,为图像高质量实时重构提供了新的技术路线。文中用深度神经网络(DNN)进行重构,避免了CS繁杂的算法求解过程,且通过分块处理缩短了重构时间以及减少了网络节点数目,通过对上万幅不同类型的图像进行训练以得到DNN模型,再将分块CS的测量和DNN非线性求解联合来实现高效重构。结果表明,所提方法与6种不同的重构方法相比,图像的峰值信噪比(PSNR)和结构相似度(SSIM)都有不同程度的提高。与先进的CS算法相比,不仅重构质量能与之媲美,而且DNN极大减少了时间复杂度,重构时间在3s内。当采样率低至0.01时,该方法仍能较清晰地重构图像而其他算法难以恢复。当采样率为0.1时,该方法与先进的残差网络方法相比,PSNR最大(小)增益达到6.7(1.97)dB,SSIM最大(小)增益达到0.354(0.122)。
参考文献
|
相关文章
|
多维度评价
Select
18.
基于TK能量算子和包络融合的心音分割算法
张欣, 孙静, 杨宏波, 潘家华, 郭涛, 王威廉
计算机科学 2022, 49 (
11A
): 210900135-6. DOI:
10.11896/jsjkx.210900135
摘要
(
83
)
PDF(pc)
(2964KB)(
57
)
可视化
收藏
为了更有效地对心音按成分进行分割,实验采用一种基于Teager-Kaise能量算子(Teager-Kaise Energy Operator,TKEO)以及多包络特征融合的心音分割算法。首先,利用多尺度小波软阈值对PCG信号进行去噪,然后进行TKEO运算,由于TKEO对瞬时能量变化极其敏感,可以有效提取包络峰值,得到TKEO信号。其次,对TKEO信号提取归一化香农能量包络和维奥拉积分包络,计算出两者包络与TKEO信号之间的皮尔逊相关系数,根据相关关系进行融合。然后,用区间搜索法对包络进行峰值搜索,并且对搜索结果的方差进行比较。最后,根据S1和S2的最大持续时间消除伪峰。用PhysioNet-2016数据集对所提算法进行测试,实验结果显示平均精确度为0.922,证实了该算法能较有效地对心音信号进行分割,为临床环境下采集的心音信号的特征提取与分析提供了新方法。
参考文献
|
相关文章
|
多维度评价
Select
19.
基于心电信号的先心病肺动脉高压识别分类研究
韩宇森, 杨宏波, 孙静, 潘家华, 王威廉
计算机科学 2022, 49 (
11A
): 210900144-8. DOI:
10.11896/jsjkx.210900144
摘要
(
55
)
PDF(pc)
(5169KB)(
76
)
可视化
收藏
先天性心脏病相关性肺动脉高压(Pulmonary Arterial Hypertension,PAH)在临床上有着很高的发病率、致残率和病死率,其确诊主要采用右心导管测量平均肺动脉压,这种方法有创且操作性要求高,不便在筛查中采用,因此探索一种非介入式CHD-PAH智能辅助诊断方案意义重大。在先心病的基础上对CHD-PAH进行研究,从分析ECG入手,通过预处理、心拍分割、波形检测、特征提取、数据扩充、分类识别等手段对CHD-PAH进行建模预测。在Christov_segmenter算法基础上,利用差分阈值和局部峰值改进,检测QRS波、P波和T波,最后提取基于时间和幅度的双模态特征。为了拟合出最佳的分类模型,实验采用了支持向量机、随机森林及
K
邻近等分类器,并设计基于T分布的麻雀搜索算法改进支持向量机。实验共使用460段时长为20 s的1导联ECG信号进行训练和测试。实验结果表明,所提算法优化的支持向量机模型预测准确率、特异度和灵敏度分别可达99.76%,99.80%,99.73%。
参考文献
|
相关文章
|
多维度评价
Select
20.
R-YOLOv5:自动切割的旋转的文本检测模型
冉煜, 张莉
计算机科学 2022, 49 (
11A
): 210900185-6. DOI:
10.11896/jsjkx.210900185
摘要
(
72
)
PDF(pc)
(3223KB)(
106
)
可视化
收藏
YOLOv5模型是目前文本检测较好的模型之一,针对文本目标长度不一,文本轮廓难以精准检测以及受自然场景中文字倾斜、光影的影响文本较难检测的问题,提出了R-YOLOv5(Rotated-YOLOv5)文本检测模型。首先融入基于仿射算法的文本分割模型,将图片的文本区域等比例切割为多个单字符块,解决文本没有闭合轮廓导致的YOLOv5模型锚定框拟合效果不佳的问题;然后使用旋转卷积层、旋转池化层、改进锚定框,提出了加强角度学习的RIoU(Rotated Intersection over Union)损失函数,实现了文本旋转倾斜特征的提取。在ICDAR2019-LSVT上对原模型与改进后的模型进行实验,实验结果显示,R-YOLOv5检测效果有较明显的提升,但由于模型层数加深,训练速率与检测速率相比原模型有小幅降低。相比其他模型,由于YOLOv5自身的优点,R-YOLOv5的检测效果与检测速度均远好于其他模型。
参考文献
|
相关文章
|
多维度评价
Select
21.
基于少样本的太阳射电爆发事件检测研究
郭军成, 万刚, 胡欣杰, 王帅, 严发宝
计算机科学 2022, 49 (
11A
): 210900198-7. DOI:
10.11896/jsjkx.210900198
摘要
(
54
)
PDF(pc)
(4433KB)(
57
)
可视化
收藏
太阳射电爆发事件与多种太阳活动紧密相关,对不同类型的射电爆发事件进行研究有助于提高对太阳活动物理机制的理解,加强对空间天气的判读能力。为解决以往传统射电爆发事件检测方法存在的样本数据量小、检测速度慢、定位准确度低、人为因素干扰大等问题,文中提出采用基于深度学习的少样本目标检测方法对太阳射电频谱图中的不同射电爆发事件进行自动识别和定位。首先,由于目前缺乏公开的射电爆发事件检测数据集,基于美国绿岸太阳射电爆发频谱仪所观测到的射电频谱数据,构建了具有3种爆发类型、共745张图像的少样本目标检测数据集;然后,利用基于迁移学习的少样本学习方法解决了射电爆发事件检测数据集样本量少的问题。实验结果表明,所提方法具有可行性和有效性。
参考文献
|
相关文章
|
多维度评价
Select
22.
基于动态金字塔和子空间注意力的图像超分辨率重建网络
何鹏浩, 余映, 徐超越
计算机科学 2022, 49 (
11A
): 210900202-8. DOI:
10.11896/jsjkx.210900202
摘要
(
97
)
PDF(pc)
(4660KB)(
81
)
可视化
收藏
针对现有单图像超分辨率卷积神经网络存在模型参数过多以及重建失真过大的问题,提出了一种基于动态金字塔结构与子空间注意力模块的轻量级单图像超分辨率网络模型。首先,所采用的动态多尺度金字塔特征组合模块的网络主体由动态卷积和金字塔分组卷积构成。其次,动态卷积可以根据不同的图像内容自适应地进行不同的卷积操作,从而对不同的图像提取出不同的特征;金字塔分组卷积不仅可以更好地提取多尺度图像特征信息,而且能够有效降低网络模型的参数量。最后,在网络模型末端采用子空间注意力模块,将图像的通道空间分为多个子空间,并为每个子空间学习不同的注意力图,这样不仅可以更好地捕获图像的跨通道相关信息,而且可以有效融合各子空间的图像特征信息。与现有主流算法相比,所提方法不仅具有更小的网络模型参数量,而且重建出的超分辨率图像在视觉效果和定量分析方面均能取得更好的表现。
参考文献
|
相关文章
|
多维度评价
Select
23.
改进型FCOS目标检测算法
陈金令, 程茂凯, 徐紫涵
计算机科学 2022, 49 (
11A
): 210900220-6. DOI:
10.11896/jsjkx.210900220
摘要
(
89
)
PDF(pc)
(3434KB)(
76
)
可视化
收藏
针对经典无锚框目标检测算法FCOS( Fully Constitutional One-Stage Object Detection)难以充分提取目标特征,位置与内容信息结合能力不足,正负样本区分不充分导致性能减弱等问题,提出了一种改进型FCOS目标检测算法。该方法首先在ResNet50特征提取网络中加入可变形卷积模块与全局注意力模块,提高特征信息捕获能力;然后,将FPN特征金字塔与深层链路层相结合,构成多尺度特征融合模块,提升特征提取效果。最后,加入自适应划分正负样本模块,增强检验框的准确性以达到提高回归精度的效果,从而提升检测结果。为了测试算法的检测效果,分别使用了COCO数据集与VOC数据集进行实验。与原FCOS算法相比,所提算法在两个数据集上的平均精度分别提高了2.3%和1.8%,其中,对COCO数据集中的小目标检测的效果有明显提升。
参考文献
|
相关文章
|
多维度评价
Select
24.
基于改进GMS特征匹配算法的浮选泡沫移动速度特征提取
刘惠中, 余华富, 彭志龙
计算机科学 2022, 49 (
11A
): 211000064-6. DOI:
10.11896/jsjkx.211000064
摘要
(
53
)
PDF(pc)
(5852KB)(
73
)
可视化
收藏
矿物浮选过程中,浮选泡沫移动速度与浮选过程的控制之间存在着较大的关联性,如能实时准确地获取泡沫移动速度等动态特征可以为浮选过程的液位、加药量、充气量等控制参数的优化调整提供依据。为了有效地获取浮选泡沫的移动速度,文中提出了一种基于改进GMS特征匹配算法的浮选泡沫移动速度特征提取方法。首先采用ORB算法提取并描述泡沫的特征点,再利用GMS特征匹配算法完成特征点对的快速匹配,在以上基础上再利用RANSAC算法对特征匹配结果中存在的误匹配点进行剔除,最后通过计算泡沫特征点的位移进而得到泡沫移动速度。经过对采集到的工业图像数据进行应用测试表明,所提算法不但解决了传统算法在浮选泡沫图像特征提取中存在误匹配点多的问题,还有效提升了浮选泡沫特征提取的效率和稳定性。
参考文献
|
相关文章
|
多维度评价
Select
25.
基于多模态注意力的噪声事件分类模型
吴贺祥, 王中卿, 李培峰
计算机科学 2022, 49 (
11A
): 211000161-7. DOI:
10.11896/jsjkx.211000161
摘要
(
57
)
PDF(pc)
(2588KB)(
73
)
可视化
收藏
如今,社交媒体因其低成本、易于访问和快速传播而成为人们获取新闻资讯和了解实时事件的主要渠道之一。社交媒体为分析特定事件提供了包含文本和图像等多种模态的信息,这其中包含了大量无关事件和虚假信息。为此,结合文本-图像对来判断文本和图像是否提供了与特定事件相关的信息,从而筛选出与之无关的噪声事件。由于文本中的描述往往与相对应的图像中的情景相关联,因此提出了一个基于多模态注意力的结合文本和图像信息的方法进行事件分类。该方法能很好地关注到文本和图像中的重要信息并促进不同模态的信息交互。在CrisisMMD数据集上的实验结果表明,该方法优于6种强的基线方法,证明了所提多模态注意力模型能够有效融合不同模态的特征,得到更优的联合表示。
参考文献
|
相关文章
|
多维度评价
Select
26.
基于子空间特征相互学习的MRI与PET/SPECT图像融合
张瑛, 聂仁灿, 马朝振, 余仕双
计算机科学 2022, 49 (
11A
): 211000171-6. DOI:
10.11896/jsjkx.211000171
摘要
(
52
)
PDF(pc)
(3470KB)(
52
)
可视化
收藏
在医学图像中,MRI图像提供包含细节的纹理结构信息和较好的分辨率,而PET/SPECT图像保留了分子活性信息以及颜色功能信息,因此,将它们进行融合是一项重要的任务。大部分现有的方法在融合过程中存在颜色失真、模糊和噪声等问题。为此,提出了一种新的基于子空间注意力孪生自编码网络(Subspace Attention-Siamese Auto-encoding Network,SSA-SAEN)来融合MRI和PET/SPECT图像中有意义的信息。在图像融合网络中提出SSA-SAEN,引入了子空间特征相互学习概念,利用子空间注意力模块,使MRI和PET/SPECT图像能够在学习自己特征的同时互相学习彼此的特征,同时减少信息冗余,保证高效、完整的特征提取。此外,通过条件概率模型对所提取的特征进行互补融合,同时将加权保真项、梯度损失项加入到训练网络中,以达到网络优化的目的。在公共数据集上进行的大量定性和定量实验表明,该方法能够得到一幅清晰的融合图像,表明了该方法与其他先进方法相比的优越性和有效性。
参考文献
|
相关文章
|
多维度评价
Select
27.
基于点云的室内结构三维重建综述
任飞, 常青玲, 刘兴林, 杨鑫, 李敏华, 崔岩
计算机科学 2022, 49 (
11A
): 211000176-11. DOI:
10.11896/jsjkx.211000176
摘要
(
75
)
PDF(pc)
(3577KB)(
70
)
可视化
收藏
室内结构三维重建本质上是一个还原室内布局的多任务问题,可以进一步对墙体细节和家具进行重建和语义分割。主要介绍基于点云数据的室内结构三维重建。首先概述了室内结构三维重建常用的数据集;然后对基于点云的室内结构3维重建的主要方法展开叙述和讨论,并分析总结了3种类型重建方法的优缺点;最后对当前室内结构三维重建研究所面临的困难和挑战进行阐述,并对未来的研究趋势做出展望。可以得出,目前大部分重建模型所针对的场景和完成任务的多样性较为贫乏,利用不同角度的冗余信息共同优化的多任务协调方案在室内结构重建中具有较大潜力。此外,模型对于室内外环境的无缝融合以及实现内外建筑的充分表现仍需要进行改善。
参考文献
|
相关文章
|
多维度评价
Select
28.
基于面部视频的非接触式心率检测方法研究
曾梓琳, 胡志刚, 尚鹏, 王新征, 付东辽
计算机科学 2022, 49 (
11A
): 211000182-6. DOI:
10.11896/jsjkx.211000182
摘要
(
54
)
PDF(pc)
(3134KB)(
51
)
可视化
收藏
基于视频的非接触式面部心率检测易受到环境光和运动伪迹的干扰,检测心率结果的准确度低。针对上述问题,提出了一种集合经典模态分解(Ensemble Empirical Mode Decomposition,EEMD)和标准欧几里得距离相结合的自适应阈值化去噪方法,降低了外界干扰,提高了准确度。首先从视频录制的RGB图像模型中选取绿色(G)通道像素均值作为PPG(Photo Plethysmo Graphy)信号,然后用滤波器对信号进行预处理,消除心率范围外的信号;然后将EEMD与标准欧几里得距离相结合,对固有模态函数进行阈值化处理并重构;最后用傅里叶变换进行功率谱分析来计算心率值。实验结果表明,与基于小波变换和基于自适应集合经典模态分解的方法相比,所提方法在非接触式面部心率检测去噪中有更好的稳定性和准确性,提高了心率检测的鲁棒性,适用于日常非接触式实时心率监测。
参考文献
|
相关文章
|
多维度评价
Select
29.
基于LFBank与FBank混合特征的声纹识别研究
崔琳, 王芷悦
计算机科学 2022, 49 (
11A
): 211000194-5. DOI:
10.11896/jsjkx.211000194
摘要
(
55
)
PDF(pc)
(2144KB)(
56
)
可视化
收藏
语音特征提取是声纹识别过程中的重要步骤,对于声音频率的分布男性与女性差距较大,但现有的特征提取算法并没有针对不同性别声音频率特性做出相应改进。针对上述问题,提出了为女性声纹识别所设计的语音特征提取算法LFBank,将线性滤波器组用于特征提取过程,利用其线性分布的特点弥补传统梅尔滤波器组提取高频区域信息时的不足。另一方面,为了突破单一性别局限,拓宽应用场景,综合线性滤波器组与梅尔滤波器组的优势,将LFBank与FBank特征结合得到混合特征向量进行声纹识别。将LFBank和常用特征FBank与MFCC进行实验对比,实验结果表明,基于线性滤波器组的特征向量在识别女性声音时更有优势。对于混合特征而言,在与单一特征的对比实验中,混合特征能够达到比单一特征更好的识别效果,具有更广泛的应用场景。
参考文献
|
相关文章
|
多维度评价
Select
30.
基于注意力机制的糖尿病视网膜病变分类算法
孙福权, 邹彭, 崔志清, 张琨
计算机科学 2022, 49 (
11A
): 211000213-5. DOI:
10.11896/jsjkx.211000213
摘要
(
54
)
PDF(pc)
(2986KB)(
49
)
可视化
收藏
糖尿病视网膜病变是糖尿病的重要并发症之一,是工作人群失明的主要原因。视网膜图像类间差距小,易混淆,由于医疗资源不足和缺乏有经验的眼科医生,难以进行大规模的视网膜图像筛查。为此,提出了一种基于注意力机制的糖尿病视网膜病变分类算法,实现对视网膜图像病变程度的精确分类。对数据集进行数据增强和图像增强等预处理操作,利用EfficientNetV2作为主干分类网络,在网络中加入注意力机制对视网膜图像进行细粒度分类,同时采用迁移学习策略对网络进行训练。所提算法的分类准确率和二次加权Kappa值分别为97.8%和0.843,能够有效地对视网膜图像进行病变程度分类,与其他模型相比具有优越性,对于糖尿病视网膜病变的诊断和治疗具有重要意义。
参考文献
|
相关文章
|
多维度评价
首页
| 前页|
后页
|
尾页
第1页 共4页 共94条记录