栏目文章

Select

1. 计算机视觉在轨道交通中的应用

赵斌贝, 朱力, 赵红礼, 李雨彤

计算机科学 2026, 53 (3): 214-224. DOI: 10.11896/jsjkx.250400009

摘要（58）

PDF（pc）（3295KB）（190）

轨道交通系统作为交通网络的骨干,因具有高效、便捷的特点,在现代社会中扮演着至关重要的角色。随着技术的持续进步,计算机视觉技术已成为推动轨道交通系统向更高效和更可靠发展的关键因素。对此,深入探讨了计算机视觉技术在轨道交通领域的研究现状,评估了该技术对提升运输效率和安全性的重要贡献,并分析了在实际应用中遇到的挑战以及可能的改进方向。从车站安全检测、轨道安全检测和车体状态检测这3个应用方向,分析了计算机视觉技术的应用内容以及当前研究的发展方向。最后,对未来发展趋势进行了展望,预测了计算机视觉技术将如何进一步推动轨道交通系统的自动化、智能化,以及在保障数据安全的前提下,为轨道交通领域带来更多创新和突破。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于三维高斯溅射的低码率实时多视点视频流传输

王义总, 宁泓博, 王昊峰, 马思伟, 高文

计算机科学 2026, 53 (3): 225-230. DOI: 10.11896/jsjkx.250700104

摘要（61）

PDF（pc）（2502KB）（208）

多视点视频能够为用户提供沉浸式体验并支持多种应用,但其传输带宽需求远高于传统视频。现有多视点编码算法主要利用二维视点间的冗余信息,未考虑三维空间冗余。为此,提出一种多视点视频流传输方法,将多视点视频转换为稀疏视点紧凑表示来降低三维空间冗余,并基于该表示在接收端进行三维重建,合成剩余视点。具体包括:1)提出一种基于稀疏视点的多视点视频紧凑表示,利用三维高斯重建与溅射合成剩余视点;2)设计视点选择方法,以优化合成视点的视觉质量。实验表明,提出的系统相比基线方法可降低至少44.6%的码率,同时支持端到端30 FPS以上的实时传输。

参考文献 | 相关文章 | 多维度评价

Select

3. 关联策略多特征增强的多目标跟踪

陈云芳, 方倩, 吕尊威, 张伟

计算机科学 2026, 53 (3): 231-239. DOI: 10.11896/jsjkx.241100094

摘要（59）

PDF（pc）（3244KB）（208）

在复杂场景下,多目标跟踪面临密集的目标遮挡、目标非线性运动、关联匹配算法欠佳导致身份匹配错误以及频繁的身份切换等问题。对此,以ByteTrack为基线算法,充分利用现有的判别性特征,从运动模型、弱特征数据关联、匹配算法3个方面对其关联策略进行改进,提出了一种关联策略多特征增强的多目标跟踪算法。首先,针对常规卡尔曼滤波难以对非线性运动的目标位置进行预测的问题,利用预测相似度以及检测置信度动态调整卡尔曼滤波的噪声协方差,提升运动模型对位置预测的准确性。其次,整合二次关联算法,在低置信度检测框和第一次关联后未匹配的轨迹之间,执行弱特征数据关联,减少其与轨迹之间的匹配错误。最后,针对低置信度检测目标,利用相对深度对检测目标以及轨迹进行分解,并采用级联匹配算法进行关联,有效减少IoU匹配碰撞,提高了算法在密集遮挡场景下的跟踪表现。在MOT17与MOT20测试集上,所提算法的HOTA分别为64.5%与63.2%,与基线算法相比,所有评估指标均取得显著提升。

参考文献 | 相关文章 | 多维度评价

Select

4. 协同汇聚点内线束平滑布局方法

高景一, 罗睿明, 罗月童

计算机科学 2026, 53 (3): 240-245. DOI: 10.11896/jsjkx.250300101

摘要（54）

PDF（pc）（2722KB）（178）

随着电气化和智能化的不断发展,飞机、汽车等产品中的线束越来越多且复杂,布局安装也越来越困难。众多线束通过一系列被称为卡箍的汇聚点进行安装,一根线束会通过多个汇聚点,一个汇聚点包含多根线束。如果线束在汇聚点内的布局不合理,就可能导致线束之间产生交叉、扭转等问题,不满足线束平滑要求。目前主要由工程师根据经验手工调整汇聚点内线束的布局,但因为汇聚点多,且汇聚点之间相互影响,所以手工调整不仅工作量大,而且难以获得最优效果。针对这个问题,提出协同汇聚点内线束平滑布局算法。该方法首先把多汇聚点内线束布局转换为一组优化问题,通过优化求解获得满足平滑性要求的初步布局;对线束平滑问题进行数学建模,运用优化算法获得线束在所有汇聚点内的布局,保证线束的平滑性;然后提出保布局的线束紧凑算法,在保持线束平滑性的基础上,对汇聚点内的线束进行紧凑布局,以节约安装空间,提升线束稳定性。该算法已应用于合作方产品,合成案例与实际案例的测试结果展示了其有效性。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于改进YOLO算法的学生行为检测方法

王鑫钰, 高东怀, 宁玉文, 许浩, 齐浩楠

计算机科学 2026, 53 (3): 246-256. DOI: 10.11896/jsjkx.241100165

摘要（73）

PDF（pc）（5717KB）（214）

为了解决课堂情景下学生行为检测因尺度变化大、遮挡严重、计算负担大而难以大范围普及等问题,提出了一种基于改进YOLOv8的轻量化学生课堂行为检测方法BDEO-YOLO。首先,在YOLOv8n的基础上引入动态卷积(Dynamic Convolution)对YOLOv8中的C2f模块进行改进,增强了模型对课堂复杂场景的适应性和特征表达能力。其次,通过结合双向特征金字塔网络(Bidirectional Feature Pyramid Network,BiFPN)和全局局部空间聚合(Global-to-Local Spatial Aggregation,GLSA)模块,优化了模型的多尺度特征融合能力,在模型的Backbone部分引入了高效局部注意力(Efficient Local Attention,ELA)机制,增强了模型对小目标和细节特征的检测能力。最后,设计了轻量化的检测头one13结构,简化了特征提取过程,大幅降低了模型的计算负担。在公开数据集STBD-08上的实验结果表明,BDEO-YOLO模型的mAP达到92.2%,比原始YOLOv8n提高了1.3个百分点,计算量从8.1 GFLOPs降低至4.8 GFLOPs,比原模型降低了40.7%,模型大小仅有5.7MB,验证了轻量化设计的有效性。在公开数据集SCB-Dataset3和VOC2007上进行验证,改进后的算法在各项性能指标上均有所提升,验证了模型的泛化能力,其在处理课堂中的遮挡、尺度变化和光照变化等问题上表现出较高的鲁棒性。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于多粒度特征聚合与二分搜索的高效多视图立体重建

许立君, 赵宇杰, 赵敏, 马为駽, 陈侃松

计算机科学 2026, 53 (3): 257-265. DOI: 10.11896/jsjkx.250200094

摘要（60）

PDF（pc）（3817KB）（195）

在基于深度学习的多视图立体重建方法中,代价体构建面临高计算复杂度和内存消耗的挑战。现有研究多采用级联架构或迭代优化方法降低内存消耗,但级联架构的粗到细采样策略可能导致细节信息丢失,削弱关键特征感知能力。为此,提出了一种基于级联结构的二分搜索与多粒度特征聚合的多视图立体网络框架。该框架通过级联架构减少内存占用,利用二分搜索策略将深度范围划分为多个预选区域,并通过离散分类方法压缩深度值搜索空间,提高深度检索效率并降低内存需求。此外,提出了多粒度特征信息聚合策略,将粗粒度全局语义信息嵌入细粒度代价体构建中,同时关注细粒度局部纹理信息。通过融合不同层次的特征表示,并在聚合模块中引入视图内自适应聚合和逐视图自适应加权策略,增强了模型对全局结构和局部细节特征的感知能力。实验结果表明,在DTU和Tanks & Temples公共数据集上,此方法在保持低内存消耗的同时,实现了优异的点云重建效果。

参考文献 | 相关文章 | 多维度评价

Select

7. 融合ByteTrack的EAP-YOLOv8无人机Marker点检测与追踪

唐心亮, 潘晓润, 王建超, 苏鹤

计算机科学 2026, 53 (3): 266-276. DOI: 10.11896/jsjkx.241100115

摘要（67）

PDF（pc）（4767KB）（220）

随着科技不断发展,无人机的应用越来越广泛,实现无人机的精准动作捕捉成为其核心技术。光学动作捕捉系统在对无人机进行检测与追踪时,由于受到复杂环境、飞行速度等多方面的干扰,会出现对无人机所粘贴的Marker点识别不准确的情况。为了解决这一问题,提出一种基于YOLOv8改进的目标检测算法EAP-YOLOv8,以提高Marker点识别检测的准确率。首先,在骨干部分构建新型通道注意力机制MAP-ECA,增强全局视角信息和不同尺度大小的特征,提升了小目标的检测能力;其次,在原有检测头的基础上利用多层次自适应特征融合形成新的检测头D-SASFF,利用多尺度融合来强化小目标特征信息;最后,设计了损失函数PIoUv3,通过改进加快了模型收敛速度,提高了小目标检测能力。为验证EAP-YOLOv8算法的有效性,在自制数据集上进行实验,结果表明,EAP-YOLOv8算法在mAP@0.5和mAP@0.5:0.95上分别达到了96.5%和50.2%,相较于其他算法有显著提升。在此基础之上,通过结合多目标追踪算法ByteTrack显著提高了Marker点的追踪准确率。此外,在公开数据集MOT16上进行追踪实验,结果表明,所提模型在HOTA,MOTA,MOTP上追踪准确率分别达到了37.60%,25.64%,80.76%,相较于当前算法有显著提升,为后续实现无人机精准跟踪提供了有效途径。

参考文献 | 相关文章 | 多维度评价

Select

8. CA-SFTNet:基于空间特征变换和浓缩注意力机制的皮肤病灶分割模型

张伟, 梁敦英, 周婉婷, 程祥

计算机科学 2026, 53 (3): 277-286. DOI: 10.11896/jsjkx.250200049

摘要（70）

PDF（pc）（4007KB）（216）

针对皮肤病灶边缘模糊、毛发等噪声导致的分割病灶区域不完整、病灶特征分布差异较大等问题,基于U-Net提出一种结合浓缩注意力机制和残差空间特征变换的皮肤病灶分割算法CA-SFTNet。首先,在模型下采样过程中进行特征切分,保留皮肤病灶浅层语义信息。其次,在跳跃连接处引入浓缩注意力机制(Condensed Attention Neural Block),使得模型能够聚焦于病灶区域,提高分割精度。最后,在模型尾部加入残差空间特征变换层(Residual Spatial Feature Transformation Layer),增强对皮肤病变图像不同区域的自适应调整能力,提高模型对特征分布差异较大病灶的识别能力。实验在ISIC2017和ISIC2018数据集上进行,结果表明,CA-SFTNet在分割性能上优于传统U-Net,Dice系数分别达到93.12%和92.36%,比U-Net提升7.15个百分点和4.81个百分点;IoU值分别为82.59%和82.31%,比U-Net提升6.23个百分点和4.45个百分点。相比TransUNet和Swin-UNet等拓展算法,Dice系数提升2~6个百分点,IoU值提升1.8~4个百分点。这些结果证明了改进算法在皮肤病变区域分割上的优越性,其能够有效提高分割精度。

参考文献 | 相关文章 | 多维度评价

Select

9. 基于少量目标数据和深度学习的行人重识别方法

付昱凯, 李庆珍, 董志学, 师冬丽, 赵鹏

计算机科学 2026, 53 (3): 287-294. DOI: 10.11896/jsjkx.260100073

摘要（63）

PDF（pc）（3158KB）（184）

行人重识别(ReID)在跨摄像头检索场景中具有重要的应用价值,但深度模型在真实部署时常面临显著的域偏移问题,即在源域数据集上训练良好的模型迁移到新的目标摄像头网络后性能大幅下降。现有无监督域自适应方法通常依赖大量目标域未标注数据进行离线聚类,但在临时部署、隐私受限或目标数据难以提前收集的情况下,该前提往往难以满足。针对此问题,提出一种基于少量目标数据的深度行人重识别适配框架,以源域预训练模型为起点,冻结主干参数,仅引入轻量参数高效适配模块进行目标域校准;同时采用基于原型的稳定小样本决策,将少量目标标注样本聚合为类中心,以减少小样本噪声;并结合原型分类损失和排序约束共同优化,兼顾目标域适应能力与特征稳定性。在 Market-1501 与 DukeMTMC-reID 的跨数据集迁移实验中,所提方法在两个迁移方向均取得显著的性能提升。在 Market→Duke 上mAP和Rank-1分别达到 79.68%和 93.10%,在 Duke→Market 上mAP和Rank-1分别达到 76.07% 和 93.79%,并在逐轮增量适配中表现出持续的性能提升趋势。该方法能够在不依赖大规模目标数据的前提下实现有效且可迭代的跨域适配。

参考文献 | 相关文章 | 多维度评价