1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心

热点文章推荐更多...

  • 2024年第7期, 刊出日期:2024-07-15
      
      计算机软件
      基于主题一致性保持和伪相关反馈库扩展的缺陷报告重构方法
      刘文杰, 邹卫琴, 蔡碧瑜, 陈冰婷
      计算机科学. 2024, 51 (7): 1-9.  doi:10.11896/jsjkx.230400069
      摘要 ( 118 )   PDF(2017KB) ( 297 )   
      参考文献 | 相关文章 | 多维度评价
      为了加快开发人员定位软件缺陷,研究人员提出了一系列基于文本检索的缺陷定位技术,自动为用户所提交的缺陷报告推荐可疑的代码文件。由于用户的专业知识不同,编写的缺陷报告质量不一致,因此某些低质量的缺陷报告无法被成功定位。对低质量的缺陷报告进行重构从而改进其定位效果,是常见的解决方案。现有基于查询扩展和查询缩减的主流重构方法,容易出现重构前后查询主题不一致或所依赖伪相关库质量差导致重构质量低的问题。对此,提出了一种基于主题一致性保持和伪相关反馈库扩展的缺陷报告重构方法,由主题一致性保持的查询缩减阶段和伪相关反馈库扩展的查询扩展阶段两部分组成。查询缩减阶段将缺陷报告的概要问题描述和从问题描述文本中提取的关键词合并来解决主题不一致性问题;查询扩展阶段综合使用多种定位工具(即 Lucene,BugLocator 和 Blizzard)来获得伪相关反馈库,并从中提取查询扩展关键词,以解决现有伪相关反馈库质量差导致的重构质量低的问题;最后将查询缩减和扩展阶段的输出合并得到重构后的查询。通过在6个 Java 项目上进行实验发现,对于使用现有缺陷定位方法无法在TOP 10可疑推荐文件中定位的低质量缺陷报告,使用所提重构方法后,能定位其中21%~39%的缺陷即Accuracy@10,MRR@10为 10%~16%。对比现有重构技术,所提重构方法在Accuracy@10和MRR@10 两个指标上分别可以提升7%~32%和2%~13%。
      面向ARINC653操作系统的综合化航空电子软件代码自动生成方法
      凌仕翔, 杨志斌, 周勇
      计算机科学. 2024, 51 (7): 10-21.  doi:10.11896/jsjkx.230600216
      摘要 ( 66 )   PDF(5909KB) ( 210 )   
      参考文献 | 相关文章 | 多维度评价
      综合化航空电子系统(Integrated Modular Avionics,IMA)是一类典型的安全关键系统,具有分布式、异构、计算资源和物理资源强耦合等特征。随着IMA系统趋于复杂化和智能化,系统的功能越来越多地采用软件来实现,如何对这类复杂软件进行建模并自动生成代码成为一个重要挑战。文中提出了一种基于AADL(Architecture Analysis and Design Language)的综合化航空电子系统代码生成方法。首先,提出HMC4ARINC653(Heterogeneous Model Container for ARINC653)属性集扩展,使其具备描述IMA软件架构、异构功能行为和非功能属性的能力;其次,提出IMA模型到C代码及ARINC653系统配置文件的映射规则,并遵守MISRA C安全编码规范,生成的代码能够在ARINC653操作系统上部署并仿真执行;最后,设计并实现了相应的原型工具,以ARINC653操作系统和工业界实际案例,验证了所提方法和工具的有效性。
      基于特征重要性的深度学习自动调度优化研究
      杨恒, 刘勤让, 范旺, 裴雪, 魏帅, 王轩
      计算机科学. 2024, 51 (7): 22-28.  doi:10.11896/jsjkx.230500220
      摘要 ( 92 )   PDF(3355KB) ( 203 )   
      参考文献 | 相关文章 | 多维度评价
      随着深度学习和硬件架构的快速发展,模型和硬件架构的多样性导致采用手工优化方式实现深度学习模型的高性能部署面临严峻的挑战,因此现有的AI编译器框架通常采用自动调度的方法来实现这一过程。但是已有的TVM自动调度优化方法中存在着代价模型数据集不平衡以及调度时间过长的问题,为了解决这些问题,提出了一种基于特征重要性的自动调度优化方法。首先采用xgboost算法对特征重要性进行分析,然后基于重要性系数降低特征维度并对数据标签值进行重分配,以实现提高代价模型精度和优化自动调度效率的目的。实验结果表明,应用所提优化方法,使3种深度学习模型的自动调度时间缩短了9.7%~17.2%,推理时间最多缩短了15%。
      基于自然语言需求的SCADE模型测试用例自动生成方法
      邵温欣, 杨志斌, 李维, 周勇
      计算机科学. 2024, 51 (7): 29-39.  doi:10.11896/jsjkx.230600126
      摘要 ( 70 )   PDF(5067KB) ( 203 )   
      参考文献 | 相关文章 | 多维度评价
      随着安全关键软件规模和复杂性不断增加,模型驱动开发方法在安全关键领域得到了广泛应用。SCADE作为一种重要的建模方法和工具,能够表达确定性并发行为且具有精确时间语义等特性,适用于安全关键软件的建模、测试与验证。目前,已有方法主要采用手工方式构造SCADE模型测试用例,存在需求与测试用例不一致、成本代价高且容易出错的问题。文中提出了一种基于自然语言需求的SCADE模型测试用例自动生成方法。首先,给出了基于模型检测的测试用例自动生成方法,通过自然语言需求处理生成原子命题,用于生成前提假设Assume和观察者模型,同时给出了陷阱性质(Trap Properties) 生成规则来生成陷阱性质用于模型检测;其次,给出了基于覆盖分析和变异测试的测试用例质量评估方法,并在SCADE模型上进行变异测试;最后,设计和实现了原型工具,并基于一个工业界案例飞行员弹射座椅控制系统进行了案例分析,验证了所提方法的有效性。
      数据库&大数据&数据科学
      结构化数据库查询语言智能合成技术研究进展
      刘雨蒙, 赵怡婧, 王碧聪, 王潮, 张宝民
      计算机科学. 2024, 51 (7): 40-48.  doi:10.11896/jsjkx.231000143
      摘要 ( 40 )   PDF(1772KB) ( 126 )   
      参考文献 | 相关文章 | 多维度评价
      近年来,随着大数据、云计算等技术的飞速发展,大规模数据的产生使得各类应用对于数据库技术的依赖日益加深。然而,传统的数据库一般采用形式化的数据库查询语言SQL进行操作,对无编程经验或数据库使用经验的用户来说,复杂SQL语法难度较高,降低了各个领域数据库应用者的便捷程度。近年来,机器学习、深度神经网络等人工智能技术的飞速发展,尤其是ChatGPT横空出世引发的大语言模型技术热潮,驱动了数据库与人工智能的深度结合与技术变革。通过智能方法将用户输入语言自动化合成SQL语言,以满足不同程度数据库使用者的操作需求,提升数据库的智能性、环境适应性及用户友好性。为全面聚焦数据库查询语言智能合成技术的最新研究进展,从范例输入、文本输入及语音输入这3类用户输入切入,详细阐述各类智能合成模型的研究脉络、代表性工作及最新进展,同时对各类方法的技术框架进行归纳与对比,最后对全文进行全面性的总结,并针对现有方法存在的问题和挑战展望未来发展方向。
      城市大数据认知计算研究与应用进展
      刘伟, 孙佳, 王鹏, 陈亚繁
      计算机科学. 2024, 51 (7): 49-58.  doi:10.11896/jsjkx.221200039
      摘要 ( 38 )   PDF(2006KB) ( 154 )   
      参考文献 | 相关文章 | 多维度评价
      城市大数据为城市运行状态估计与综合决策提供理论与行动支撑,而其多源异构、耦合度低及动态变化等特点给传统的集成分析带来极大挑战。认知计算适用于时变多维、复杂多样数据的分析与挖掘,并可对问题进行自适应学习与进化,是解决城市大数据问题的重要途径。文中以城市大数据为背景,根据城市大数据的不同类型结构等特点,针对性地按照认知流程的4个环节对相应处理方法进行归纳,并进一步从知识驱动、数据驱动以及知识与数据协同驱动的角度,对上述具体方法进行概念级分类。最终形成城市大数据认知流程中不同驱动方式的方法间有机协同,从感知理解到决策行为的城市大数据认知闭环。同时从应用领域多角度综述了城市大数据认知计算的研究与发展现状。最后讨论了认知计算在城市大数据建设领域面临的挑战,并对未来发展趋势和研究方向进行了思考和展望。
      SVM样本约简算法研究综述
      张代俐, 汪廷华, 朱兴淋
      计算机科学. 2024, 51 (7): 59-70.  doi:10.11896/jsjkx.230400143
      摘要 ( 39 )   PDF(1611KB) ( 130 )   
      参考文献 | 相关文章 | 多维度评价
      支持向量机(Support Vector Machine,SVM)是基于统计学习理论和结构风险最小化原则发展起来的一种有监督的机器学习算法,它有效克服了局部最小和维数灾难等问题,具有良好的泛化性能,并被广泛应用于模式识别和人工智能领域。但SVM的学习效率随着训练样本数量的增加而显著降低,对于大规模训练集,采用标准优化方法的传统SVM面临着内存需求过大、执行速度慢,有时甚至无法执行的问题。为了缓解SVM在大规模训练集上存储需求高、训练时间长等问题,学者们提出了SVM样本约简算法。文中首先介绍了SVM理论基础,然后从基于聚类、几何分析、主动学习、增量学习和随机抽样5个方面系统综述了SVM样本约简算法的研究现状,讨论了各种SVM样本约简算法的优缺点,最后总结全文并展望未来。
      基于TCN-A模型的高效查询负载预测算法
      白文超, 白淑雯, 韩希先, 赵禹博
      计算机科学. 2024, 51 (7): 71-79.  doi:10.11896/jsjkx.231100200
      摘要 ( 32 )   PDF(3439KB) ( 149 )   
      参考文献 | 相关文章 | 多维度评价
      针对大数据查询领域中出现的由于查询负载随时间动态变化且难以有效预测所导致的数据库管理系统无法及时优化的问题,提出了一种基于新型时间序列预测模型的查询负载预测算法。首先,该算法采用过滤、时域间隔划分以及查询负载构造等技术对原始的历史用户查询进行预处理,得到便于网络模型分析处理的查询负载序列。其次,所提算法以时间卷积神经网络为核心构建时序预测模型,提取查询负载数据的历史变化趋势及自相关性特征,高效地实现时序预测;同时,融入设计的时域注意力机制,对查询负载序列进行重要性加权,保证模型的分析计算效率,提升算法的预测性能。最后,基于上述时序预测模型,充分利用查询间隔时间完成对未来查询负载的精确预测,使得数据库管理系统得以预先实现自身性能调优,以适应工作负载的动态变化。实验结果表明,设计的查询负载预测算法在多个评价指标中均表现出良好的预测性能,并且能够在查询时间间隔内更加精确地预测未来查询负载的变化。
      融合Dead-ends和离线监督Actor-Critic的动态治疗策略生成模型
      杨莎莎, 于亚新, 王跃茹, 许晶铭, 魏阳杰, 李新华
      计算机科学. 2024, 51 (7): 80-88.  doi:10.11896/jsjkx.231000138
      摘要 ( 25 )   PDF(2897KB) ( 120 )   
      参考文献 | 相关文章 | 多维度评价
      强化学习对数学模型依赖性低,利用经验便于架构和优化模型,非常适合用于动态治疗策略学习。但现有研究仍存在以下问题:1)学习策略最优性的同时未考虑风险,导致学到的策略存在一定的风险;2)忽略了分布偏移问题,导致学到的策略与医生策略完全不同;3)忽略患者的历史观测数据和治疗史,从而不能很好地得到患者状态,进而导致不能学到最优策略。基于此,提出了融合Dead-ends和离线监督Actor-Critic的动态治疗策略生成模型DOSAC-DTR。首先,考虑学到的策略所推荐的治疗行动的风险性,在Actor-Critic框架中融入Dead-ends概念;其次,为缓解分布偏移问题,在Actor-Critic框架中融入医生监督,在最大化预期回报的同时,最小化所学策略与医生策略之间的差距;最后,为了得到包含患者关键历史信息的状态表示,使用基于LSTM的编码器解码器模型对患者的历史观测数据和治疗史进行建模。实验结果表明,DOSAC-DTR相比基线方法有更好的性能,可以得到更低的估计死亡率以及更高的Jaccard系数。
      保持决策蕴涵不变的决策背景属性约简
      毕盛, 翟岩慧, 李德玉
      计算机科学. 2024, 51 (7): 89-95.  doi:10.11896/jsjkx.230900009
      摘要 ( 29 )   PDF(1384KB) ( 103 )   
      参考文献 | 相关文章 | 多维度评价
      形式概念分析是一种利用概念格进行数据分析的理论,属性约简是概念格约简的主要方式之一。决策蕴涵是形式概念分析在决策情形下的一种知识表示与推理模型。在已有保持决策背景知识信息不变的属性约简研究中,通常以保持概念规则或粒规则来保持决策背景的知识信息。而相比于概念规则与粒规则,决策蕴涵具备更强的知识表示能力。为了进一步缩小数据在属性约简前后对知识信息表示的差异,对保持决策蕴涵不变的属性约简进行了研究。首先,结合决策蕴涵的语义给出了保持决策蕴涵不变的协调集和约简定义,提出了判定协调集和约简的充要条件;接着,通过实例分析了该约简存在的问题,并结合蕴涵理论给出解决方法,从而给出了弱协调集和弱约简的定义;然后,从知识包含的角度分析了弱约简相比于约简的合理性;最后,提出了判定弱协调集和弱约简的充要条件,并结合决策蕴涵规范基给出了能够找到弱约简的方法,丰富了保持知识信息的属性约简研究内容。
      基于中心偏移的Fisher score与直觉邻域模糊熵的多标记特征选择
      孙林, 马天娇
      计算机科学. 2024, 51 (7): 96-107.  doi:10.11896/jsjkx.230400018
      摘要 ( 25 )   PDF(2487KB) ( 103 )   
      参考文献 | 相关文章 | 多维度评价
      现有多标记Fisher score模型中边缘样本会影响算法分类效果。鉴于邻域直觉模糊熵处理不确定信息时具有更强的表达能力与分辨能力的优势,文中提出了一种基于中心偏移的Fisher score与邻域直觉模糊熵的多标记特征选择方法。首先,根据标记将多标记论域划分为多个样本集,计算样本集的特征均值作为标记下样本的原始中心点,以最远样本的距离乘以距离系数,去除边缘样本集,定义了新的有效样本集,计算中心偏移处理后的标记下每个特征的得分以及标记集的特征得分,进而建立了基于中心偏移的多标记Fisher score模型,预处理多标记数据。然后,引入多标记分类间隔作为自适应模糊邻域半径参数,定义了模糊邻域相似关系和模糊邻域粒,由此构造了多标记模糊邻域粗糙集的上、下近似集;在此基础上提出了多标记邻域粗糙直觉隶属度函数和非隶属度函数,定义了多标记邻域直觉模糊熵。最后,给出了特征的外部和内部重要度的计算公式,设计了基于邻域直觉模糊熵的多标记特征选择算法,筛选出最优特征子集。在多标记K近邻分类器下、9个多标记数据集上的实验结果表明,所提算法选择的最优子集具有良好的分类性能。
      缺失值场景下的多元时间序列异常检测算法
      曾子辉, 李超洋, 廖清
      计算机科学. 2024, 51 (7): 108-115.  doi:10.11896/jsjkx.230400109
      摘要 ( 35 )   PDF(2407KB) ( 124 )   
      参考文献 | 相关文章 | 多维度评价
      时间序列异常检测是工业界中一个重要的研究领域。当前的时间序列异常检测方法侧重于面向完整的时间序列数据进行异常检测,而没有考虑到包含工业场景中网络异常、传感器损坏等所导致的缺失值的时间序列异常检测任务。文中针对工业场景中更加常见的含缺失值的时间序列异常检测任务,提出了一种基于注意力重新表征的时间序列异常检测算法MMAD(Missing Multivariate Time Series Anomaly Detection)。具体来说,MMAD首先将包含缺失值的时间序列数据通过时间位置编码对时间序列中不同时间戳的空间关联进行建模,然后通过掩码注意力表征模块学习不同时间戳之间数据的关联关系并将其表征为一个高维的嵌入式编码矩阵,从而将包含缺失值的多元时间序列表示为不含缺失值的高维表征,最后引入条件标准化流对该表征进行重建,以重建概率作为异常评分,重建概率越小代表样本越异常。在3个经典时间序列数据集上进行实验,结果表明,相比其他基线方法,MMAD性能平均提升了11%,验证了MMAD在缺失值场景下进行多元时间序列异常检测的有效性。
      基于压缩感知自适应测量矩阵的空气质量主动采样
      黄伟杰, 郭贤伟, 於志勇, 黄昉菀
      计算机科学. 2024, 51 (7): 116-123.  doi:10.11896/jsjkx.230400111
      摘要 ( 31 )   PDF(2251KB) ( 119 )   
      参考文献 | 相关文章 | 多维度评价
      随着城市化进程的不断加快,工业发展、人口聚集使得空气质量问题日益严峻。出于对采集成本的考虑,对空气质量的主动采样正受到越来越多的关注。但现有模型要么只能迭代选择采样位置,要么难以实时更新采样算法。基于此,提出了一种基于压缩感知自适应测量矩阵的空气质量主动采样方法,将采样位置的选择问题转化为矩阵的列子集选择问题。该方法首先利用历史完整数据进行字典学习,然后将学习后的字典经过列子集选择后得到能够指导批量采样的自适应测量矩阵,最后结合利用空气质量数据特性构建的稀疏基矩阵恢复出未采样的数据。该方法使用压缩感知模型一体化实现采样和推断,避免了使用多个模型的不足。此外,考虑到空气质量的时序变动问题,在每一次的主动采样后,字典还会利用最新数据进行在线更新以指导下一次的采样。两个真实数据集上的实验结果表明,经过字典学习后得到的自适应测量矩阵在低于20%的多个采样率下,恢复性能优于所有基线。
      一种基于属性相似性和分布结构连通性的聚类算法
      孙浩文, 丁家满, 李博文, 贾连印
      计算机科学. 2024, 51 (7): 124-132.  doi:10.11896/jsjkx.231000125
      摘要 ( 32 )   PDF(3090KB) ( 121 )   
      参考文献 | 相关文章 | 多维度评价
      聚类分析针对不同的数据特点采用不同的相似性度量,现实世界中数据分布复杂,存在分布无规律、密度不均匀等现象,单独考虑实例属性相似性或分布结构连通性会影响聚类效果。为此,提出了一种基于属性相似性和分布结构连通性的聚类算法(A Clustering Algorithm Based on Attribute Similarity and Distributed Structure Connectivity,ASDSC)。首先,利用待聚类数据集中的所有数据实例构建完全无向图,定义了一种兼顾属性相似和分布结构连通的新颖相似性度量方式,用于计算节点相似性,并构造邻接矩阵更新边的权重;其次,借助邻接矩阵执行递增步长的随机游走,依据顶点的连通中心性来识别簇中心并给定簇编号,同时获取其他顶点的连通性;然后,利用连通性计算顶点间的依赖关系,并据此进行簇编号的传播,直至完成聚类。最后,为了验证该方法的聚类性能,在16个合成数据集和10个真实数据集上与5种先进聚类算法进行了对比实验,ASDSC算法取得了优异性能。
      融合遗忘机制的多模态知识追踪模型
      闫秋艳, 孙浩, 司雨晴, 袁冠
      计算机科学. 2024, 51 (7): 133-139.  doi:10.11896/jsjkx.231000137
      摘要 ( 33 )   PDF(2349KB) ( 122 )   
      参考文献 | 相关文章 | 多维度评价
      知识追踪是构建自适应教育系统的核心和关键,常被用以捕获学生的知识状态、预测学生的未来表现。以往的知识追踪模型仅根据结构信息对问题、技能进行建模,无法利用问题、技能的多模态信息构造其相互依赖关系。同时,关于学生的记忆水平仅以时间做量化,未考虑不同模态对记忆水平的影响。因此,提出了融合遗忘机制的多模态知识追踪模型。首先,对问题、技能节点,以图文匹配作为训练任务优化单模态嵌入,并通过计算多模态融合后节点间的相似度,获得问题和技能的关联权重从而计算生成问题节点的嵌入。其次,通过长短期记忆网络获取带有遗忘因素的学生知识状态,并将其融入学生的答题记录中生成学生节点的嵌入。最后,根据学生的答题次数和不同模态的有效记忆率计算学生和问题间的关联强度,通过图注意力网络进行信息传播,预测学生对不同问题的答题情况。在两个真实课堂自采数据集上进行了对比实验和消融实验,结果表明所提方法比其他基于图的知识追踪模型具有更好的预测精度,且针对多模态和遗忘机制的设计能有效提升原始模型的预测效果。同时,通过对一个具体案例的可视化分析,进一步说明了所提方法的实际应用效果。
      基于多嵌入融合的top-N推荐
      杨真真, 王东涛, 杨永鹏, 华仁玉
      计算机科学. 2024, 51 (7): 140-145.  doi:10.11896/jsjkx.230400066
      摘要 ( 35 )   PDF(1744KB) ( 113 )   
      参考文献 | 相关文章 | 多维度评价
      异构信息网络(Heterogeneous Information Network,HIN)凭借其丰富的语义信息和结构信息被广泛应用于推荐系统中,虽然取得了很好的推荐效果,但较少考虑局部特征放大、信息交互和多嵌入聚合等问题。针对这些问题,提出了一种新的用于top-N推荐的多嵌入融合推荐(Multi-embedding Fusion Recommendation,MFRec)模型。首先,该模型在用户和项目学习分支中都采用对象上下文表示网络,充分利用上下文信息以放大局部特征,增强相邻节点的交互性;其次,将空洞卷积和空间金字塔池化引入元路径学习分支,以便获取多尺度信息并增强元路径的节点表示;然后,采用多嵌入融合模块以便更好地进行用户、项目以及元路径的嵌入融合,细粒度地进行多嵌入之间的交互学习,并强调了各特征的不同重要性程度;最后,在两个公共推荐系统数据集上进行了实验,结果表明所提模型MFRec优于现有的其他top-N推荐系统模型。
      融入多影响力与偏好的图对比学习社交推荐算法
      胡海波, 杨丹, 聂铁铮, 寇月
      计算机科学. 2024, 51 (7): 146-155.  doi:10.11896/jsjkx.230400147
      摘要 ( 32 )   PDF(2962KB) ( 113 )   
      参考文献 | 相关文章 | 多维度评价
      目前,基于图神经网络的社交推荐方法主要对社交信息和交互信息的显式关系和隐式关系进行联合建模,以缓解冷启动问题。尽管这些方法较好地聚合了社交关系和交互关系,但忽略了高阶隐式关系并非对每个用户都有相同的影响,并且监督学习的方法容易受到流行度偏差的影响。此外,这些方法主要聚焦用户和项目之间的协作关系,没有充分利用项目之间的相似关系。因此,文中提出了一种融入多影响力与偏好的图对比学习社交推荐算法(SocGCL)。一方面,引入节点间(用户和项目)融合机制和图间融合机制,并考虑了项目之间的相似关系。节点间融合机制区分图内不同节点对目标节点的不同影响;图间融合机制聚合多种图的节点嵌入表示。另一方面,通过添加随机噪声进行跨层图对比学习,有效缓解了社交推荐的冷启动问题和流行度偏差。在两个真实数据集上进行实验,结果表明,SocGCL优于其他基线方法,有效提高了社交推荐的性能。
      社交网络中基于EHEM的两阶段谣言抑制方法
      刘维, 吴飞, 郭震, 陈崚
      计算机科学. 2024, 51 (7): 156-166.  doi:10.11896/jsjkx.230800169
      摘要 ( 25 )   PDF(5980KB) ( 131 )   
      参考文献 | 相关文章 | 多维度评价
      在线社交网络的兴起带来了一系列的挑战与风险,其中包括虚假以及恶意谣言的传播,这可能会误导民众,破坏社会的稳定。因此,对谣言的传播进行抑制成为当前社交网络领域的热点问题。目前已经积累较多谣言抑制的工作,但是还存在模型不能准确描述信息在社交网络上传播的问题,因此提出了一种新的刻画信息传播的模型——扩展热量模型(Extended Heat Energy Model,EHEM)。该模型充分考虑了信息传播中节点激活概率的动态调整机制、信息传播的持续级联机制以及节点状态的动态转变机制,更加精准地捕捉了信息在网络上传播的爆炸性和复杂性;其次,考虑到在真实世界相信谣言的节点在接触真相后存在将信仰转变到相信真相的可能性,提出了校正阈值来确定节点是否会发生信仰的转换;节点的重要程度决定了它们自身的影响力,因此还提出了节点多维质量来衡量节点的重要程度;最后提出了两阶段的谣言抑制(Two Stage Rumor Containment,TSRC)算法,该算法首先使用节点多维质量对网络进行剪枝处理,之后通过模拟的方式从网络中选出最优的正种子集合。在4个真实数据集上进行实验,结果表明,所提算法在多个指标上优于Random,Betweenness,MD,PR,PWD和ContrId这6种对比算法。
      计算机图形学&多媒体
      三维点云上采样方法研究综述
      韩冰, 邓理想, 郑毅, 任爽
      计算机科学. 2024, 51 (7): 167-196.  doi:10.11896/jsjkx.230900110
      摘要 ( 47 )   PDF(9736KB) ( 155 )   
      参考文献 | 相关文章 | 多维度评价
      随着深度相机、激光雷达等三维扫描设备的普及,用点云表示三维数据的方法越来越流行,对点云数据的分析与处理也引起了计算机视觉研究领域的极大兴趣。其中,点云上采样任务是一项重要的点云数据处理工作,其结果的好坏关系着下游多种任务的优劣,因此一些研究人员从多个角度深入探索并先后提出了多种点云上采样方法,以期提高计算效率和网络性能,解决点云上采样中的各种难点问题。为了促进之后研究的发展,首先从任务类型角度对现有的点云上采样方法进行了全面的分类与综述,然后对这些点云上采样网络的性能进行了详细的分析与对比,最后针对现存的问题与面临的挑战做了进一步分析,并探索了未来可能的研究方向,希望为三维点云上采样任务未来更深入的研究提供新思路。
      基于彩色图像高频信息引导的深度图超分辨率重建算法研究
      李嘉莹, 梁宇栋, 李少吉, 张昆鹏, 张超
      计算机科学. 2024, 51 (7): 197-205.  doi:10.11896/jsjkx.230400102
      摘要 ( 37 )   PDF(3055KB) ( 139 )   
      参考文献 | 相关文章 | 多维度评价
      深度图像信息是三维场景信息的重要组成部分,然而,由于采集设备的局限性和成像环境的多样性,深度传感器获取的深度图像往往分辨率较低、高频信息较少,限制了其在各种计算机视觉任务中的进一步应用。深度图超分辨率试图提高深度图的分辨率,是一项实用而有价值的任务。同一场景下的RGB图像分辨率高,纹理信息丰富,部分深度图超分辨率算法通过引入来自同一场景下的RGB图像提供指导信息,实现了算法性能的显著提升。然而,由于RGB图像和深度图之间的模态不一致,如何充分、有效地利用RGB信息辅助深度图像进行图像超分辨率重建仍然极具挑战。为此,提出了一种基于彩色图像高频信息引导的深度图超分辨率重建算法。具体地,设计了一个高频特征提取模块来自适应地学习彩色图像中的高频信息,以指导深度图边缘的重建。另外,设计了一个特征自注意力模块来获取特征之间的全局依赖,同时提取更深层次的特征,以帮助深度图细节信息的恢复。经过跨模态融合,重组深度图像特征和彩色图像引导特征,并使用多尺度特征融合模块融合不同尺度特征之间的空间结构信息,获取包含多级感受野的重建信息。最后,通过深度重建模块,恢复相应的高分辨率深度图。公开数据集上的实验结果表明所提方法在定量和定性两方面均优于对比方法,验证了所提方法的有效性。
      一种基于YOLOX_s的雾天场景目标检测方法
      娄铮铮, 张欣, 胡世哲, 吴云鹏
      计算机科学. 2024, 51 (7): 206-213.  doi:10.11896/jsjkx.230400086
      摘要 ( 44 )   PDF(2719KB) ( 144 )   
      参考文献 | 相关文章 | 多维度评价
      文中提出了一个基于深度可分离卷积和注意力机制的雾天目标检测模型,旨在实现在雾天场景中对目标的快速、准确检测。该模型由去雾模块和检测模块组成,并在训练过程中共同训练。为确保模型在雾天场景中检测的准确性和实时性,在去雾模块方面,采用AODNet对输入图像进行去雾处理,以降低雾对图像中待检测目标的干扰,在检测模块中使用改进后的YOLOX_s模型,输出目标的分类置信度和位置坐标。为提升网络的检测性能,在YOLOX_s基础上采用深度可分离卷积和注意力机制来提高特征提取能力,扩大特征图感受野。所提模型能提高有雾场景中模型的检测精度,且不增加模型参数量和计算量。实验结果表明,所提模型在RTTS数据集和合成有雾目标检测数据集上均表现出色,有效提高了模型在雾天场景中的检测精度。与基准模型相比,平均精度(mAP@50_95)分别提升了1.9%和2.37%。
      基于外部先验和自先验注意力的图像描述生成方法
      李永杰, 钱艺, 文益民
      计算机科学. 2024, 51 (7): 214-220.  doi:10.11896/jsjkx.230600167
      摘要 ( 32 )   PDF(2454KB) ( 112 )   
      参考文献 | 相关文章 | 多维度评价
      图像描述是一种结合计算机视觉和自然语言处理的跨模态任务,旨在理解图像内容并生成恰当的句子。现有的图像描述方法通常使用自注意力机制来捕获样本内的长距离依赖关系,但这种方式不仅忽略了样本间的潜在相关性,而且缺乏对先验知识的利用,导致生成内容与参考描述存在一定差异。针对上述问题,文中提出了一种基于外部先验和自先验注意力(External Prior and Self-prior Attention,EPSPA)的图像描述方法。其中,外部先验模块能够隐式地考虑到样本间的潜在相关性进而减少来自其他样本的干扰信息。同时,自先验注意力能够充分利用上一层的注意力权重来模拟先验知识,使其指导模型进行特征提取。在公开数据集上使用多种指标对EPSPA进行评估,实验结果表明该方法能够在保持低参数量的前提下表现出优于现有方法的性能。
      三维流场的流线深度特征学习与特征聚类
      陈杰, 金林江, 郑红波, 秦绪佳
      计算机科学. 2024, 51 (7): 221-228.  doi:10.11896/jsjkx.230500033
      摘要 ( 25 )   PDF(2506KB) ( 124 )   
      参考文献 | 相关文章 | 多维度评价
      流场可视化指将流体运动的数据转换为视觉形式,以便更好地理解和分析流场的流动。利用流线来实现流场可视化,是当前最为热门的方法。文中提出了一种学习、聚类三维流场流线特性的方法。首先设计了一种基于卷积的自编码器来提取流线特征。该方法中的自编码器由编码器和解码器组成,其中编码器用卷积层降维的方式来提取输入流线的特征,而解码器使用转置卷积对流线特征进行上采样,以此重建流线。通过训练不断减小输入流线与重建流线的差异,可以让编码器提取到的流线特征更加准确。其次,改进了CFSFDP算法,用于流线特征聚类。针对原CFSFDP算法需要手动选取聚类中心,以及对距离参数过于敏感的缺点,改进了其指标计算方法,实现对聚类中心的自动选取,并且引入了高斯核密度估计,实现对截断距离参数的自适应计算。实验结果表明,所提方法在流线特征的学习以及聚类上具有良好的效果。
      基于改进双流视觉Transformer的行为识别模型
      雷永升, 丁锰, 沈尧, 李居昊, 赵东越, 陈福仕
      计算机科学. 2024, 51 (7): 229-235.  doi:10.11896/jsjkx.230500054
      摘要 ( 26 )   PDF(2630KB) ( 116 )   
      参考文献 | 相关文章 | 多维度评价
      针对现有行为识别方法中抗背景干扰能力差和准确率低等问题,提出了一种改进的双流视觉Transformer行为识别模型。该模型采用分段采样的方法来增加模型对长时序列数据的处理能力;在网络头部嵌入无参数的注意力模块,在降低动作背景干扰的同时,增强了模型的特征表示能力;在网络尾部嵌入时间注意力模块,通过融合时域高语义信息来充分提取时序特征。文中提出了一种新的联合损失函数,旨在增大类间差异并减少类内差异;采用决策融合层以充分利用光流与RGB流特征。针对上述改进模型,在基准数据集UCF101和HMDB51上进行消融及对比实验,消融实验结果验证了所提方法的有效性,对比实验结果表明,所提方法相比时间分段网络在两个数据集上的准确率分别提高了3.48%和7.76%,优于目前的主流算法,具有较好的识别效果。
      基于RepVGG网络的实时车道线检测方法
      蔡汶良, 黄俊
      计算机科学. 2024, 51 (7): 236-243.  doi:10.11896/jsjkx.230400128
      摘要 ( 36 )   PDF(3549KB) ( 120 )   
      参考文献 | 相关文章 | 多维度评价
      针对现有车道线检测方法存在的检测速度慢、检测精度低的问题,将车道线检测视为分类问题,提出了基于RepVGG网络的实时车道线检测方法。在RepVGG网络中融合不同层级特征图,减少空间定位信息的损失,提高车道线的定位精度。采用曲线建模的后处理方法,从整体和局部两个角度修正车道线预测结果。挖掘车道线定位中的分布信息,提出了基于分布指导的车道线存在预测分支,直接从车道线定位分布中学习车道线的存在特征,在略微提升推理速度的同时进一步提升检测精度。在TuSimple和CULane数据集上的实验表明,该模型在检测速度和精度上取得了良好的平衡。在CULane数据集上,所提方法的推理速度为目前同类方法中检测速度最快的UFLDv2算法的1.13倍,同时F1分数从74.7%提高到77.1%,达到了实时检测任务的需求。
      基于图像深度先验和鲁棒马尔可夫随机场的有遮挡人脸识别
      李小薪, 丁伟杰, 方怡, 张远成, 王琦晖
      计算机科学. 2024, 51 (7): 244-256.  doi:10.11896/jsjkx.230400127
      摘要 ( 20 )   PDF(3981KB) ( 125 )   
      参考文献 | 相关文章 | 多维度评价
      由遮挡所引发的测试数据和训练数据之间的差异,是人脸识别技术面临的重要挑战。现有的基于深度神经网络的有遮挡人脸识别方法大多需要使用大规模的有遮挡的人脸图像来训练网络模型。然而,现实世界中的任何外界物体都有可能成为遮挡,有限的训练集数据很难穷尽所有的可能性,并且使用大规模的有遮挡人脸图像训练网络模型的做法与人类视觉机制是相违背的,人眼对于遮挡区域的感知在本质上与遮挡本身并没有关系,仅依赖于无遮挡的人脸图像。为了模拟人类视觉的遮挡检测机制,将图像深度先验和鲁棒马尔可夫随机场模型结合起来,构建基于小样本数据的遮挡检测模型DIP-rMRF,并提出了一致性零填充方法以有效利用DIP-rMRF的遮挡检测结果进行后续的人脸识别。在Extended Yale B,AR和LFW这3个人脸数据库上,针对VGGFace,LCNN,PCANet,SphereFace,InterpretFR,FROM这6种CNN模型的实验结果表明,DIP-rMRF能够有效地处理遮挡以及由极端光照所引发的“类遮挡”,从而极大提升现有的深度神经网络模型对有遮挡人脸识别的性能。
      人工智能
      轻量级深度神经网络模型适配边缘智能研究综述
      徐小华, 周长兵, 胡忠旭, 林仕勋, 喻振杰
      计算机科学. 2024, 51 (7): 257-271.  doi:10.11896/jsjkx.240100045
      摘要 ( 43 )   PDF(3203KB) ( 119 )   
      参考文献 | 相关文章 | 多维度评价
      随着物联网和人工智能的迅猛发展,边缘计算和人工智能的结合催生了边缘智能这一新的研究领域。边缘智能具备一定的计算能力,能够提供实时、高效和智能的响应。它在智能城市、工业物联网、智能医疗、自动驾驶以及智能家居等领域都具有重要的应用。为了提升模型的准确度,深度神经网络往往采用更深、更大的架构,导致了模型参数的显著增加、存储需求的上升和计算量的增大。受限于物联网边缘设备在计算能力、存储空间和能源资源方面的局限,深度神经网络难以被直接部署到这些设备上。因此,低内存、低计算资源、高准确度且能实时推理的轻量级深度神经网络成为了研究热点。文中首先回顾边缘智能的发展历程,并分析轻量级深度神经网络适应边缘智能的现实需求,提出了两种构建轻量级深度神经网络模型的方法:深度模型压缩技术和轻量化架构设计。接着详细讨论了参数剪枝、参数量化、低秩分解、知识蒸馏以及混合压缩5种主要的深度模型压缩技术,归纳它们各自的性能优势与局限,并评估它们在常用数据集上的压缩效果。之后深入分析轻量化架构设计中的调整卷积核大小、降低输入通道数、分解卷积操作和调整卷积宽度的策略,并比较了几种常用的轻量化网络模型。最后,展望轻量级深度神经网络在边缘智能领域的未来研究方向。
      命题逻辑中文字块矛盾型及子句正则矛盾体
      王成龙, 何星星, 臧珲, 李莹芳, 王丹琛, 李天瑞
      计算机科学. 2024, 51 (7): 272-277.  doi:10.11896/jsjkx.230500237
      摘要 ( 25 )   PDF(1394KB) ( 120 )   
      参考文献 | 相关文章 | 多维度评价
      归结原理是自动推理中一种简洁、可靠且完备的推理规则。基于矛盾体分离的自动演绎理论是归结原理的延伸,矛盾体是该理论的核心部分。由于矛盾体结构复杂且生成策略较少,因此文中提出了一种新的生成矛盾体的策略,即利用多个标准矛盾体生成文字块矛盾型,再通过添加互补矛盾集得到新的矛盾体。重点讨论了具有特殊结构的文字块矛盾型生成的矛盾体,即子句正则矛盾体的性质,这些性质说明了具有特定结构的子句正则矛盾体添加子句后仍然是矛盾体。最后,提出了矛盾体的生成算法,为在计算机上实现新的矛盾体的生成提供参考。
      基于关键词异构图的生成式摘要研究
      毛兴静, 魏勇, 杨昱睿, 琚生根
      计算机科学. 2024, 51 (7): 278-286.  doi:10.11896/jsjkx.230500059
      摘要 ( 22 )   PDF(2477KB) ( 108 )   
      参考文献 | 相关文章 | 多维度评价
      生成式摘要是自然语言处理中的重要任务,它帮助人们从海量文本中提取简洁而重要的信息。目前主流的生成式摘要模型是基于深度学习的序列到序列模型,这类模型生成的摘要质量更高。但由于缺乏对原文中关键词和句子之间的依赖关系的关注,现有模型生成的摘要仍然存在语义不明、重要信息含量低等问题。针对这个问题,提出了一种基于关键词异构图的生成式摘要模型。该模型通过从原始文本中提取关键词,将其与句子共同作为输入构建异构图,进而学习关键词和句子之间的依赖关系。文档编码器和图编码器分别用于学习文本知识和异构图中的依赖关系。此外,在解码器中采用分层图注意力机制来提高模型在生成摘要时对显著信息的关注。在CNN/Daily Mail和XSum数据集上进行了充分的实验,实验结果表明,所提模型在ROUGE评价指标上有了显著的提升。进一步的人类评估结果显示,所提模型所生成的摘要比基线模型包含更多的关键信息,并具有更高的可读性。
      基于联合学习的语言粒度融合的重叠事件抽取方法
      闫婧涛, 李旸, 王素格, 潘邦泽
      计算机科学. 2024, 51 (7): 287-295.  doi:10.11896/jsjkx.230700118
      摘要 ( 24 )   PDF(2484KB) ( 103 )   
      参考文献 | 相关文章 | 多维度评价
      事件抽取是一项重要的信息抽取任务,现有的事件抽取方法大多假设一个句子中仅出现一个事件,然而,在真实的场景下,重叠事件是难以避免的。文中提出了一种基于联合学习的语言粒度融合的重叠事件抽取方法。该方法设计了基于token数目逐层递增和逐层递减的策略,对不同语言粒度的片段进行表示,在此基础上,构建了渐进式语言粒度融合的句子表示。通过引入事件信息感知,建立了基于门控机制的语言粒度和事件信息融合的句子表示。最后,通过联合学习词间的片段关系和角色关系,实现对事件触发词、论元、事件类型和论元角色的判别。在FewFC和DuEE1.0-1数据集上进行了实验,所提LGFEE模型在事件类型判别任务上的F1值分别提高了0.8%和0.6%,在触发词识别、论元识别、论元角色分类任务上也获得了较高的召回率和F1值,验证了其有效性。
      CINOSUM:面向多民族低资源语言的抽取式摘要模型
      翁彧, 罗皓予, 超木日力格, 刘轩, 董俊, 刘征
      计算机科学. 2024, 51 (7): 296-302.  doi:10.11896/jsjkx.231100201
      摘要 ( 52 )   PDF(3271KB) ( 113 )   
      参考文献 | 相关文章 | 多维度评价
      针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO 提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效果不佳的问题,构建了一个框架,采用统一的句子抽取器,以进行不同民族语言的抽取式摘要生成。此外,提出采用多语言数据集的联合训练方法,旨在弥补知识获取上的不足,进而扩展在低资源语言上的应用,显著增强模型的适应性与灵活性。最终,在MESUM数据集上开展了广泛的实验研究,实验结果表明CINOSUM模型在包括藏语和维吾尔语在内的多民族低资源语言环境中表现卓越,并且在ROUGE评价体系下取得了显著的性能提升。
      融合多图卷积与层级池化的文本分类模型
      魏子昂, 彭舰, 黄飞虎, 琚生根
      计算机科学. 2024, 51 (7): 303-309.  doi:10.11896/jsjkx.230400164
      摘要 ( 34 )   PDF(1952KB) ( 125 )   
      参考文献 | 相关文章 | 多维度评价
      文本分类是自然语言处理中的一个重要问题,其目的是将标签分配给输入的文档。在文本分类任务中,单词间的共现关系提供了文本特性及词汇分布的重要视角,而词嵌入信息能提供丰富的语义信息,并对全局词汇交互和潜在语义关系造成影响。然而,过去的研究未能有效整合这两方面,或过度关注其中一方面。在这样的背景下,文中提出了一种新的方法,用于自适应地融合这两类信息,在考虑结构关系和嵌入信息的同时,找到一个合理的平衡以提高模型效果。该模型首先从词汇共现模式和语义嵌入信息的角度将文本数据构建成文本共现图和文本嵌入图,利用图卷积来增强节点嵌入,图池化层融合节点嵌入并识别保留重要性更高的节点,遵循分层池化模式并按层学习文档级表示,并引入门控融合模块对两个图的嵌入进行自适应的融合。在5个公开的文本分类数据集上进行了大量实验,结果表明了HTGNN在文本分类任务上的优异性能。
      基于动态图表示的设备故障推理预测方法
      张慧, 张骁雄, 丁鲲, 刘姗姗
      计算机科学. 2024, 51 (7): 310-318.  doi:10.11896/jsjkx.231000223
      摘要 ( 39 )   PDF(2772KB) ( 127 )   
      参考文献 | 相关文章 | 多维度评价
      高效的设备运维可以保障设备的正常运行。然而,随着设备复杂程度越来越高,设备的维护和故障排查的复杂度和难度也不断增加。因此,人工方式越来越不能满足智能化设备的运维需要。智能运维将人工智能等新兴技术运用于运维过程,可以作为设备运维的有力支撑。但现有的很多方法依旧存在着未考虑动态性等不足。针对上述问题,提出了一种基于动态知识图谱表示学习的设备故障推理预测方法,用于预测目标设备是否与故障设备存在潜在的关联。该方法结合动态知识图谱表示学习和图表示推理模型,可以利用实时数据更新图网络,并运用图表示推理模型对新的故障数据进行推理。首先,使用动态知识图谱来表示设备运维数据,记录设备随时间的演化过程,从而有效地表达设备之间关系的动态变化性;然后,通过表示学习获得动态知识图谱中源故障设备和目标设备的时间感知表示;最后,将时间感知表示作为输入进行故障推理预测,判断设备之间是否存在潜在的关联。预测结果可以辅助运维人员解决相应的设备故障问题。在多个数据集上进行了实验,验证了所提方法的有效性。
      基于深度确定性策略梯度与注意力Critic的多智能体协同清障算法
      王宪伟, 冯翔, 虞慧群
      计算机科学. 2024, 51 (7): 319-326.  doi:10.11896/jsjkx.230600129
      摘要 ( 25 )   PDF(2985KB) ( 119 )   
      参考文献 | 相关文章 | 多维度评价
      动态障碍物一直是阻碍智能体自主导航发展的关键因素,而躲避障碍物和清理障碍物是两种解决动态障碍物问题的有效方法。近年来,多智能体躲避动态障碍物(避障)问题受到了广大学者的关注,优秀的多智能体避障算法纷纷涌现。然而,多智能体清理动态障碍物(清障)问题却无人问津,相对应的多智能体清障算法更是屈指可数。为解决多智能体清障问题,文中提出了一种基于深度确定性策略梯度与注意力Critic的多智能体协同清障算法(Multi-Agent Cooperative Algorithm for Obstacle Clearance Based on Deep Deterministic Policy Gradient and Attention Critic,MACOC)。首先,创建了首个多智能体协同清障的环境模型,定义了多智能体及动态障碍物的运动学模型,并根据智能体和动态障碍物数量的不同,构建了4种仿真实验环境;其次,将多智能体协同清障过程定义为马尔可夫决策过程(Markov Decision Process,MDP),构建了多智能体t的状态空间、动作空间和奖励函数;最后,提出一种基于深度确定性策略梯度与注意力Critic的多智能体协同清障算法,并在多智能体协同清障仿真环境中与经典的多智能体强化学习算法进行对比。实验证明,相比对比算法,所提出的MACOC算法清障的成功率更高、速度更快,对复杂环境的适应性更好。
      Deep-Init:基于深度学习的视觉惯性里程计非联合初始化方法
      史殿习, 高云琦, 宋林娜, 刘哲, 周晨磊, 陈莹
      计算机科学. 2024, 51 (7): 327-336.  doi:10.11896/jsjkx.230500036
      摘要 ( 24 )   PDF(3265KB) ( 114 )   
      参考文献 | 相关文章 | 多维度评价
      对于非线性的单目VIO系统来说,其初始化过程至关重要,初始化结果的好坏直接影响整个系统运行过程中状态估计的精度。为此,将深度学习方法引入单目VIO系统的初始化过程中,提出了一种高效的非联合初始化方法(简称Deep-Init),其核心是使用深度神经网络对IMU中陀螺仪的偏置和噪声等随机误差项进行准确估计,得到初始化过程中的关键参数,即陀螺仪的bias;同时,将IMU预积分与SfM进行松耦合,通过位置和旋转对齐,使用最小二乘法对绝对尺度、速度以及重力矢量等进行快速恢复,并将其作为初始值来引导非线性紧密耦合的优化框架。由于深度神经网络对陀螺仪数据进行补偿,从而大大提高了IMU中旋转估计量的准确性,有效提高了IMU数据的信噪比,同时减少了最小二乘方程失效的次数,因此进一步减少了计算量。使用去除误差项的陀螺仪数据的预积分量替换SfM中的旋转量,将IMU的旋转量作为真值,不仅避免了将不准确的SfM值作为真值进行初始化时所带来的误差,有效提升了系统状态估计的精度,而且能够有效地适应高速运动、光照变换剧烈和纹理重复等SfM估计效果差的场景。在EuRoC数据集上,对所提方法的有效性了进行实验验证,实验结果表明,所提出的初始化方法Deep-Init无论是精度还是耗时均取得了良好的效果。
      基于特征手性的数据无关模型评估方法
      苗壮, 季时鹏, 吴波, 付睿智, 崔浩然, 李阳
      计算机科学. 2024, 51 (7): 337-344.  doi:10.11896/jsjkx.230500179
      摘要 ( 29 )   PDF(3817KB) ( 145 )   
      参考文献 | 相关文章 | 多维度评价
      模型评估是评判卷积神经网络模型性能的重要手段,多用于卷积神经网络模型的设计、对比和应用过程。然而,现有的模型评估方法大多需要使用测试数据运行模型得到相关评估指标,当测试数据因隐私、版权与保密等原因无法获取时难以发挥作用。为了解决此问题,提出了一种数据无关的卷积神经网络模型评估方法,其利用特征手性的相关特性,通过计算卷积核之间的距离来确定模型的评估指标。所提方法利用不同卷积神经网络模型的性能表现与卷积核距离之间的负相关性,验证了在不使用测试数据的情况下,直接利用模型参数评估模型相对性能排名的可行性与有效性。对比实验表明,使用欧氏距离测度来评估AlexNet,VGGNets,ResNets,EfficientNets这4类包括17个卷积神经网络的模型精度时,该模型评估方法的盲评准确性高,能够较好地完成模型评估任务。
      基于熵值过滤和类质心优化的无监督域适应
      田青, 卢章虎, 杨宏
      计算机科学. 2024, 51 (7): 345-353.  doi:10.11896/jsjkx.230500144
      摘要 ( 30 )   PDF(2429KB) ( 95 )   
      参考文献 | 相关文章 | 多维度评价
      无监督域适应作为机器学习领域的新兴研究方向之一,其主要利用源域监督信息来辅助无标记目标域的学习。截至目前,已有较多无监督域适应方法被提出,但在关系挖掘方面仍存在一些不足之处。具体来说,现有方法通常对目标域样本采取一致性处理策略,而忽略了目标域样本在关系挖掘中的差异性,因此文中提出了熵值过滤和类质心优化方法。所提方法利用生成对抗网络架构对目标域样本进行标记,利用所获伪标签计算样本熵值,并与所设阈值进行比较,从而进一步划分目标域样本。对于简单样本,分配伪标签;对于困难样本,该方法结合对比学习思想,利用源域和简单样本来学习更加鲁棒的分类器对困难样本分类,并进一步获得源和目标域的类质心。通过优化域间和实例对比对齐,来减小域间和域内的差异。最后,在3个标准数据集上与目前几种先进的领域自适应方法进行了对比实验,实验结果表明所提方法的性能均优于对比方法。
      基于IMQ惯性权重策略的自适应灰狼优化算法
      于明洋, 李婷, 许静
      计算机科学. 2024, 51 (7): 354-361.  doi:10.11896/jsjkx.230600181
      摘要 ( 23 )   PDF(2791KB) ( 121 )   
      参考文献 | 相关文章 | 多维度评价
      针对灰狼优化算法(Grey Wolf Optimizer,GWO)寻优精度低、收敛速度慢的问题,提出了一种基于IMQ惯性权重策略的自适应灰狼优化算法(ISGWO)。该算法利用IMQ函数的特性,实现对惯性权重的非线性调整,从而更好地平衡算法的全局勘探能力和局部开发能力;同时,基于Sigmoid指数函数自适应更新个体位置,更好地搜索和优化问题的解空间。采用6个基本函数和29个CEC2017函数对ISGWO进行测试,并与6种常用的算法进行比较,实验结果表明ISGWO具有更优的收敛精度和速度。
      一种约束增强的RDFS本体的模式验证方法
      赵晓非, 柴争义, 袁超, 张振
      计算机科学. 2024, 51 (7): 362-372.  doi:10.11896/jsjkx.230800034
      摘要 ( 27 )   PDF(2439KB) ( 103 )   
      参考文献 | 相关文章 | 多维度评价
      约束增强的RDFS(RDFS(c))本体克服了RDFS描述约束能力欠缺的缺点,然而约束机制的引入给本体验证问题带来了挑战。文中提出了一种面向RDFS(c)本体的、支持可判定性推断的模式验证方法。该方法对约束之间的依赖关系进行解析。首先,将RDFS(c)模式转化为一阶谓词逻辑表达式,而将规约的检测问题转化为表达式的可满足性检测问题;在此基础上,建立反映约束之间的修复-违背关系的约束依赖图,并对其进行必要的约简;接着,通过识别图中的有限环路来推导模式验证任务的可判定性;最后,通过约束依赖关系之上的推理进行模式的验证。该方法有两方面特点:一方面,通过到一阶谓词逻辑表达式的转换以及基于相应的一阶约束的依赖关系的推理,所提出的方法具有强适用性,特别是约束依赖性解析可以最大程度地减少回溯的次数,从而确保了验证过程的高效性;另一方面,由于独立于任何特定的约束建模语言,其也是一种分析RDFS(c)模式验证任务的可判定性的通用方法。
      信息安全
      元宇宙中区块链技术的应用、挑战和新策略
      孙力
      计算机科学. 2024, 51 (7): 373-379.  doi:10.11896/jsjkx.230800072
      摘要 ( 24 )   PDF(2289KB) ( 119 )   
      参考文献 | 相关文章 | 多维度评价
      近年来,虚拟现实、人工智能等技术的发展,催生出了以沉浸式互联网为核心的元宇宙系统框架。在分析架构元宇宙环境核心技术所面临挑战的基础上,分析了融入区块链技术对元宇宙系统及其相关核心技术的作用,指出了现有区块链运行机制对其在元宇宙环境中应用带来的延迟性和扩展受限等问题。运用分片机制和斯塔克伯格博弈理论,提出了一种新的基于区块链的元宇宙应用策略,设计了相应的用户激励方案,并通过数值实验验证了该方案的有效性。最终,通过分析该策略的优势和面临的问题明确了后续的研究方向。
      针对系统调用的基于语义特征的多方面信息融合的主机异常检测框架
      樊燚, 胡涛, 伊鹏
      计算机科学. 2024, 51 (7): 380-388.  doi:10.11896/jsjkx.230400023
      摘要 ( 25 )   PDF(2692KB) ( 114 )   
      参考文献 | 相关文章 | 多维度评价
      混淆攻击通过修改进程运行时产生的系统调用序列,可以在实现同等攻击效果的前提下,绕过主机安全防护机制的检测。现有的基于系统调用的主机异常检测方法不能对混淆攻击修改后的系统调用序列进行有效检测。针对此问题,提出了一种基于系统调用多方面语义信息融合的主机异常检测方法。从系统调用序列的多方面语义信息入手,通过系统调用语义信息抽象和系统调用语义特征提取充分挖掘系统调用序列的深层语义信息,利用多通道TextCNN实现多方面信息的融合以进行异常检测。系统调用语义抽象实现特定系统调用到其类型的映射,通过提取序列的抽象语义信息来屏蔽特定系统调用改变对检测效果的影响;系统调用语义特征提取利用注意力机制获取表征序列行为模式的关键语义特征。在ADFA-LD数据集上的实验结果表明,所提方法检测一般主机异常的误报率低于2.2%,F1分数达到0.980;检测混淆攻击的误报率低于2.8%,F1分数达到0.969,检测效果优于对比方法。
      基于符号执行优化的PDF恶意指标提取技术
      宋恩舟, 胡涛, 伊鹏, 王文博
      计算机科学. 2024, 51 (7): 389-396.  doi:10.11896/jsjkx.230300117
      摘要 ( 30 )   PDF(2173KB) ( 112 )   
      参考文献 | 相关文章 | 多维度评价
      恶意PDF文档是APT组织常用的攻击方法,提取分析其内嵌JavaScript代码指标是判定文档恶意性的重要手段,然而攻击者可以采取高度混淆、虚拟机与沙箱检测等逃逸方法。因此,文中创新性地将符号执行方法用于PDF指标提取,提出了一种基于符号执行优化的PDF恶意指标提取技术,并实现了由代码解析、符号执行和指标提取3个模块组成的指标提取系统SYMBPDF。在代码解析模块中实现内嵌JavaScript代码提取与重组。在符号执行模块中设计代码改写方法,通过强制分支转移提高符号执行的代码覆盖率;设计并发策略和两种约束求解优化方法,以提高系统执行效率。在指标提取模块中实现恶意指标整合与记录。对1 271个恶意样本进行了指标提取与评估,指标提取成功率为92.2%,有效性为91.7%,代码覆盖率较优化前提升8.5%,系统性能较优化前提升32.3%。
      基于综合评分的移动群智感知隐私激励机制
      傅彦铭, 张思远
      计算机科学. 2024, 51 (7): 397-404.  doi:10.11896/jsjkx.230400181
      摘要 ( 29 )   PDF(2204KB) ( 112 )   
      参考文献 | 相关文章 | 多维度评价
      移动群智感知系统(MCS)能否高效地运行,很大程度上取决于是否有大量任务参与者参与到感知任务中。然而在现实中,用户的感知成本增加以及用户的隐私泄露等原因,导致用户的参与积极性不高,因此需要一种有效的手段,用于在保证用户隐私安全的同时,还能促进用户积极地参与到任务中。针对上述问题,结合本地化差分隐私保护技术,提出了一种基于综合评分的双边拍卖隐私激励机制(Privacy Incentive Mechanism of Bilateral Auction with Comprehensive Scoring,BCS),这种激励机制包括拍卖机制、数据扰动和聚合机制以及奖励和惩罚机制3个部分。拍卖机制综合考虑了各种因素对用户完成感知任务的影响,在一定程度上提高了任务的匹配程度;数据扰动和聚合机制在隐私保护和数据精度之间做出权衡,在保证数据质量的同时做到了对用户隐私的良好保护;奖励和惩罚机制奖励诚信度和活跃度高的用户,激励用户积极参与感知任务。实验结果表明,BCS可以在提高平台收益和任务匹配率的同时保证感知数据的质量。
      基于拉格朗日对偶的小样本学习隐私保护和公平性约束方法
      王静红, 田长申, 李昊康, 王威
      计算机科学. 2024, 51 (7): 405-412.  doi:10.11896/jsjkx.230500012
      摘要 ( 30 )   PDF(2139KB) ( 107 )   
      参考文献 | 相关文章 | 多维度评价
      小样本学习旨在利用少量数据训练并大幅提升模型效用,为解决敏感数据在神经网络模型中的隐私与公平问题提供了重要方法。在小样本学习中,由于小样本数据集中往往包含某些敏感数据,并且这些敏感数据可能有歧视性,导致数据在神经网络模型的训练中存在隐私泄露的风险和公平性问题。此外,在许多领域中,由于隐私或安全等,数据很难或无法获取。同时在差分隐私模型中,噪声的引入不仅会导致模型效用的降低,也会引起模型公平性的失衡。针对这些挑战,提出了一种基于Rényi差分隐私过滤器的样本级自适应隐私过滤算法,利用Rényi差分隐私以实现对隐私损失的更精确计算。进一步,提出了一种基于拉格朗日对偶的隐私性和公平性约束算法,该算法通过引入拉格朗日方法,将差分隐私约束和公平性约束加到目标函数中,并引入拉格朗日乘子来平衡这些约束。利用拉格朗日乘子法将目标函数转化为对偶问题,从而实现同时优化隐私性和公平性,通过拉格朗日函数实现隐私性和公平性的平衡。实验结果证明,该方法既提升了模型性能,又保证了模型的隐私性和公平性。
      自编码器端到端通信系统后门攻击方法
      甘润, 魏祥麟, 王超, 王斌, 王敏, 范建华
      计算机科学. 2024, 51 (7): 413-421.  doi:10.11896/jsjkx.230400113
      摘要 ( 28 )   PDF(2887KB) ( 120 )   
      参考文献 | 相关文章 | 多维度评价
      自编码器端到端通信系统无需显式地设计通信协议,比传统模块式通信系统复杂性更低,且灵活性和鲁棒性更高。然而,自编码器模型的弱可解释性也给端到端通信系统带来了新的安全隐患。实验表明,在信道未知且解码器单独训练的场景下,通过在信道层添加精心设计的触发器就可以让原本表现良好的解码器产生误判,并且不影响解码器处理不含触发器样本时的性能,从而实现针对通信系统的后门攻击。文中设计了一种触发器生成模型,并提出了将触发器生成模型与自编码器模型进行联合训练的后门攻击方法,实现动态的触发器的自动生成,在增加攻击隐蔽性的同时提升了攻击成功率。为了验证所提方法的有效性,分别实现了4种不同的自编码器模型,考察了不同信噪比、不同投毒率、不同触发器尺寸以及不同触发信号比场景下的后门攻击效果。实验结果表明,在6dB信噪比下,针对4种不同的自编码器模型,所提方法的攻击成功率与干净样本识别率均超过92%。
      基于节点影响力的区块链匿名交易追踪方法
      李致远, 徐丙磊, 周颖仪
      计算机科学. 2024, 51 (7): 422-429.  doi:10.11896/jsjkx.230400177
      摘要 ( 23 )   PDF(2745KB) ( 119 )   
      参考文献 | 相关文章 | 多维度评价
      随着区块链技术的快速发展,借助虚拟货币进行非法交易的行为越来越普遍,且数量仍在快速增长。为打击该类犯罪行为,目前主要从网络分析技术和图数据挖掘等角度研究区块链交易数据,以进行区块链交易追踪。然而,现有的研究在有效性、普适性以及效率等方面存在不足,且无法对新注册地址进行有效追踪。针对上述问题,文中提出了一种基于节点影响力的账户余额模型区块链交易追踪方法NITT,旨在追踪特定目标账户模型地址的主要资金流向。相比传统方法,该方法引入时间策略,降低了图数据规模,同时采用多重权重分配策略,筛选出了更有影响力的重要账户地址。在真实数据集上进行实验,结果表明,所提方法在有效性、普适性和效率等方面具有较大的优势。
  • 请选择需要列表的栏目分类:
    数据库&大数据&数据科学 (51)
    智能软件工程* (0)
    交叉&应用 (123)
    计算机软件* (20)
    群智感知计算 (9)
    大数据&数据科学 (121)
    复杂系统的软件工程和需求工程* (14)
    计算机图形学与多媒体 (14)
    复杂系统的软件工程和需求工程专题前言 (1)
    新型分布式计算技术与系统* (9)
    多媒体技术进展* (11)
    计算机体系结构* (6)
    图像处理&多媒体技术 (185)
    网络&通信 (32)
    人工智能安全* (12)
    数据库&大数据&数据科学* (12)
    计算机图形学& 多媒体 (27)
    人机交互 (5)
    智能数据治理技术与系统* (14)
    人工智能* (17)
    交叉&前沿 (14)
    区块链技术* (18)
    特邀文章 (2)
    多语言计算前沿技术* (11)
    新兴分布式计算技术与系统* (11)
    交叉与前沿 (98)
    2018 全国高性能计算学术年会 (6)
    目录 (62)
    软件工程&数据库 (6)
    序言 (1)
    智能化边缘计算* (14)
    交叉& 应用 (21)
    计算机体系结构* (8)
    基于社会计算的多学科交叉融合专题* (13)
    计算机图形学&多媒体* (14)
    6G 赋能智慧物联网技术与应用* (10)
    智慧医疗 (10)
    数据库&大数据&数据科学* (34)
    CRSSC-CWI-CGrC 2016 (16)
    高性能计算 (52)
    2016 中国计算机图形学会议 (5)
    2016 年全国理论计算机科学学术年会 (8)
    目次 (133)
    2016 年全国信息存储技术学术年会 (8)
    NASAC 2015 (38)
    2015全国高性能计算学术年会 (15)
    云计算 (2)
    研究快报 (1)
    2016 第十三届全国Web 信息系统及其应用学术会议 (8)
    2016第六届中国数据挖掘会议 (15)
    2017年全国理论计算机科学学术年会 (11)
    第十届全国几何设计与计算学术会议 (11)
    图形图像及模式识别 (5)
    第六届全国智能信息处理学术会议 (7)
    2017年中国计算机学会人工智能会议 (10)
    区块链技术 (10)
    第十六届中国机器学习会议 (11)
    CRSSC-CWI-CGrC-3WD 2017 (16)
    智能系统及应用 (110)
    软件工程与数据库技术 (1670)
    数据挖掘 (77)
    无线网络与通信 (146)
    第十届中国信息和通信安全学术会议 (8)
    2013全国软件与应用学术会议 (0)
    2013和谐人机环境联合学术会议 (0)
    2013服务化软件 (0)
    2013年全国理论计算机科学学术年会 (39)
    2013Petri 网 (0)
    2013容错计算 (10)
    网络与信息安全 (18)
    2013' 粗糙集 (0)
    CCML 2013 (35)
    2013 CCF人工智能会议 (21)
    第十三届全国软件与应用学术会议 (36)
    高性能与云计算 (9)
    第十四届中国多值逻辑与模糊逻辑学术会议 (5)
    2014年全国高性能计算机学术年会 (19)
    第四届全国可穿戴计算学术会议 (6)
    第十届和谐人机环境联合学术会议 (34)
    2014江苏省人工智能学术会议 (0)
    2014全国理论计算机科学年会 (0)
    2014数据挖掘会议 (0)
    智能控制 (14)
    模式识别 (14)
    数据存储与挖掘 (27)
    智能算法与优化 (12)
    2018 中国多媒体大会 (14)
    2019 中国多媒体大会 (0)
    图像处理& 多媒体技术 (31)
    体系结构 (133)
    图形图像 (281)
    数据库与数据挖掘 (254)
    软件工程 (267)
    计算机网络与信息安全 (4726)
    无线网络与通信技术 (29)
    分布式与网络应用 (19)
    CRSSC-CWI-CGrC2015 (43)
    新技术应用 (23)
    物联网技术及应用 (9)
    服务化的科研成果 (32)
    智能移动身份认证 (10)
    机器学习 (10)
    智能信息处理 (11)
    2015 第十五届全国Petri 网理论与应用学术会议 (16)
    2015 第五届全国可信计算学术会议 (7)
    2015 年第三届CCF 大数据学术会议 (18)
    2015年第二十四届全国多媒体学术会议 (12)
    2015年全国理论计算机科学学术年会 (8)
    第十五届中国机器学习会议 (12)
    2015年中国计算机学会人工智能会议 (19)
    第五届全国智能信息处理学术会议 (7)
    第四届CCF大数据学术会议 (9)
    第六届全国软件分析测试与演化学术会议 (7)
    2016 年全国软件与应用学术会议 (28)
    2016 全国高性能计算学术年会 (6)
    生物信息学 (5)
    网络& 通信 (11)
    理论计算机科学 (10)
    计算机图形学&多媒体 (66)
    计算机软件 (53)
    计算机视觉:理论与应用 (16)
    计算机体系结构 (12)
    学科建设 (2)
    计算机图形学 & 多媒体 (22)
    数据库 & 大数据 & 数据科学 (23)
    计算机科学理论 (19)
    计算机网络 (270)
    理论计算机科学专题前言 (1)
    数据库&大数据&数据科学祷* (0)
    计算机软件* (10)
    高性能计算* (10)
    联邦学习* (11)
    边缘智能协同技术及前沿应用 (10)
    交叉&前沿 (4)
    可解释性人工智能 (11)
    数据库&大数据&数据科学 (15)
    软件&交叉 (16)
    数据安全 (11)
    图像处理&多媒体技术 (36)
    大数据&数据科学 (37)
    网络&通信 (13)
    创刊五十周年特别专题 (10)
    学科前沿 (5)
    紧凑数据结构 (7)
    新计算模式下的信息安全防护 (6)
    知识图谱赋能的知识工程:理论、技术与系统专题 (11)
    计算机图形学&多媒体 (10)
    粒计算与知识发现 (16)
    交叉&前沿 (0)
    计算机软件&体系架构 (8)
    交叉&应用 (14)
    计算机软件&体系架构 (10)
    计算机科学 (0)
    2017 年全国理论计算机科学学术年会 (0)
    网络与通信 (832)
    信息安全 (1433)
    软件与数据库技术 (424)
    人工智能 (2494)
    综述 (478)
    图形图像与模式识别 (668)
    第十四届全国Web信息系统及其应用学术会议 (8)
    第十六届全国软件与应用学术会议 (13)
    2018 年中国粒计算与知识发现学术会议 (12)
    数字信息处理 (19)
    智能控制与优化 (23)
    2012多值逻辑专栏 (43)
    第五届CCF 大数据学术会议 (7)
    第三十三届全国信息存储技术学术会议 (5)
    综述研究 (50)
    智能计算 (357)
    模式识别与图像处理 (329)
    大数据与数据挖掘 (107)
    综合、交叉与应用 (132)
    2017 中国多媒体大会 (12)
    图形图像及体系结构 (124)
    智能应用 (9)
    智能优化 (6)
    2018 年第七届中国数据挖掘会议 (14)
    大数据与数据科学 (36)
    大数据与数据科学* (0)
    数据科学 (18)
    数据库&大数据&数据科学 (339)
    大数据与数据科学* (35)
    第35届中国数据库学术会议 (8)
    计算机图形学&多媒体 (363)
    智能软件工程 (17)
    前言 (7)

  • 2024 Vol. 51 No. 6A

  • 2024 Vol. 51 No. 6

  • 2024 Vol. 51 No. 5

  • 2024 Vol. 51 No. 4
  • 2024,51 (6A) 
  • 2024,51 (6) 
  • 2024,51 (5) 
  • 2024,51 (4) 
  • 2024,51 (3) 
  • 2024,51 (2) 
  • 2024,51 (1) 
  • 2023,50 (12) 
  • 2023,50 (11A) 
  • 2023,50 (11) 
  • 2023,50 (10) 
  • 2023,50 (9) 
  • 2023,50 (8) 
  • 2023,50 (7) 
  • 2023,50 (6A) 
  • 2023,50 (6) 

  • 更多>>
  • 时间序列预测方法综述
    杨海民, 潘志松, 白玮
    计算机科学. 2019 Vol. 46 (1): 21-28
    摘要 (3912) PDF (1294KB) (12090)
    基于机器视觉的Web应用页面元素识别及可视化脚本生成
    李子东, 姚怡飞, 王微微, 赵瑞莲
    计算机科学. 2022 Vol. 49 (11): 65-75
    摘要 (593) PDF (2624KB) (12047)
    哈密顿图判定问题的多项式时间算法
    姜新文
    计算机科学. 2020 Vol. 47 (7): 8-20
    摘要 (5988) PDF (1760KB) (11900)
    基于GCC编译器的流式存储优化方法
    高秀武, 黄亮明, 姜军
    计算机科学. 2022 Vol. 49 (11): 76-82
    摘要 (1184) PDF (2713KB) (11812)
    结合Doc2Vec和BERT嵌入技术的补丁验证方法
    黄颖, 姜淑娟, 蒋婷婷
    计算机科学. 2022 Vol. 49 (11): 83-89
    摘要 (430) PDF (2492KB) (11222)
    ROP漏洞利用脚本的语义还原和自动化移植方法
    施瑞恒, 朱云聪, 赵易如, 赵磊
    计算机科学. 2022 Vol. 49 (11): 49-54
    摘要 (434) PDF (2661KB) (10909)
    自动化软件重构质量目标与非质量目标有效性研究
    郭亚琳, 李晓晨, 任志磊, 江贺
    计算机科学. 2022 Vol. 49 (11): 55-64
    摘要 (402) PDF (3409KB) (10836)
    基于决策树算法的API误用检测
    李康乐, 任志磊, 周志德, 江贺
    计算机科学. 2022 Vol. 49 (11): 30-38
    摘要 (827) PDF (3144KB) (10806)
    AutoUnit:基于主动学习和预测引导的测试自动生成
    张大林, 张哲玮, 王楠, 刘吉强
    计算机科学. 2022 Vol. 49 (11): 39-48
    摘要 (823) PDF (2609KB) (10706)
    面向软件缺陷报告的缺陷定位方法研究与进展
    倪珍, 李斌, 孙小兵, 李必信, 朱程
    计算机科学. 2022 Vol. 49 (11): 8-23
    摘要 (753) PDF (2280KB) (10554)
    面向SOA的集成测试序列生成算法研究
    张冰清, 费琪, 王轶辰, 杨召
    计算机科学. 2022 Vol. 49 (11): 24-29
    摘要 (681) PDF (1866KB) (10158)
    社区问答系统研究综述
    张中峰,李秋丹
    计算机科学. 2010 Vol. 37 (11): 19-23
    摘要 (320) PDF (551KB) (10075)
    实例编程研究进展与挑战
    严倩羽, 李弋, 彭鑫
    计算机科学. 2022 Vol. 49 (11): 1-7
    摘要 (594) PDF (1921KB) (9482)
    分布式机器学习平台与算法综述
    舒娜,刘波,林伟伟,李鹏飞
    计算机科学. 2019 Vol. 46 (3): 9-18
    摘要 (1839) PDF (1744KB) (8395)
    云边协同综述
    陈玉平, 刘波, 林伟伟, 程慧雯
    计算机科学. 2021 Vol. 48 (3): 259-268
    摘要 (1741) PDF (1593KB) (7931)
    模糊测试技术研究综述
    张雄,李舟军
    计算机科学. 2016 Vol. 43 (5): 1-8
    摘要 (1286) PDF (833KB) (7253)
    多智能体强化学习综述
    杜威, 丁世飞
    计算机科学. 2019 Vol. 46 (8): 1-8
    摘要 (3091) PDF (1381KB) (7002)
    智能博弈对抗方法:博弈论与强化学习综合视角对比分析
    袁唯淋, 罗俊仁, 陆丽娜, 陈佳星, 张万鹏, 陈璟
    计算机科学. 2022 Vol. 49 (8): 191-204
    摘要 (2778) PDF (4699KB) (6927)
    代码相似性检测方法与工具综述
    张丹,罗平
    计算机科学. 2020 Vol. 47 (3): 5-10
    摘要 (989) PDF (1428KB) (6689)
    符号执行研究综述
    叶志斌,严波
    计算机科学. 2018 Vol. 45 (6A): 28-35
    摘要 (749) PDF (1797KB) (6355)
公告
专题