主管/主办:重庆西南信息有限公司
CODEN JKIEBK
-
R语言程序包依赖关系与更新情况的实证研究
程弘正, 杨文华. R语言程序包依赖关系与更新情况的实证研究[J]. 计算机科学, 2024, 51(6): 1-11.
CHENG Hongzheng, YANG Wenhua. Empirical Study on Dependencies and Updates of R Packages[J]. Computer Science, 2024, 51(6): 1-11. - 程弘正, 杨文华
- 计算机科学. 2024, 51 (6): 1-11. doi:10.11896/jsjkx.230200069
- 摘要 ( 250 ) PDF(3059KB) ( 528 )
- 参考文献 | 相关文章 | 多维度评价
-
作为一款统计分析和统计制图的优秀工具,R在统计分析和人工智能领域得到了广泛应用,并且拥有丰富的开源生态系统,相关R语言程序包(R包)的数量也在持续增长。R包开发模式的特征,即新开发R包往往通过引入已有的R包来实现功能,导致R包之间的依赖关系非常复杂,甚至出现依赖冲突。而引起此问题的原因除了依赖关系外,还有R包的更新。为了了解现有R包的发展现状,需要对R包的依赖和更新情况进行深入实证研究。但已有关于R的实证研究关注的主要是整个R生态系统,没有专门针对R包的依赖和更新的具体分析。为了弥补这一空缺,基于CRAN与GitHub上的数据对常用R包的依赖关系、包的更新情况、存在的依赖冲突隐患以及R包的依赖更新情况4方面展开了详细分析。发现R包之间的依赖关系复杂、每个包依赖的包的数量普遍较多但依赖集中于一部分R包,虽然常用R包的更新频率较快,但其中依然存在不少依赖间的冲突(不一致);同时,还对这些R包的依赖冲突进行了检测和分类。实证研究结果能够让R开发者和使用者更加了解R包的发展现状,同时提供了一些可以帮助R包的开发者在开发过程中避免隐患的建议,总结了研究者在R包依赖和更新相关问题上可以进一步探究的方向。
-
基于词汇的源代码克隆检测技术综述
刘春玲, 戚旭衍, 唐永鹤, 孙雪凯, 李晴浩, 张雨. 基于词汇的源代码克隆检测技术综述[J]. 计算机科学, 2024, 51(6): 12-22.
LIU Chunling, QI Xuyan, TANG Yonghe, SUN Xuekai, LI Qinghao, ZHANG Yu. Summary of Token-based Source Code Clone Detection Techniques[J]. Computer Science, 2024, 51(6): 12-22. - 刘春玲, 戚旭衍, 唐永鹤, 孙雪凯, 李晴浩, 张雨
- 计算机科学. 2024, 51 (6): 12-22. doi:10.11896/jsjkx.230400117
- 摘要 ( 186 ) PDF(2194KB) ( 512 )
- 参考文献 | 相关文章 | 多维度评价
-
代码克隆指在软件开发过程中对源代码复用、修改、重构产生的文本相似或结构相似的代码。代码克隆对提升软件开发效率、节约开发成本有积极作用,但也会引起Bug传播,并对软件的稳定性、可维护性产生负面影响。代码克隆检测在剽窃检测、漏洞检测、版权侵权等领域具有重要的研究意义和应用价值。基于词汇的克隆检测技术能快速检测1-3型克隆,能扩展到其他编程语言,已被广泛应用于大规模克隆检测任务中。文中对近5年基于词汇的克隆检测技术的研究现状进行了梳理,根据相似性算法中的基本计算粒度将其分为4类,并对10余个技术特征进行了分析和总结,讨论其局限性及面临的挑战,最后结合新技术的发展提出了基于词汇的克隆检测技术未来可能的研究方向。
-
一种基于词法特征和数据挖掘的无意义变量名检测方法
姜艳杰, 东春浩, 刘辉. 一种基于词法特征和数据挖掘的无意义变量名检测方法[J]. 计算机科学, 2024, 51(6): 23-33.
JIANG Yanjie, DONG Chunhao, LIU Hui. Nonsense Variable Names Detection Method Based on Lexical Features and Data Mining[J]. Computer Science, 2024, 51(6): 23-33. - 姜艳杰, 东春浩, 刘辉
- 计算机科学. 2024, 51 (6): 23-33. doi:10.11896/jsjkx.231100030
- 摘要 ( 235 ) PDF(2719KB) ( 594 )
- 参考文献 | 相关文章 | 多维度评价
-
标识符是代码的重要组成部分,也是人们理解代码语义的关键元素之一。变量名是最常见的标识符之一,其质量对于代码的可读性和可理解性有着重要的意义。然而,因为各种原因程序员经常使用一些毫无意义的变量名,如“a”和“var”等。这些无意义的变量名严重降低了代码的可理解性,需要进行检测并重构(重命名)。为此,提出了一种基于词法特征和数据挖掘的自动化方法,以检测代码中无意义的变量名。首先,对开源代码中的无意义变量名进行了实证分析,发现无意义变量名通常比较短且不包含任何有意义的单词,因此可以利用词法特征筛选出名称较短且不包含有意义单词的可疑变量名。如果可疑变量名包含缩写词,则使用缩写词扩展算法进行扩展,以获得完整的变量名。然后,基于数据挖掘算法判断可疑变量名是否为约定俗成的常用变量名。有些常用的变量名,如 “i”和“e”,虽然字面上没有明确的语义,但是通过约定俗成的表示规范,程序员可以理解该变量的语义,因此不算是无意义的变量名,也不需要进行重构。如果可疑变量名称不是约定俗成的常用变量名,则断定该变量名为无意义的变量名,并提醒程序员进行重命名。在开源数据集上进行实验,结果表明,该方法具有较高的准确率,其平均查准率为85%,平均查全率为91.5%。
-
重新审视面向CNN模型的测试样例选取:考虑模型校准
赵通, 沙朝锋. 重新审视面向CNN模型的测试样例选取:考虑模型校准[J]. 计算机科学, 2024, 51(6): 34-43.
ZHAO Tong, SHA Chaofeng. Revisiting Test Sample Selection for CNN Under Model Calibration[J]. Computer Science, 2024, 51(6): 34-43. - 赵通, 沙朝锋
- 计算机科学. 2024, 51 (6): 34-43. doi:10.11896/jsjkx.230400029
- 摘要 ( 153 ) PDF(2876KB) ( 458 )
- 参考文献 | 相关文章 | 多维度评价
-
深度神经网络(DNN)已被广泛应用于各种任务,而在部署前对DNN进行充分测试尤为重要,因此需要构建能够对DNN进行充分测试的测试集。由于标注成本受限,通常通过测试样例选取的方式得到测试子集。然而,人们使用基于预测不确定性的方法(该方法在发现误分类样例和提升重训练表现方面表现出卓越的能力)进行测试样例选取时,忽略了对测试样例的预测不确定性估计是否准确的问题。为了填补上述研究的空白,通过实验定性和定量地揭示了模型校准程度和测试样例选取任务中使用的不确定性指标之间的相关性。校准模型会使模型有更准确的预测不确定性估计,因此研究了不同校准程度的模型用不确定指标选取得到的测试子集质量是否不同。在3个公开数据集和4个卷积神经网络(CNN)架构模型上进行了充分的实验和分析,结果表明在CNN架构模型上:1)不确定指标和模型校准存在一定程度的相关性;2)校准程度好的模型所选择的测试子集质量优于校准程度差的模型选择的测试子集质量。在发现模型误分类样例的能力上,70.57%经过校准训练后的模型对应的实验结果优于未校准模型对应的实验结果。因此在测试样例选取任务中考虑模型校准十分重要,且可以使用模型校准来提升测试样例选取的表现。
-
一种结合代码片段和混合主题模型的软件数据聚类方法
魏林林, 沈国华, 黄志球, 蔡梦男, 郭菲菲. 一种结合代码片段和混合主题模型的软件数据聚类方法[J]. 计算机科学, 2024, 51(6): 44-51.
WEI Linlin, SHEN Guohua, HUANG Zhiqiu, CAI Mengnan, GUO Feifei. Software Data Clustering Method Combining Code Snippets and Hybrid Topic Models[J]. Computer Science, 2024, 51(6): 44-51. - 魏林林, 沈国华, 黄志球, 蔡梦男, 郭菲菲
- 计算机科学. 2024, 51 (6): 44-51. doi:10.11896/jsjkx.230300091
- 摘要 ( 91 ) PDF(2397KB) ( 305 )
- 参考文献 | 相关文章 | 多维度评价
-
使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主题模型对文本数据建模,易得到不稳定的聚类结果。文中提出了一种结合代码片段和混合主题模型的聚类方法,并使用Stack Overflow作为数据源,构造了在该平台上被提问数量排名前60的Python第三方库数据集,经过建模,该数据集最终划分为以下6个不同的领域:网络安全、数据分析、人工智能、文本处理、软件开发和系统终端。实验结果表明,在自动评估和人工评估的指标上,使用代码片段结合文本进行主题建模,在聚类结果划分的质量上表现良好,而联合多个模型进行实验,一定程度上提高了聚类结果的稳定性和准确性。
-
面向TPU粗粒度指令的自动张量化方法
刘磊, 周志德, 刘兴祥, 车皓阳, 姚雷, 江贺. 面向TPU粗粒度指令的自动张量化方法[J]. 计算机科学, 2024, 51(6): 52-60.
LIU Lei, ZHOU Zhide, LIU Xingxiang, CHE Haoyang, YAO Lei, JIANG He. Automatic Tensorization for TPU Coarse-grained Instructions[J]. Computer Science, 2024, 51(6): 52-60. - 刘磊, 周志德, 刘兴祥, 车皓阳, 姚雷, 江贺
- 计算机科学. 2024, 51 (6): 52-60. doi:10.11896/jsjkx.230800049
- 摘要 ( 91 ) PDF(3610KB) ( 349 )
- 参考文献 | 相关文章 | 多维度评价
-
张量化是通过调用硬件特定指令对张量运算进行加速的过程。TPU支持多种粗粒度指令,可表示神经网络级别的算子,且没有明确的运算规模限制。现有张量化方法对于粗粒度指令需要手写大量的IR匹配片段,且难以实现灵活的双缓存(ping-pong buffer)形式的指令并行优化,不利于扩展至TPU场景。为此,提出了一种面向TPU粗粒度指令的自动张量化方法——Tir2TPU。首先,基于TensorIR抽象语法树的分析对运算程序进行指令替换。其次,设计了一种模拟硬件行为的并行模型以实现指令并行优化。最后,构建了基于TPU硬件特征的程序调度空间以实现快速自动调优。实验对矩阵乘法等5种机器学习模型中常用的算子进行了性能评估。实验结果表明,Tir2TPU自动优化生成的算子与TPU自有编译器相比可取得最高3.1倍、平均1.78倍的运算加速,并且可取得平均90%的手工优化性能。
-
基于提示学习的轻量化代码生成方法
徐一然, 周宇. 基于提示学习的轻量化代码生成方法[J]. 计算机科学, 2024, 51(6): 61-67.
XU Yiran, ZHOU Yu. Prompt Learning Based Parameter-efficient Code Generation[J]. Computer Science, 2024, 51(6): 61-67. - 徐一然, 周宇
- 计算机科学. 2024, 51 (6): 61-67. doi:10.11896/jsjkx.230400137
- 摘要 ( 96 ) PDF(2373KB) ( 270 )
- 参考文献 | 相关文章 | 多维度评价
-
代码自动生成是提高软件开发效率的有效途径之一,已有的研究一般将代码生成作为一项序列到序列的任务,并且大规模预训练语言模型的微调过程往往伴随着高昂的算力开销。文中提出了一种基于提示学习的轻量化代码生成方法(Prompt Learning based Parameter-Efficient Code Generation,PPECG),该方法通过查询代码语料库中与当前需求最相似的结果作为提示,指导预训练语言模型进行代码生成,并且在该过程中固定模型的绝大多数参数以实现减少算力开销的目的。为了验证PPECG的有效性,文中选取了两个代码生成数据集,分别是CONCODE和Solidity4CG,通过计算生成结果的BLEU,CodeBLEU以及Exact Match值来验证PPECG的有效性,实验结果表明,PPECG有效地减少了微调时的显存开销,且在上述指标上基本接近甚至优于目前的SOTA方法,能够较好地完成代码生成的任务。
-
基于机器学习识别偶然正确测试用例
田帅华, 李征, 吴永豪, 刘勇. 基于机器学习识别偶然正确测试用例[J]. 计算机科学, 2024, 51(6): 68-77.
TIAN Shuaihua, LI Zheng, WU Yonghao, LIU Yong. Identifying Coincidental Correct Test Cases Based on Machine Learning[J]. Computer Science, 2024, 51(6): 68-77. - 田帅华, 李征, 吴永豪, 刘勇
- 计算机科学. 2024, 51 (6): 68-77. doi:10.11896/jsjkx.230400017
- 摘要 ( 89 ) PDF(2289KB) ( 333 )
- 参考文献 | 相关文章 | 多维度评价
-
基于频谱的故障定位(Spectrum-Based Fault Localization,SBFL)技术已被广泛研究,可以帮助开发人员快速找到程序错误位置,以降低软件测试成本。然而,测试套件中存在一种特殊的测试用例,其执行了错误的语句但能输出符合预期的结果,这种测试用例被称为偶然正确(Coincidental Correct,CC)测试用例。CC测试用例会对SBFL技术的性能产生负面影响。为了减轻CC产生的负面影响,提升SBFL技术性能,文中提出了一种基于机器学习的CC测试用例识别方法(CC test cases Identification via Machine Learning,CCIML)。CCIML结合怀疑度公式特征和程序静态特征来识别CC测试用例,从而提高SBFL技术的故障定位精度。为了评估CCIML方法的性能,文中基于Defects4J数据集进行对比实验。实验结果表明,CCIML方法识别CC测试用例的平均召回率、准确率和F1分数分别为63.89%,70.16%和50.64%,该结果优于对比方法。除此之外,采用清洗和重标策略处理CCIML方法识别出的CC测试用例后,最终取得的故障定位效果也优于对比方法。其中,在清洗策略和重标策略下,错误语句怀疑度值排在第一位的数量分别为328和312,相比模糊加权K近邻(Fuzzy Weighted K-Nearest Neighbor,FW-KNN)方法,定位到的故障数量分别增长了124.66%,235.48%。
-
基于序列的程序语义规则挖掘与违规检测方法
李孜, 周宇. 基于序列的程序语义规则挖掘与违规检测方法[J]. 计算机科学, 2024, 51(6): 78-84.
LI Zi, ZHOU Yu. Sequence-based Program Semantic Rule Mining and Violation Detection[J]. Computer Science, 2024, 51(6): 78-84. - 李孜, 周宇
- 计算机科学. 2024, 51 (6): 78-84. doi:10.11896/jsjkx.230300224
- 摘要 ( 66 ) PDF(2042KB) ( 301 )
- 参考文献 | 相关文章 | 多维度评价
-
在软件开发中,违反语义规则的源码可以正常地编译或运行,但却存在性能或功能上的缺陷。因此,如何准确地检测此类缺陷成为了一项挑战。已有的研究通常采用基于项集的规则挖掘与检测方法,但由于未能良好地结合源码的顺序信息与控制流信息,此类方法在检测能力以及准确率上都存在较大的提升空间。针对该问题,提出了一种基于序列的程序语义规则提取与违规检测方法 SPUME。该方法将程序源码转化为中间表示序列,使用序列规则挖掘算法从中提取语义规则,并基于语义规则对源码中的缺陷进行检测。为验证SPUME 的有效性,文中将其与3种基线方法进行了对比,包括PR-Miner,Tikanga以及Bugram。实验结果表明,相较于基于无序项集进行规则挖掘的PR-Miner,以及结合了图模型的Tikanga,SPUME在检测效果、检测速度以及准确率上都有显著提升。相比基于Ngram语言模型的Bugram方法,SPUME在准确率与其相当的情况下,高效地检测出了更多程序缺陷。
-
基于多目标优化算法NSGA-II的软件多样化组合方法
谢根琳, 程国振, 梁浩, 王庆丰. 基于多目标优化算法NSGA-II的软件多样化组合方法[J]. 计算机科学, 2024, 51(6): 85-94.
XIE Genlin, CHENG Guozhen, LIANG Hao, WANG Qingfeng. Software Diversity Composition Based on Multi-objective Optimization Algorithm NSGA-II[J]. Computer Science, 2024, 51(6): 85-94. - 谢根琳, 程国振, 梁浩, 王庆丰
- 计算机科学. 2024, 51 (6): 85-94. doi:10.11896/jsjkx.221100194
- 摘要 ( 81 ) PDF(3347KB) ( 312 )
- 参考文献 | 相关文章 | 多维度评价
-
软件多样化因能有效提升系统弹性、增加恶意二进制分析的成本而被广泛应用于软件开发等场景中。而如何对现有软件多样化技术进行组合部署,以在获得更高安全增益的同时保持较低的性能开销,是当前软件多样化研究的核心问题之一。针对现有软件多样化组合方法中搜索算法效率低、搜索空间小、安全性评估指标不全面、难以综合考量软件多样化对各类攻击的影响等问题,提出了一种基于多目标优化算法的软件多样化组合方法,将软件多样化组合问题构建为综合考量TLSH相似度、gadget质量分数和CPU时钟周期数指标的多目标优化模型,并设计了包括染色体编码、自适应交叉和变异算子,以及针对组合方案的有效性验证算法等在内的NSGA-II求解算法。最后,在GNU核心工具组数据集上进行实验,结果表明,该组合方法可有效生成高安全增益、低性能开销的软件多样化组合方案。
-
基于ART优化选择策略的遗传算法生成测试数据方法
李志博, 李清宝, 兰明敬. 基于ART优化选择策略的遗传算法生成测试数据方法[J]. 计算机科学, 2024, 51(6): 95-103.
LI Zhibo, LI Qingbao, LAN Mingjing. Method of Generating Test Data by Genetic Algorithm Based on ART Optimal Selection Strategy[J]. Computer Science, 2024, 51(6): 95-103. - 李志博, 李清宝, 兰明敬
- 计算机科学. 2024, 51 (6): 95-103. doi:10.11896/jsjkx.230100012
- 摘要 ( 65 ) PDF(2887KB) ( 293 )
- 参考文献 | 相关文章 | 多维度评价
-
测试数据自动生成方法是软件测试领域研究的热点。基于遗传算法的启发式搜索算法是一种路径覆盖生成测试数据的方法。文中提出了一种基于自适应随机测试(Adaptive Random Testing,ART) 算法更新种群的方法,将ART融入遗传算法,优化选择操作,动态更新种群,从而增加种群进化过程中的个体多样性,提高了收敛速度,有效地减少了陷入局部最优。 实验结果显示,与传统遗传算法生成测试数据的方法相比,改进的算法明显提高了路径覆盖率,减少了种群平均进化代数。
-
云数据库资源与参数协同调优方法研究
李雨航, 谭睿雄, 柴云鹏. 云数据库资源与参数协同调优方法研究[J]. 计算机科学, 2024, 51(6): 104-110.
LI Yuhang, TAN Ruixiong, CHAI Yunpeng. Study on Method for Collaborative Tuning Resources and Parameters of Cloud Database[J]. Computer Science, 2024, 51(6): 104-110. - 李雨航, 谭睿雄, 柴云鹏
- 计算机科学. 2024, 51 (6): 104-110. doi:10.11896/jsjkx.231000156
- 摘要 ( 69 ) PDF(2898KB) ( 295 )
- 参考文献 | 相关文章 | 多维度评价
-
云数据库中存在许多配置项,包括数据库内部的配置参数以及部署环境的虚拟机资源配置,这些配置项共同决定了数据库的读写性能和资源消耗。在资源弹性伸缩的云环境下,用户关注数据库的服务性能和资源消耗成本。然而,由于配置项众多且负载变化快速,寻找最优的配置项组合变得困难。文中针对负载动态变化的在线调优场景提出了CoTune,一种协同调节云数据库资源与参数的快速调优方法。该方法针对OLTP型动态负载,通过迭代调节云虚拟机资源配置和数据库参数配置,在保障服务质量的前提下降低资源消耗。该方法的创新点如下:首先,在每个调优周期内,采用三阶段方案对资源配额和数据库参数进行调节,优先保障服务质量;其次,根据数据库参数对不同资源的影响进行分类,减小搜索空间,快速调节参数;最后,在数据库参数调节的强化学习模型中,设计特定的奖励函数,快速获取奖励值,加快调节频率。实验结果表明,该方法相比同时调节资源和参数、单独调节资源等方法,能够在保障服务质量的前提下降低资源消耗。通过快速迭代调优,能够应对负载变化的挑战,并在动态负载环境中实现更高效的资源利用。
-
CDES:数据驱动的云数据库效能评估方法
韩宇捷, 徐志杰, 杨定裕, 黄波, 郭健美. CDES:数据驱动的云数据库效能评估方法[J]. 计算机科学, 2024, 51(6): 111-117.
HAN Yujie, XU Zhijie, YANG Dingyu, HUANG Bo, GUO Jianmei. CDES:Data-driven Efficiency Evaluation Methodology for Cloud Database[J]. Computer Science, 2024, 51(6): 111-117. - 韩宇捷, 徐志杰, 杨定裕, 黄波, 郭健美
- 计算机科学. 2024, 51 (6): 111-117. doi:10.11896/jsjkx.231000140
- 摘要 ( 89 ) PDF(2356KB) ( 275 )
- 参考文献 | 相关文章 | 多维度评价
-
在大规模云生产环境中在线评估数据库效能,对云厂商进一步优化云成本至关重要。为了评估云数据库的使用效能,提出了一种数据驱动的、基于计算与存储指标融合的云数据库效能评估方法CDES。该方法根据云数据库实例负载行为和性能画像,从计算和存储两方面选取影响云数据库成本与效能的主要指标,再结合云监控平台采集的数据,评估云数据库实例与集群的线上实际使用效能。基于CDES评估结果,进一步提出了云数据库效能优化的治理方案,提供效能优化建议,引导用户减少闲置资源。CDES已被部署在某大型互联网企业生产环境中,并用于其OLTP云数据库产品的效能评价。实验结果表明,所提方法能有效评估超过5 000个云数据库实例的集群的效能并引导治理,单位业务量下实例最高能节省40.74%的成本。
-
时序网络上异常演化模式研究
武南南, 郭泽浩, 赵一鸣, 余韦, 孙英, 王文俊. 时序网络上异常演化模式研究[J]. 计算机科学, 2024, 51(6): 118-127.
WU Nannan, GUO Zehao, ZHAO Yiming, YU Wei, SUN Ying, WANG Wenjun. Study on Anomalous Evolution Pattern on Temporal Networks[J]. Computer Science, 2024, 51(6): 118-127. - 武南南, 郭泽浩, 赵一鸣, 余韦, 孙英, 王文俊
- 计算机科学. 2024, 51 (6): 118-127. doi:10.11896/jsjkx.230600168
- 摘要 ( 54 ) PDF(5633KB) ( 305 )
- 参考文献 | 相关文章 | 多维度评价
-
许多异常子图检测方法已经被成功应用于社交网络中的事件检测、道路网络中的交通拥堵检测等任务中。 然而,在属性图中异常子图的动态演化方面,鲜有研究开展。文中提出了一种名为动态演化多异常子图扫描(DE-MASS)的方法,用于检测属性图上多个异常子图的演化模式,这是第一个捕捉相邻时间片上多个相连异常子图的动态图研究。DE-MASS在微博数据集、计算机流量数据集上的表现优于其他基准方法,并检测到3个实际应用中异常子图的演化模式:城市道路网络中的交通拥堵检测(北京、天津和南京)、社交网络(微博)中的事件检测和计算机流量网络中的网络攻击检测。
-
模体感知的自适应跨层游走社区检测
王贝贝, 信俊昌, 陈金义, 王之琼. 模体感知的自适应跨层游走社区检测[J]. 计算机科学, 2024, 51(6): 128-134.
WANG Beibei, XIN Junchang, CHEN Jinyi, WANG Zhiqiong. Motif-aware Adaptive Cross-layer Random Walk Community Detection[J]. Computer Science, 2024, 51(6): 128-134. - 王贝贝, 信俊昌, 陈金义, 王之琼
- 计算机科学. 2024, 51 (6): 128-134. doi:10.11896/jsjkx.231000142
- 摘要 ( 66 ) PDF(2859KB) ( 335 )
- 参考文献 | 相关文章 | 多维度评价
-
近年来,利用高阶交互信息进行多层网络社区检测已成为复杂网络分析领域的研究热点。尽管多层网络社区检测的研究已取得了一些进展,但大多数方法忽略了网络各层之间的联系。为了解决这一问题,提出了一种模体(motif)感知的自适应跨层游走社区检测算法(Motif-aware Adaptive Cross-Layer random walk Community Detection,MACLCD)。该算法充分考虑了多层网络各层内的高阶交互特性以及层间的相关性,有效整合了多层网络的结构信息,提高了社区检测结果的准确性。具体地,首先从网络和节点的角度进行综合度量,揭示网络层间相关性;其次,考虑了各层网络可能具有不同的局部和全局结构特征,利用motif识别各层网络特有的高阶交互结构,构建多层加权混合阶网络;进一步,设计了多层网络跨层游走模型,并引入跳转因子,以确保随机游走能够自适应地遍历多层网络,从而捕获更丰富的网络结构信息。在4个真实的网络数据集上进行实验比较分析,结果表明MACLCD算法在社区检测方面性能较优,相比目前表现最佳的对比算法在ACC和NMI上分别提高了10%和8.9%。
-
基于混合高斯先验变分自编码器的深度多球支持向量数据描述
武慧囡, 邢红杰, 李刚. 基于混合高斯先验变分自编码器的深度多球支持向量数据描述[J]. 计算机科学, 2024, 51(6): 135-143.
WU Huinan, XING Hongjie, LI Gang. Deep Multiple-sphere Support Vector Data Description Based on Variational Autoencoder with Mixture-of-Gaussians Prior[J]. Computer Science, 2024, 51(6): 135-143. - 武慧囡, 邢红杰, 李刚
- 计算机科学. 2024, 51 (6): 135-143. doi:10.11896/jsjkx.230300194
- 摘要 ( 79 ) PDF(1934KB) ( 309 )
- 参考文献 | 相关文章 | 多维度评价
-
随着数据维度和规模的不断增加,基于深度学习的异常检测方法取得了优异的检测性能,其中深度支持向量数据描述(Deep SVDD)得到了广泛应用。然而,要缓解超球崩溃问题,就需要对Deep SVDD中映射网络的各种参数施加约束。为了进一步提高Deep SVDD中映射网络的特征学习能力,同时解决超球崩溃问题,提出了基于混合高斯先验变分自编码器的深度多球支持向量数据描述(Deep Multiple-Sphere Support Vector Data Description Based on Variational Autoencoder with Mixture-of-Gaussians Prior,DMSVDD-VAE-MoG)。首先,通过预训练初始化网络参数和多个超球中心;其次,利用映射网络获得训练数据的潜在特征,对VAE损失、多个超球的平均半径和潜在特征到所对应超球中心的平均距离进行联合优化,以获得最优网络连接权重和多个最小超球。实验结果表明,所提DMSVDD-VAE-MoG在MNIST,Fashion-MNIST和CIFAR-10上均取得了优于其他8种相关方法的检测性能。
-
有序标签噪声的鲁棒估计与过滤方法
姜高霞, 王菲, 许行, 王文剑. 有序标签噪声的鲁棒估计与过滤方法[J]. 计算机科学, 2024, 51(6): 144-152.
JIANG Gaoxia, WANG Fei, XU Hang, WANG Wenjian. Robust Estimation and Filtering Methods for Ordinal Label Noise[J]. Computer Science, 2024, 51(6): 144-152. - 姜高霞, 王菲, 许行, 王文剑
- 计算机科学. 2024, 51 (6): 144-152. doi:10.11896/jsjkx.230700115
- 摘要 ( 71 ) PDF(3032KB) ( 243 )
- 参考文献 | 相关文章 | 多维度评价
-
较大规模的标注数据集中难免会存在标签噪声,这在一定程度上限制了模型的泛化性能。有序回归数据集的标签是离散值,但不同标签之间又有一定次序关系。虽然有序回归的标签兼有分类和回归标签的特征,但面向分类和回归任务的标签噪声过滤算法对有序标签噪声并不完全适用。针对此问题,提出了标签含噪时回归模型的Akaike泛化误差估计,在此基础上设计了面向有序回归任务的标签噪声过滤框架。此外,提出了一种鲁棒的有序标签噪声估计方法,其采用基于中位数的融合策略以降低异常估计分量的干扰。最后,该方法与所提框架结合形成了噪声鲁棒融合过滤(Robust Fusion Filtering,RFF)算法。在标准数据集和真实年龄估计数据集上均验证了算法的有效性。实验结果表明,在有序回归任务中,RFF算法性能优于其他分类和回归过滤算法,能够适应不同类型的噪声数据,并有效提升数据质量和模型泛化性能。
-
基于子空间的I-nice聚类算法
何一帆, 何玉林, 崔来中, 黄哲学. 基于子空间的I-nice聚类算法[J]. 计算机科学, 2024, 51(6): 153-160.
HE Yifan, HE Yulin, CUI Laizhong, HUANG Zhexue. Subspace-based I-nice Clustering Algorithm[J]. Computer Science, 2024, 51(6): 153-160. - 何一帆, 何玉林, 崔来中, 黄哲学
- 计算机科学. 2024, 51 (6): 153-160. doi:10.11896/jsjkx.230800200
- 摘要 ( 74 ) PDF(2587KB) ( 286 )
- 参考文献 | 相关文章 | 多维度评价
-
高维数据的子空间聚类是无监督学习领域的热点研究问题,其难点在于寻找恰当的子空间以及其中的数据簇。大多数现有的子空间聚类算法均存在计算复杂度高和参数选择难的缺陷,这是因为在高维数据中子空间的组合数量很大,算法的执行时间非常长,且不同数据集和应用场景需要不同的参数设定。为此,提出了基于子空间的I-nice(简记为sub-I-nice)聚类算法用于识别高维数据中子空间内数据簇的个数。首先,该算法将原始数据维度随机划分成多个维度组,根据维度组生成子空间样本;接着,使用最新的I-niceMO算法对每个子空间数据进行聚类;最后,采用新设计的球模型对所有子空间的基聚类结果进行集成。在含有噪声的高维仿真数据集上对所提出的sub-I-nice算法进行了详细的性能验证,实验结果表明sub-I-nice算法相比其他3种代表性聚类算法有更好的准确性和鲁棒性,从而证实了其合理性和有效性。
-
独立级联传播模型下的连续影响力最大化
邓紫维, 陈崚, 刘维. 独立级联传播模型下的连续影响力最大化[J]. 计算机科学, 2024, 51(6): 161-171.
DENG Ziwei, CHEN Ling, LIU Wei. Continuous Influence Maximization Under Independent Cascade Propagation Model[J]. Computer Science, 2024, 51(6): 161-171. - 邓紫维, 陈崚, 刘维
- 计算机科学. 2024, 51 (6): 161-171. doi:10.11896/jsjkx.230400006
- 摘要 ( 53 ) PDF(6364KB) ( 312 )
- 参考文献 | 相关文章 | 多维度评价
-
影响力最大化是在社交网络中寻求一组最具有影响力的用户作为种子节点,通过种子节点向网络中传播信息,使得传播的范围最大化。现有的对影响力最大化的研究大多是针对每个节点,考虑是否将其作为种子节点。而在实际应用中,需要根据用户的影响力来赋予他成为种子的概率,使得根据这个概率分布得到的种子集合的影响力传播范围的期望值最大化,这就是连续影响力最大化问题。文中提出了一种独立级联传播模型下连续影响力最大化算法。该算法首先将上述问题抽象成一个约束优化问题,然后抽样若干个可能的种子集,并对每个可能的种子集估计影响的传播范围;使用梯度下降法,在每轮迭代中根据估计的传播范围计算各个方向的增量值,取最大增量的方向作为梯度进行目标函数值的迭代更新,从而得到目标函数值的最优解。在真实和虚拟网络上进行实验,结果表明,该算法在影响范围的期望值上优于Random,Degree,UD和CD等算法。
-
基于图神经网络的乳腺癌病理图像分析方法综述
陈思硕, 王晓东, 刘西洋. 基于图神经网络的乳腺癌病理图像分析方法综述[J]. 计算机科学, 2024, 51(6): 172-185.
CHEN Sishuo, WANG Xiaodong, LIU Xiyang. Survey of Breast Cancer Pathological Image Analysis Methods Based on Graph Neural Networks[J]. Computer Science, 2024, 51(6): 172-185. - 陈思硕, 王晓东, 刘西洋
- 计算机科学. 2024, 51 (6): 172-185. doi:10.11896/jsjkx.230400106
- 摘要 ( 148 ) PDF(3672KB) ( 379 )
- 参考文献 | 相关文章 | 多维度评价
-
病理诊断是癌症诊断和治疗过程中的金标准,利用人工智能模型对癌症病理图像进行自动分析不仅可以减轻病理学家的工作负担,还可以提高诊断结果的准确性。然而,病理图像的大尺度特点以及对预测结果可解释性的高要求为人工智能模型带来了巨大的挑战。在近年来的研究中,图神经网络在建模图像中实体的空间上下文关系及可解释性方面都展现出了强大的能力,为数字病理的研究提供了新的思路。文中回顾了近年来计算机视觉领域的相关工作,分析了图神经网络在乳腺癌病理图像分析中的优势,分类和比较了现有的面向乳腺癌病理图像的图构建方法,分析和对比了乳腺癌病理图像分析中的图神经网络模型,整理了近年来的研究中常用的工具包与公开数据集,总结了基于图神经网络的乳腺癌病理图像分析研究中存在的挑战并对未来的研究方向进行了展望。
-
异质虹膜识别研究综述
孔佳琳, 张琪, 王财勇. 异质虹膜识别研究综述[J]. 计算机科学, 2024, 51(6): 186-197.
KONG Jialin, ZHANG Qi, WANG Caiyong. Review of Heterogeneous Iris Recognition[J]. Computer Science, 2024, 51(6): 186-197. - 孔佳琳, 张琪, 王财勇
- 计算机科学. 2024, 51 (6): 186-197. doi:10.11896/jsjkx.231200175
- 摘要 ( 82 ) PDF(4603KB) ( 298 )
- 参考文献 | 相关文章 | 多维度评价
-
虹膜图像采集环境和设备的不同导致虹膜注册和识别样本差异较大,给传统的虹膜识别技术带来了挑战。异质虹膜识别问题已成为学术界和工业界关注的焦点。文中从不同层级、样本差异性以及单源和多源3个角度对现有的异质虹膜识别方法进行了分类和综述,总结了目前异质虹膜识别的最新进展。按照跨质量、跨设备和跨光谱的分类对现有的异质虹膜数据集进行综述,并总结概述虹膜识别评价指标,以便研究人员更好地评估和验证算法的性能。最后,从环境鲁棒性、数据异质性建模和多模态融合3个方向,对未来异质虹膜识别研究的发展方向进行了展望。
-
基于对比学习的视觉增强多模态命名实体识别
于碧辉, 谭淑月, 魏靖烜, 孙林壮, 卜立平, 赵艺曼. 基于对比学习的视觉增强多模态命名实体识别[J]. 计算机科学, 2024, 51(6): 198-205.
YU Bihui, TAN Shuyue, WEI Jingxuan, SUN Linzhuang, BU Liping, ZHAO Yiman. Vision-enhanced Multimodal Named Entity Recognition Based on Contrastive Learning[J]. Computer Science, 2024, 51(6): 198-205. - 于碧辉, 谭淑月, 魏靖烜, 孙林壮, 卜立平, 赵艺曼
- 计算机科学. 2024, 51 (6): 198-205. doi:10.11896/jsjkx.230400052
- 摘要 ( 129 ) PDF(3102KB) ( 333 )
- 参考文献 | 相关文章 | 多维度评价
-
多模态命名实体识别(MNER)的目的是在给定的图像-文本对中检测实体范围并将其分类为相应的实体类型。尽管现存的MNER方法取得了成功,但它们都集中在使用图像编码器提取视觉特征后,不做增强或过滤处理,直接送入跨模态交互机制。此外,由于文本和图像的表示来自不同的编码器,很难弥合两种模态之间的语义鸿沟,因此,提出了一个基于对比学习的视觉增强多模态命名实体识别模型(MCLAug)。首先,使用ResNet收集图像特征,在此基础上提出金字塔双向融合策略,将低层次高分辨率和高层次强语义的图像信息结合起来,以增强视觉特征。其次,利用CLIP 模型中的多模态对比学习思想,计算并最小化对比损失,使两种模态的表示更加一致。最后,利用跨模态注意力机制和门控融合机制获得融合后的图像和文本表示,并通过CRF解码器来执行MNER任务。在两个公开数据集上进行了对比实验并进行消融研究和案例研究,结果证明了所提模型的有效性。
-
基于加权有界形变函数的可形变图像配准模型
闵莉花, 丁田中, 金正猛. 基于加权有界形变函数的可形变图像配准模型[J]. 计算机科学, 2024, 51(6): 206-214.
MIN Lihua, DING Tianzhong, JIN Zhengmeng. Deformable Image Registration Model Based on Weighted Bounded Deformation Function[J]. Computer Science, 2024, 51(6): 206-214. - 闵莉花, 丁田中, 金正猛
- 计算机科学. 2024, 51 (6): 206-214. doi:10.11896/jsjkx.230400090
- 摘要 ( 69 ) PDF(4146KB) ( 277 )
- 参考文献 | 相关文章 | 多维度评价
-
可形变图像配准是图像处理领域中一个非常重要的课题,是计算机视觉中最基本的问题之一,也是医学图像分析的一个难题。文中研究了两幅单模态灰度图像之间的图像配准问题,充分考虑了参考图像的边缘信息,提出了一个新的基于加权有界形变函数的可形变图像配准模型。首次提出了加权的有界形变函数空间,给出了该空间的定义及相关结论,并从理论上证明了所提模型解的存在性。同时,利用梯度下降法设计了有效的算法进行数值求解,分别在合成图像和医学图像上进行数值实验。实验结果和定量评估结果表明,与对比模型相比,所提模型由于引入了控制函数且将加权有界形变函数作为正则项,得到了更精确的配准结果,特别是在图像边缘及一些细节处配准效果有明显提高。
-
基于BEV占位预测的激光-毫米波雷达融合目标检测算法
李越豪, 王邓江, 鉴海防, 王洪昌, 程清华. 基于BEV占位预测的激光-毫米波雷达融合目标检测算法[J]. 计算机科学, 2024, 51(6): 215-222.
LI Yuehao, WANG Dengjiang, JIAN Haifang, WANG Hongchang, CHENG Qinghua. LiDAR-Radar Fusion Object Detection Algorithm Based on BEV Occupancy Prediction[J]. Computer Science, 2024, 51(6): 215-222. - 李越豪, 王邓江, 鉴海防, 王洪昌, 程清华
- 计算机科学. 2024, 51 (6): 215-222. doi:10.11896/jsjkx.230500085
- 摘要 ( 87 ) PDF(3080KB) ( 325 )
- 参考文献 | 相关文章 | 多维度评价
-
激光雷达工作环境中的光束衰减和目标遮挡会导致输出点云出现远端稀疏的问题,从而引起基于激光雷达的3D目标检测算法的检测精度随距离衰减的现象。针对这一问题,提出了一种基于鸟瞰图视角(BEV)空间内目标占位预测的激光-毫米波雷达融合目标检测算法。首先提出了一种简化的BEV占位预测子网络,用于生成位置相关的毫米波雷达特征,同时有助于解决毫米波雷达数据稀疏带来的网络收敛困难的问题。然后,为了实现跨模态特征融合,设计了一种基于BEV空间特征关联的多尺度激光-毫米波雷达特征融合层结构。在nuScenes数据集上进行实验,结果表明,所提出的毫米波雷达分支网络的平均检测精度(mAP)达到21.6%,推理时间为8.3ms。在加入融合层结构后,多模态检测算法较基线算法CenterPoint的mAP提升了2.9%,同时增加的额外推理时间开销仅为8.6ms,在距离传感器30m位置处,多模态算法对于nuScenes数据集中10个类别的检测精度达成率分别较CenterPoint提升了2.1%~16.0%。
-
基于自适应光子和分层色散图的实时色散渲染方法
罗元孟, 张军. 基于自适应光子和分层色散图的实时色散渲染方法[J]. 计算机科学, 2024, 51(6): 223-230.
LUO Yuanmeng, ZHANG Jun. Real-time Dispersion Rendering Method Based on Adaptive Photons and Hierarchical Dispersion Map[J]. Computer Science, 2024, 51(6): 223-230. - 罗元孟, 张军
- 计算机科学. 2024, 51 (6): 223-230. doi:10.11896/jsjkx.230300097
- 摘要 ( 83 ) PDF(3764KB) ( 275 )
- 参考文献 | 相关文章 | 多维度评价
-
焦散是光线经过反射或折射后汇集形成的高亮区域现象,色散是由于折射焦散中不同波长的单色光折射率差异而出现的彩色光谱现象,是渲染逼真半透明物体时复杂和耗时的光照计算步骤。在渲染色散时,现有光线追踪技术必须依赖高端GPU硬件才能实现实时渲染。基于图像空间的焦散图技术,文中提出一种简洁、高效的实时色散渲染方法。提出了采样7个单色光并自适应调整7色光子尺寸的方法,用于近似整条色散光谱的渲染;并提出了分层色散图策略,避免了光子光栅化尺寸的增加,提高了渲染效率。实验结果表明,所提方法在个人电脑上可做到实时渲染,以离散采样光谱的7个单色光模拟了整条连续光谱,减少了渲染的计算量和存储量,并且改善了基于图像空间技术的噪点问题。
-
融合Transformer与多阶段学习框架的点云上采样网络
李泽锴, 柏正尧, 肖霄, 张奕涵, 尤逸琳. 融合Transformer与多阶段学习框架的点云上采样网络[J]. 计算机科学, 2024, 51(6): 231-238.
LI Zekai, BAI Zhengyao, XIAO Xiao, ZHANG Yihan, YOU Yilin. Point Cloud Upsampling Network Incorporating Transformer and Multi-stage Learning Framework[J]. Computer Science, 2024, 51(6): 231-238. - 李泽锴, 柏正尧, 肖霄, 张奕涵, 尤逸琳
- 计算机科学. 2024, 51 (6): 231-238. doi:10.11896/jsjkx.230300154
- 摘要 ( 75 ) PDF(3989KB) ( 317 )
- 参考文献 | 相关文章 | 多维度评价
-
借鉴Transformer在自然语言和计算机视觉领域强大的特征编码能力,同时受多阶段学习框架的启发,设计了一种融合Transformer与多阶段学习框架的点云上采样网络——MSPUiT。该网络采用二阶段网络模型,第一阶段是密集点生成网络,利用多层Transformer编码器逐步实现从输入点云的局部几何信息、局部特征信息到点云高级语义特征的转换,特征扩充模块在特征空间中,对点云特征上采样,坐标回归模块将点云从特征空间重新映射回欧氏空间中初步生成密集点云M′;第二阶段是逐点优化网络,使用Transformer编码器对密集点云M′中潜藏的语义特征进行编码,联合上一阶段语义特征得到点云完整的语义特征,特征精炼单元从M′的几何信息和语义特征中提取点的误差信息特征,误差回归模块从误差信息特征中计算得到欧氏空间中点的坐标偏移量,实现对点云M′的逐点优化,使得点云上点的分布更加均匀,并且更加贴近真实物体表面。在大型合成数据集PU1K上进行了大量实验,MSPUiT生成的高分辨率点云在倒角距离(CD)、豪斯多夫距离(HD)、生成点云到原始点云块的距离(P2F)上的指标分别降至0.501×10-3,5.958×10-3,1.756×10-3。实验结果表明,MSPUiT上采样后的点云表面更加光滑,噪声点更少,生成的点云质量高于当前主流的点云上采样网络。
-
多粒度空间注意力与空间先验监督的DETR
廖峻霜, 谭钦红. 多粒度空间注意力与空间先验监督的DETR[J]. 计算机科学, 2024, 51(6): 239-246.
LIAO Junshuang, TAN Qinhong. DETR with Multi-granularity Spatial Attention and Spatial Prior Supervision[J]. Computer Science, 2024, 51(6): 239-246. - 廖峻霜, 谭钦红
- 计算机科学. 2024, 51 (6): 239-246. doi:10.11896/jsjkx.230300218
- 摘要 ( 60 ) PDF(3890KB) ( 258 )
- 参考文献 | 相关文章 | 多维度评价
-
近年来,Transformer在视觉领域的表现卓越,由于其优秀的全局建模能力以及可媲美CNN的性能表现受到了广泛关注。DETR(Detection Transformer)是在其基础上研究的首个在目标检测任务上采用Transformer架构的端到端网络,但是其全局范围内的等价建模以及目标查询键的无差别性导致其训练收敛缓慢,且性能表现欠佳。针对上述问题,利用多粒度的注意力机制替换DETR的encoder中的自注意力以及decoder中的交叉注意力,在距离近的token之间使用细粒度,在距离远的token之间使用粗粒度,增强其建模能力;并在decoder中的交叉注意力中引入空间先验限制对网络训练进行监督,使其训练收敛速度得以加快。实验结果表明,在引入多粒度的注意力机制和空间先验监督后,相较于未改进的DETR,所提改进模型在PASCAL VOC2012数据集上的识别准确度提升了16%,收敛速度快了2倍。
-
基于眼部特征频域信息的早期疲劳检测
火星星, 胡瑞敏, 李怡欣. 基于眼部特征频域信息的早期疲劳检测[J]. 计算机科学, 2024, 51(6): 247-255.
HUO Xingxing, HU Ruimin, LI Yixin. Early-stage Fatigue Detection Based on Frequency Domain Information of Eye Features[J]. Computer Science, 2024, 51(6): 247-255. - 火星星, 胡瑞敏, 李怡欣
- 计算机科学. 2024, 51 (6): 247-255. doi:10.11896/jsjkx.230300033
- 摘要 ( 92 ) PDF(2548KB) ( 313 )
- 参考文献 | 相关文章 | 多维度评价
-
行李X光安检员工作疲劳是造成错检、漏检的重要原因。目前疲劳检测的方法主要通过发现打哈欠、打瞌睡和长时间闭眼等明显的迹象来检测中晚期疲劳,然而对于安检工作人员来说,出现这样明确的标志时,可能已经发生了安检事故,此时再进行疲劳检测为时已晚。因此,在早期阶段发现疲劳,并对疲劳的发生及时预警是非常有价值的。由于早期疲劳会有细微的面部表现特性,时域参数的不可逆性导致其无法完全表示。为了解决此问题,提出了一种基于眼部特征频域信息的行李X光安检员早期疲劳检测方法,将原始时域信息转换到表达能力更强的频域特征空间。该方法首先通过面部检测算法获取眼部横纵比(Eye Aspect Ratio,EAR)时间序列;然后利用频域特征提取方法得到频域特征序列,来表示更加细微的特征;最后利用分层多尺度网络HM-LSTM进行训练及验证。在公开数据集UTA-RLDD上的对比实验结果表明,所提方法对早期疲劳的识别率提升了2%,证明了频域特征比时域特征有更好的表达能力。
-
一种基于特征增强的场景文本检测算法
高楠, 张雷, 梁荣华, 陈朋, 付政. 一种基于特征增强的场景文本检测算法[J]. 计算机科学, 2024, 51(6): 256-263.
GAO Nan, ZHANG Lei, LIANG Ronghua, CHEN Peng, FU Zheng. Scene Text Detection Algorithm Based on Feature Enhancement[J]. Computer Science, 2024, 51(6): 256-263. - 高楠, 张雷, 梁荣华, 陈朋, 付政
- 计算机科学. 2024, 51 (6): 256-263. doi:10.11896/jsjkx.230500230
- 摘要 ( 55 ) PDF(3563KB) ( 312 )
- 参考文献 | 相关文章 | 多维度评价
-
针对自然场景下图像文本复杂背景、尺度多变等造成的漏检、误检问题,提出了一种基于特征增强的场景文本检测算法。在特征金字塔融合阶段,提出了双域注意力特征融合模块(Dual-domain Attention Feature Fusion Module,D2AAFM)。该模块能够更好地融合不同语义和尺度的特征图信息,从而提高文本信息的表征能力。同时,考虑到网络深层特征图在上采样融合过程中出现语义信息损失的问题,提出了多尺度空间感知模块(Multi-scale Spatial Perception Module,MSPM),通过扩大感受野来获取更大感受野的上下文信息,增强深层特征图的文本语义信息特征,从而有效地减少文本漏检、误检。为了评估所提算法的有效性,在公开数据集ICDAR2015,CTW1500以及MSRA-TD500上进行实验,所提方法综合指标F值分别达到了82.8%,83.4%和85.3%。实验结果表明,该算法在不同数据集上都具有良好的检测能力。
-
基于改进Swin Transformer的中心点目标检测算法
刘家森, 黄俊. 基于改进Swin Transformer的中心点目标检测算法[J]. 计算机科学, 2024, 51(6): 264-271.
LIU Jiasen, HUANG Jun. Center Point Target Detection Algorithm Based on Improved Swin Transformer[J]. Computer Science, 2024, 51(6): 264-271. - 刘家森, 黄俊
- 计算机科学. 2024, 51 (6): 264-271. doi:10.11896/jsjkx.230300222
- 摘要 ( 104 ) PDF(4018KB) ( 296 )
- 参考文献 | 相关文章 | 多维度评价
-
针对Swin Transformer在提取局部特征信息和特征表达能力上存在的不足,提出了一种基于改进Swin Transformer的中心点目标检测算法,以提高其在目标检测方面的性能。通过调整网络结构和引入反卷积模块来增强网络对局部特征信息的提取能力,利用自适应二维高斯核和回归头模块检测目标中心点来增强特征表达能力,并在Swin Transformer block模块中加入dropout激活函数,以缓解网络过拟合问题。在Pascal VOC和MS COCO 2017数据集上分别对改进后的算法进行验证,实验结果表明,改进后的Swin Transformer算法在Pascal VOC数据集上的精确度达到了81.1%,在MS COCO数据集上的精确度达到了37.2%,明显优于其他主流目标检测算法。
-
人机混合智能决策范式及作战应用研究
丁炎炎, 冯建航, 叶玲, 郑少秋, 刘凡. 人机混合智能决策范式及作战应用研究[J]. 计算机科学, 2024, 51(6): 272-281.
DING Yanyan, FENG Jianhang, YE Ling, ZHENG Shaoqiu, LIU Fan. Study on Human-Machine Hybrid Intelligent Decision-making Paradigm and Its Operational Application[J]. Computer Science, 2024, 51(6): 272-281. - 丁炎炎, 冯建航, 叶玲, 郑少秋, 刘凡
- 计算机科学. 2024, 51 (6): 272-281. doi:10.11896/jsjkx.230300180
- 摘要 ( 132 ) PDF(2408KB) ( 395 )
- 参考文献 | 相关文章 | 多维度评价
-
人机混合智能结合机器智能和人类智能,充分发挥机器和人类各自的智能优势,实现智能的跨载体和跨认知。作为一种新型智能形式,人机混合智能具有广泛的应用前景。人机混合智能决策将人的思维引入机器智能系统中,利用多智能协同完成对某种任务或问题的混合决策。针对现有的人机混合智能决策研究缺少整体性的理论描述和分类对比,且缺少针对军事领域的作战决策系统的架构描述,从协同交互手段和决策阶段的角度对通用人机混合决策范式进行分类和比较,分析了不同范式下的人机混合智能决策系统在作战方面的应用。此外,总结了目前人机混合智能决策范式和系统存在的问题,并展望了未来的发展方向。
-
图神经网络研究综述
侯磊, 刘金环, 于旭, 杜军威. 图神经网络研究综述[J]. 计算机科学, 2024, 51(6): 282-298.
HOU Lei, LIU Jinhuan, YU Xu, DU Junwei. Review of Graph Neural Networks[J]. Computer Science, 2024, 51(6): 282-298. - 侯磊, 刘金环, 于旭, 杜军威
- 计算机科学. 2024, 51 (6): 282-298. doi:10.11896/jsjkx.230400005
- 摘要 ( 118 ) PDF(3995KB) ( 416 )
- 参考文献 | 相关文章 | 多维度评价
-
随着人工智能的快速发展,深度学习已经在图像、文本和语音等可在欧氏空间表示的数据中取得了巨大成功,但却一直无法很好地应用于非欧氏空间。近年来,图神经网络在非欧几里得空间中展现出了强大的表示学习能力,并广泛应用于推荐系统、自然语言处理以及机器视觉等众多领域。图神经网络模型基于信息的传播机制,具体地,图中的目标节点通过聚合邻居节点的信息来更新自身的嵌入表示。利用图神经网络,可将众多现实问题(如社交网络、知识图谱和药物化学成分等)抽象成图网络,借助图中的连接边,对不同节点之间的依赖关系进行合理建模。鉴于此,对图神经网络进行了系统综述,首先介绍了图结构数据方面的基础知识,然后对图游走算法和不同类型的图神经网络模型进行了系统梳理。进一步地,详细阐述了当前图神经网络的通用框架和应用领域,最后对图神经网络的未来进行了总结与展望。
-
基于句信息增强词信息的方面级情感分类
李怡霖, 孙成胜, 罗林, 琚生根. 基于句信息增强词信息的方面级情感分类[J]. 计算机科学, 2024, 51(6): 299-308.
LI Yilin, SUN Chengsheng, LUO Lin, JU Shenggen. Aspect-based Sentiment Classification for Word Information Enhancement Based on Sentence Information[J]. Computer Science, 2024, 51(6): 299-308. - 李怡霖, 孙成胜, 罗林, 琚生根
- 计算机科学. 2024, 51 (6): 299-308. doi:10.11896/jsjkx.230600059
- 摘要 ( 71 ) PDF(2204KB) ( 270 )
- 参考文献 | 相关文章 | 多维度评价
-
方面级情感分类属于细粒度的情感分类,旨在判断句子中指定方面词的情感极性。近年来,句法知识在方面级情感分类任务中得到了广泛应用。目前主流的模型利用句法依存树和图卷积神经网络进行情感极性的分类。然而,此类模型着眼于利用聚合后的方面词信息来判断情感极性,很少关注句子的全局信息对情感极性的影响,从而导致情感极性分类结果出现偏差。为了解决这一问题,提出了一种基于句信息增强词信息的方面级情感分类模型,该模型通过对比学习对句向量进行表示学习,以减小句向量对比损失为目标调整词向量的特征表示,最后通过图卷积神经网络聚合意见词信息得出情感分类结果。在SemEval2014数据集和Twitter数据集上进行实验,结果表明,所提模型可以提高分类的准确性,综合验证了该方法的有效性。
-
基于多任务联合训练的长文本多实体情感分析
张昊妍, 段利国, 王钦晨, 郜浩. 基于多任务联合训练的长文本多实体情感分析[J]. 计算机科学, 2024, 51(6): 309-316.
ZHANG Haoyan, DUAN Liguo, WANG Qinchen, GAO Hao. Long Text Multi-entity Sentiment Analysis Based on Multi-task Joint Training[J]. Computer Science, 2024, 51(6): 309-316. - 张昊妍, 段利国, 王钦晨, 郜浩
- 计算机科学. 2024, 51 (6): 309-316. doi:10.11896/jsjkx.230400001
- 摘要 ( 57 ) PDF(2006KB) ( 291 )
- 参考文献 | 相关文章 | 多维度评价
-
多实体情感分析旨在识别文中的核心实体并判断其对应的情感,是目前细粒度情感分析领域的研究热点,对长文本多实体情感分析的研究目前还处于起步阶段。文中提出了一种基于多任务联合训练的长文本多实体情感分析模型(PAM),首先采用TF-IDF算法提取文章中与标题相似的句子,剔除冗余信息以缩短文本长度,通过两个BiLSTM分别进行核心实体识别和情感分析任务的学习,获取各自需要的特征,然后利用融入相对位置信息的多头注意力机制将实体识别任务学习到的知识向情感分析任务传递,实现两个任务的联合学习,最后利用提出的Entity_Extract算法根据实体词在文本中出现的次数和先后位置从模型预测的候选实体中确定核心实体并获取其对应的情感。在搜狐新闻数据集上的实验结果证明了PAM模型的有效性。
-
基于知识辅助的结构化医疗报告生成
史继筠, 张驰, 王禹桥, 罗兆经, 张美慧. 基于知识辅助的结构化医疗报告生成[J]. 计算机科学, 2024, 51(6): 317-324.
SHI Jiyun, ZHANG Chi, WANG Yuqiao, LUO Zhaojing, ZHANG Meihui. Generation of Structured Medical Reports Based on Knowledge Assistance[J]. Computer Science, 2024, 51(6): 317-324. - 史继筠, 张驰, 王禹桥, 罗兆经, 张美慧
- 计算机科学. 2024, 51 (6): 317-324. doi:10.11896/jsjkx.230900076
- 摘要 ( 85 ) PDF(2010KB) ( 346 )
- 参考文献 | 相关文章 | 多维度评价
-
医疗报告自动生成是文本摘要生成技术的重要应用。由于医疗问诊数据与通用领域的数据特征存在着明显的差异,传统的文本摘要生成方法不能充分理解并利用医疗文本中高复杂性的医疗术语,因此医疗问诊中包含的关键知识并没有得到充分的利用。此外,传统的文本摘要生成方法大多是直接生成摘要,并没有针对医疗报告结构化的特点自动选择过滤关键信息并生成结构化文本的能力。针对上述问题,提出了一种知识辅助的结构化医疗报告生成方法。该方法将实体引导的先验领域知识与结构引导的任务解耦机制相结合,实现了对医疗问诊数据的关键知识与医疗报告的结构化特点的充分利用。在IMCS21数据集上的实验验证了所提方法的有效性,其生成摘要的ROUGE分数与同类方法相比提升了2%~3%,生成了更准确的医疗报告。
-
一种面向中文自动问答的注意力交互深度学习模型
蒋锐, 杨凯辉, 王小明, 李大鹏, 徐友云. 一种面向中文自动问答的注意力交互深度学习模型[J]. 计算机科学, 2024, 51(6): 325-330.
JIANG Rui, YANG Kaihui, WANG Xiaoming, LI Dapeng, XU Youyun. Attentional Interaction-based Deep Learning Model for Chinese Question Answering[J]. Computer Science, 2024, 51(6): 325-330. - 蒋锐, 杨凯辉, 王小明, 李大鹏, 徐友云
- 计算机科学. 2024, 51 (6): 325-330. doi:10.11896/jsjkx.230300175
- 摘要 ( 61 ) PDF(1519KB) ( 325 )
- 参考文献 | 相关文章 | 多维度评价
-
随着互联网、大数据的飞速发展,以深度神经网络(DNN)为代表的人工智能技术迎来了黄金发展时期,自动问答作为人工智能领域的一个重要分支,也得到越来越多学者的关注。现有网络模型可以提取问题或答案的语义特征,但其一方面忽略了问题与答案之间的语义联系,另一方面也不能从整体上把握问题或答案内部所有字符之间的潜在联系。基于此,提出了两种不同形式的注意力交互模块,即互注意力交互模块和自注意力交互模块,并设计出一套基于所提注意力交互模块的深度学习模型,用于证明该注意力交互模块的有效性。首先将问题和答案中的每个字符映射成固定长度的向量,分别得到问题和答案对应的字嵌入矩阵;然后将字嵌入矩阵送入注意力交互模块,得到综合考虑问题与答案所有字符之后的字嵌入矩阵,并与之前的字嵌入矩阵相加,送入深度神经网络模块,用于提取问题与答案的语义特征;最后得到问题与答案的向量表示并计算两者之间的相似度。实验结果表明,所提模型的Top-1准确度较主流深度学习模型最高提升了3.55%,证明了所提注意力交互模块对于改善上述问题的有效性。
-
一种避障场景下的快速航迹恢复算法
马英红, 李续楠, 董旭, 焦毅, 蔡伟, 郭有光. 一种避障场景下的快速航迹恢复算法[J]. 计算机科学, 2024, 51(6): 331-337.
MA Yinghong, LI Xu’nan, DONG Xu, JIAO Yi, CAI Wei, GUO Youguang. Fast Path Recovery Algorithm for Obstacle Avoidance Scenarios[J]. Computer Science, 2024, 51(6): 331-337. - 马英红, 李续楠, 董旭, 焦毅, 蔡伟, 郭有光
- 计算机科学. 2024, 51 (6): 331-337. doi:10.11896/jsjkx.230400015
- 摘要 ( 63 ) PDF(2403KB) ( 271 )
- 参考文献 | 相关文章 | 多维度评价
-
针对现有大部分避障场景中无人机避障算法未考虑无人机航迹恢复、少数航迹恢复算法恢复效果不佳的缺点,提出了一种避障场景下的无人机快速航迹恢复算法。综合考虑环境约束与无人机机动性能约束,通过旋转坐标系、判断无人机转弯方向、利用二分法对无人机整个避障及航迹恢复过程中的多个关键航迹点坐标进行计算,最终规划出一条安全高效的无人机避障及航迹恢复航迹。对比实验结果表明,快速航迹恢复算法规划出的避障及航迹恢复航迹更短,可以在距离障碍物更近的航迹点开始避障,避障及航迹恢复用时更短,航迹偏离度更小,整体航迹更优,对于绝大多数侦察场景中无人机需尽量保持沿离线航迹巡航的情况更加有利。
-
融合帖文属性的性别歧视言论检测模型
王小龙, 王琰慧, 张顺香, 汪才钦, 周渝皓. 融合帖文属性的性别歧视言论检测模型[J]. 计算机科学, 2024, 51(6): 338-345.
WANG Xiaolong, WANG Yanhui, ZHANG Shunxiang, WANG Caiqin, ZHOU Yuhao. Gender Discrimination Speech Detection Model Fusing Post Attributes[J]. Computer Science, 2024, 51(6): 338-345. - 王小龙, 王琰慧, 张顺香, 汪才钦, 周渝皓
- 计算机科学. 2024, 51 (6): 338-345. doi:10.11896/jsjkx.230800198
- 摘要 ( 63 ) PDF(2263KB) ( 281 )
- 参考文献 | 相关文章 | 多维度评价
-
性别歧视言论检测是通过自然语言处理技术来识别文本是否具有性别歧视的倾向,为净化网络环境提供有力支持。当前相关研究仅关注帖文本身,未对帖文属性(用户、帖文以及主题)间的关系进行挖掘。为此,提出一种融合帖文属性的性别歧视言论检测模型,通过构建异构图来挖掘帖文属性间的关系。首先,利用ERNIE对帖文内容进行词嵌入,通过BiGRU模型提取上下文依赖关系,得到句子表征;然后,基于帖文属性关系构建异构图,并利用异构图注意力网络(Heterogeneous Graph Attention Network)得到帖文内容的关系表示;最后,融合帖文内容的关系表示与句子表征,通过Softmax函数进行分类。实验结果表明,所提模型可以提升性别歧视言论检测的准确率。
-
基于微服务的预分配额度限流设计研究
郑旭, 范红杰, 柳军飞. 基于微服务的预分配额度限流设计研究[J]. 计算机科学, 2024, 51(6): 346-353.
ZHENG Xu, FAN Hongjie, LIU Junfei. Pre-allocated Capacity Quota Limiting System Based on Microservice[J]. Computer Science, 2024, 51(6): 346-353. - 郑旭, 范红杰, 柳军飞
- 计算机科学. 2024, 51 (6): 346-353. doi:10.11896/jsjkx.231100125
- 摘要 ( 98 ) PDF(2769KB) ( 270 )
- 参考文献 | 相关文章 | 多维度评价
-
在分布式架构下,同时存在于多个节点的限流器需要很好地协作才能达到单体限流的效果。 在真实的业务场景中,线上请求分布不规律,线下业务吞吐量大。在此情况下,某一些关键节点因为超负荷运作而响应缓慢,从而导致请求链路整体的延迟增加,甚至造成整个应用的反应迟缓。针对现有微服务限流所存在的问题,文中提出了一种基于预分配额度进行主动推送配额更新的限流算法。该算法采用服务器主动向客户端广播的模式,服务器既可以接受客户端请求,也可以主动更新持有该资源配额的节点在处理请求后的最新结果。在服务器端分配所有节点配额时,可以采用灵活的分配算法进行分配。在估算限流节点配额时,采用滑动窗口的模式记录下一段时间内的请求数量和拥有的资源配额,通过自定义的算法来预估下一个周期的配额。同时,文中基于该算法实现了一个限流模型。实验结果证明,该模型可以及时地响应配额的变化,很好地实现节点之间的公平性。相比Doorman系统,所提模型可以更好地适应线上线下流量场景和精准限流。
-
基于时变计算资源的联邦学习设备选择算法
刘建勋, 张幸林. 基于时变计算资源的联邦学习设备选择算法[J]. 计算机科学, 2024, 51(6): 354-363.
LIU Jianxun, ZHANG Xinglin. Federated Learning Client Selection Scheme Based on Time-varying Computing Resources[J]. Computer Science, 2024, 51(6): 354-363. - 刘建勋, 张幸林
- 计算机科学. 2024, 51 (6): 354-363. doi:10.11896/jsjkx.230400183
- 摘要 ( 73 ) PDF(4049KB) ( 267 )
- 参考文献 | 相关文章 | 多维度评价
-
联邦学习(Federated Learning,FL)是一种新兴的分布式机器学习范式,其核心思想是用户设备以分布式的方式在本地训练模型,且无需上传原始数据,仅需将训练后的模型上传到服务器进行模型聚合。现有研究大多忽略了设备的计算资源会随着用户的使用模式而发生时序性变化,这会影响FL的训练进度。文中针对异构设备具有时变计算资源的特点,使用自回归模型对时变计算资源进行建模,并提出了一个设备选择算法。首先构造了长期训练时间约束下最小化每轮FL平均训练时间的优化问题,接着采用李雅普诺夫优化理论对其进行转化,最后求解得到设备选择算法。实验结果表明,与基线算法相比,所提算法能够在基本保证模型质量的同时缩短FL的训练时间和设备的平均等待时间。
-
基于边缘计算的自适应稀疏传感网目标覆盖算法
李洁, 汪耀, 陈侃松, 许立君. 基于边缘计算的自适应稀疏传感网目标覆盖算法[J]. 计算机科学, 2024, 51(6): 364-374.
LI Jie, WANG Yao, CHEN Kansong, XU Lijun. Adaptive Sparse Sensor Network Target Coverage Algorithm Based on Edge Computing[J]. Computer Science, 2024, 51(6): 364-374. - 李洁, 汪耀, 陈侃松, 许立君
- 计算机科学. 2024, 51 (6): 364-374. doi:10.11896/jsjkx.230300185
- 摘要 ( 64 ) PDF(3141KB) ( 289 )
- 参考文献 | 相关文章 | 多维度评价
-
海洋探测是海洋开发的关键,如何快速高效地实现水下目标探测是海洋探测必须解决的问题。基于此,提出了一种基于边缘计算的自适应稀疏传感网目标覆盖优化算法,以较少的传感节点高效地完成水下目标探测。首先,通过Ad Hoc移动能耗优化策略机制,添加能量因子,在节点移动过程中保护能量较低的节点,优化传感网的能量均衡性;其次,提出了一种Ad Hoc贪婪探测机制,以最小的代价实现对未知区域的探测,快速完成目标覆盖;最后,利用基于虚拟力的自适应连通机制,通过增大虚拟引力范围解决节点移动过程中的断连问题,保证了稀疏自组织网络的连通性。仿真结果表明,所提算法能够用较少数量的移动传感器提供快速、持久的目标探测覆盖,相较于对比算法性能表现更优。
-
基于改进型蛇算法的RFID网络规划部署
李芷芊, 郑嘉利, 陈奕君, 张江波. 基于改进型蛇算法的RFID网络规划部署[J]. 计算机科学, 2024, 51(6): 375-383.
LI Zhiqian, ZHENG Jiali, CHEN Yijun, ZHANG Jiangbo. Enhanced Snake Optimizer Based RFID Network Planning[J]. Computer Science, 2024, 51(6): 375-383. - 李芷芊, 郑嘉利, 陈奕君, 张江波
- 计算机科学. 2024, 51 (6): 375-383. doi:10.11896/jsjkx.230300130
- 摘要 ( 67 ) PDF(3354KB) ( 287 )
- 参考文献 | 相关文章 | 多维度评价
-
针对无线射频识别(RFID)网络规划的优化部署问题,提出一种基于Circle映射的嵌入正弦余弦算法和自适应阈值的改进型蛇算法(ESO)。在种群初始化阶段利用Circle混沌映射的均匀性和遍历性等特点,在局部搜索阶段和开发阶段分别引入正弦余弦算法(SCA)和自适应阈值等算法机制,弥补了蛇算法初始化过程不够均匀、容易陷入局部最优和收敛速度慢等缺点。在满足100%标签覆盖率、减少阅读器之间的碰撞干扰、实现阅读器的负载均衡,以及降低总的发射功率这4个目标的基础上,求解阅读器最佳的部署位置,将所提算法与粒子群算法(PSO)、灰狼算法(GWO)、樽海鞘算法(SSA)进行了对比分析。实验结果表明,改进型蛇算法在对RFID网络进行优化部署时寻优能力更强,对RFID网络部署的综合性能提升明显,在相同的实验条件下,ESO的最佳适应度值比PSO提高了28.1%,比GWO提高了17.7%,比SSA提高了22.9%,可以更有效地得出最优的RFID网络规划部署方案。
-
基于边缘智能的车辆编队协同控制方法研究
李乐, 刘美芳, 陈荣, 魏思雨. 基于边缘智能的车辆编队协同控制方法研究[J]. 计算机科学, 2024, 51(6): 384-390.
LI Le, LIU Meifang, CHEN Rong, WEI Siyu. Study on Collaborative Control Method of Vehicle Platooning Based on Edge Intelligence[J]. Computer Science, 2024, 51(6): 384-390. - 李乐, 刘美芳, 陈荣, 魏思雨
- 计算机科学. 2024, 51 (6): 384-390. doi:10.11896/jsjkx.231000126
- 摘要 ( 75 ) PDF(2953KB) ( 290 )
- 参考文献 | 相关文章 | 多维度评价
-
随着通信技术及自动化控制技术的发展,智能网联汽车的自主控制方法,特别是混合编队下的控制方法已经成为无人驾驶技术研究的重要方向。由于车载处理器计算能力有限,为了减少控制策略输出的时延,提高车辆跟踪效果,提出了基于边缘智能的车辆编队协同控制方法。利用边缘服务器的强大计算能力和5G通信网络,设计了基于边缘智能的控制系统,将计算任务上传至云端,充分释放车载处理器的计算资源。对混合编队下的跟车场景进行了分析,设计了时空耦合场景下的车辆编队控制模型,利用MPC控制算法,建立了车辆动力学模型,通过模型预测、滚动优化与反馈校正为智能网联汽车提供控制策略计算服务。经MATLAB仿真实验及边缘计算虚拟平台实验验证,所提出的MPC控制算法在轨迹跟踪控制上表现良好,能够实时高效地为车辆提供安全控制策略。
-
基于粒子群优化的面向数据异构的联邦学习方法
徐奕成, 戴超凡, 马武彬, 吴亚辉, 周浩浩, 鲁晨阳. 基于粒子群优化的面向数据异构的联邦学习方法[J]. 计算机科学, 2024, 51(6): 391-398.
XU Yicheng, DAI Chaofan, MA Wubin, WU Yahui, ZHOU Haohao, LU Chenyang. Particle Swarm Optimization-based Federated Learning Method for Heterogeneous Data[J]. Computer Science, 2024, 51(6): 391-398. - 徐奕成, 戴超凡, 马武彬, 吴亚辉, 周浩浩, 鲁晨阳
- 计算机科学. 2024, 51 (6): 391-398. doi:10.11896/jsjkx.230400182
- 摘要 ( 84 ) PDF(3639KB) ( 290 )
- 参考文献 | 相关文章 | 多维度评价
-
联邦学习是一种新兴的面向隐私保护的分布式机器学习框架,其核心特点是能够在不获取客户端原始数据的条件下实现分布式机器学习。客户端利用本地数据进行模型训练,然后将模型参数上传至服务端进行聚合,从而确保客户端数据始终得到保护。在此过程中,存在频繁的参数传输导致的通信成本高昂问题和各客户端所拥有的非独立同分布异构数据问题,两者严重制约了联邦学习的应用。针对上述问题,提出了一种基于粒子群优化的面向数据异构的联邦学习方法——FedPSG,将客户端传输到服务器的数据形式由模型参数转变为模型分值,在每轮训练中只需要少部分客户端向服务器上传模型参数,从而降低通信成本;同时,提出了一种模型再训练策略,使用服务器数据对全局模型进行二次迭代训练,通过缓解数据异构问题对联邦学习的影响来进一步提升模型性能。模拟不同的数据异构环境,在MNIST,FashionMNIST与CIFAR-10数据集上进行实验,结果表明FedPSG能够有效提高模型在不同数据异构环境下的准确率,并且验证了模型再训练策略能有效解决客户端数据异构问题。
-
面向容器运行时安全威胁的N变体架构
刘道清, 扈红超, 霍树民. 面向容器运行时安全威胁的N变体架构[J]. 计算机科学, 2024, 51(6): 399-408.
LIU Daoqing, HU Hongchao, HUO Shumin. N-variant Architecture for Container Runtime Security Threats[J]. Computer Science, 2024, 51(6): 399-408. - 刘道清, 扈红超, 霍树民
- 计算机科学. 2024, 51 (6): 399-408. doi:10.11896/jsjkx.230200099
- 摘要 ( 54 ) PDF(4624KB) ( 281 )
- 参考文献 | 相关文章 | 多维度评价
-
容器技术以其轻量级和可伸缩性的优点促进了云计算的发展,但容器运行时安全威胁日益严重。现有的入侵检测和访问控制等技术无法有效应对利用容器运行时实现容器逃逸的攻击行为。针对上述安全威胁,结合N变体系统的冗余及多样性方法提出了一种面向容器运行时安全威胁的N变体架构,同时通过基于历史信息的投票算法以提高投票的准确率,并通过两阶段投票和调度策略优化容器应用服务质量。最后构建了原型系统,测试结果表明原型系统性能损失在可接受的范围内,并一定程度上减小了系统攻击面,进而达到了增强容器应用安全性的目的。
-
基于改进GraphSAGE算法的浏览器指纹追踪
楚小茜, 张建辉, 张德升, 苏珲. 基于改进GraphSAGE算法的浏览器指纹追踪[J]. 计算机科学, 2024, 51(6): 409-415.
CHU Xiaoxi, ZHANG Jianhui, ZHANG Desheng, SU Hui. Browser Fingerprint Tracking Based on Improved GraphSAGE Algorithm[J]. Computer Science, 2024, 51(6): 409-415. - 楚小茜, 张建辉, 张德升, 苏珲
- 计算机科学. 2024, 51 (6): 409-415. doi:10.11896/jsjkx.230400003
- 摘要 ( 66 ) PDF(2443KB) ( 256 )
- 参考文献 | 相关文章 | 多维度评价
-
当前Web追踪领域主要使用浏览器指纹对用户进行追踪。针对浏览器指纹追踪技术存在指纹随时间动态变化、不易长期追踪等问题,提出一种关注节点和边缘特征的改进图采样聚合算法(An Improved Graph SAmple and AGgregatE with Both Node and Edge Features,NE-GraphSAGE)用于浏览器指纹追踪。首先以浏览器指纹为节点、指纹之间特征相似度为边构建图数据。其次对图神经网络中的GraphSAGE算法进行改进使其不仅能关注节点特征,而且能捕获边缘信息并对边缘分类,从而识别指纹。最后将NE-GraphSAGE算法与Eckersley算法、FPStalker算法和LSTM算法进行对比,验证NE-GraphSAGE算法的识别效果。实验结果表明,NE-GraphSAGE算法在准确率和追踪时长上均有不同程度的提升,最大追踪时长可达80天,相比其他3种算法性能更优,验证了NE-GraphSAGE算法对浏览器指纹长期追踪的能力。
-
基于可逆元胞自动机加密的扩展码索引调制方案
赵耿, 黄思婕, 马英杰, 董有恒, 吴锐. 基于可逆元胞自动机加密的扩展码索引调制方案[J]. 计算机科学, 2024, 51(6): 416-422.
ZHAO Geng, HUANG Sijie, MA Yingjie, DONG Youheng, WU Rui. Extended Code Index Modulation Scheme Based on Reversible Elementary Cellular Automata Encryption[J]. Computer Science, 2024, 51(6): 416-422. - 赵耿, 黄思婕, 马英杰, 董有恒, 吴锐
- 计算机科学. 2024, 51 (6): 416-422. doi:10.11896/jsjkx.230300067
- 摘要 ( 55 ) PDF(2260KB) ( 275 )
- 参考文献 | 相关文章 | 多维度评价
-
针对直接序列扩频系统伪随机(Pseudo Noise,PN)码资源有限且码索引调制系统误码率性能下降的问题,提出了一种基于可逆的初等元胞自动机加密的扩展码索引调制方案。首先,针对PN码资源有限的问题,提出使用混沌规则的初等元胞自动机对PN码进行迭代的方案,从而实现扩展PN码的目的;其次,针对码索引调制误码率性能下降的问题,提出了一种可逆元胞自动机加密的码索引调制方案,在发射端,把信息比特切割成调制比特和映射比特,并分别映射为调制符号和扩频码索引,使用对应索引的扩频码对同相分量进行扩频,同时使用可逆元胞自动机对映射比特进行加密,加密后的映射比特为调制符号的正交分量选取对应索引的扩频码进行扩频。仿真与分析结果表明,在相同频谱效率条件下,在加性高斯白噪声信道中,当误码率为10-5时,扩展码索引调制方案的误码率性能优于码索引调制和广义码索引调制方案约2~4 dB,优于非正交码移键控码索引调制方案约0.5 dB。
-
基于函数调用指令特征分析的固件指令集架构识别方法
贾凡, 尹小康, 盖贤哲, 蔡瑞杰, 刘胜利. 基于函数调用指令特征分析的固件指令集架构识别方法[J]. 计算机科学, 2024, 51(6): 423-433.
JIA Fan, YIN Xiaokang, GAI Xianzhe, CAI Ruijie, LIU Shengli. Function-call Instruction Characteristic Analysis Based Instruction Set Architecture Recognization Method for Firmwares[J]. Computer Science, 2024, 51(6): 423-433. - 贾凡, 尹小康, 盖贤哲, 蔡瑞杰, 刘胜利
- 计算机科学. 2024, 51 (6): 423-433. doi:10.11896/jsjkx.230500087
- 摘要 ( 63 ) PDF(4046KB) ( 296 )
- 参考文献 | 相关文章 | 多维度评价
-
不同的固件常采用不同的指令集架构,固件指令集架构的识别是对嵌入式固件进行逆向分析和漏洞挖掘的基础。现有研究和相关工具在针对特定类型的嵌入式设备固件指令集架构识别时存在识别正确率低、误报率高的情况。针对上述问题,提出了一种基于函数调用指令特征分析的固件指令集架构识别方法,通过同时利用指令中操作码和操作数所包含的信息识别目标固件中的函数调用指令,将其作为关键特征实现对不同指令集架构的分类,并基于该方法开发了原型系统EDFIR(Embedded Device Firmware Instruction set Recognizer)。实验结果表明,相比IDAPro,Ghidra,Radare2,Binwalk以及ISAdetect这些当前应用最广泛和最新的工作,该方法具有更高的识别正确率、更低的误报率并具备更强的抗干扰能力,其对1 000个真实设备固件的识别正确率高达97.9%,比目前识别效果最好的ISAdetect提升了42.5%。此外,相关实验还证明,即使将分析规模缩小至完整固件的1/50,所提方法仍能保持95.31%的识别正确率,具有良好的识别性能。
-
基于融合序列的远控木马流量检测模型
吴丰源, 刘明, 尹小康, 蔡瑞杰, 刘胜利. 基于融合序列的远控木马流量检测模型[J]. 计算机科学, 2024, 51(6): 434-442.
WU Fengyuan, LIU Ming, YIN Xiaokang, CAI Ruijie, LIU Shengli. Remote Access Trojan Traffic Detection Based on Fusion Sequences[J]. Computer Science, 2024, 51(6): 434-442. - 吴丰源, 刘明, 尹小康, 蔡瑞杰, 刘胜利
- 计算机科学. 2024, 51 (6): 434-442. doi:10.11896/jsjkx.230400159
- 摘要 ( 80 ) PDF(4520KB) ( 310 )
- 参考文献 | 相关文章 | 多维度评价
-
针对现有远控木马流量检测方法泛化能力较弱、表征能力有限和预警滞后等问题,提出了一种基于融合序列的远控木马流量检测模型。通过深入分析正常应用网络流量与远控木马流量在包长序列、包负载长度序列和包时间间隔序列方面的差异,将流量表征为融合序列。将融合序列输入Transformer模型,利用多头注意力机制与残差连接挖掘融合序列内在联系,学习木马通信行为模式,有效地提升了对远控木马流量的检测能力与模型的泛化能力。所提模型仅需提取网络会话的前20个数据包进行检测,就能够在木马入侵早期做出及时预警。对比实验结果表明,模型不仅在已知数据中具有优异的检测效果,在未知流量测试集上同样表现出色,相比当前已有的深度学习模型,各项检测指标有较大提升,在远控木马流量检测领域具备实际应用价值。