1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
当期目录
2024年第10期, 刊出日期:2024-10-15
  
封面下载
目录
第51卷第10期目录
计算机科学. 2024, 51 (10): 0-0. 
摘要 ( 148 )   PDF(430KB) ( 411 )   
相关文章 | 多维度评价
智能教育技术及应用
元宇宙教学:高等教育数字化教学转型的高阶形态
张策, 初佃辉, 张侨, 刘鹏, 魏萌, 刘晓颖
计算机科学. 2024, 51 (10): 1-9.  doi:10.11896/jsjkx.240400083
摘要 ( 277 )   PDF(2968KB) ( 471 )   
参考文献 | 相关文章 | 多维度评价
新科技革命下信息技术正在改变着人类的思想与行动,推动着数字时代高等教育教学的变革。高等教育数字化转型已成为驱动高校教育教学适应与引领发展的最大动力。在这场教育教学数字变革浪潮中,元宇宙教育教学因具有虚拟灵动、美妙生动、智慧联动等令人充满遐想的想象特征而受到了广泛关注。文中概述了元宇宙的起源,并对教育元宇宙进行了分析;重点从情景式与场景化教学的基本特征、基本理论基础、“虚”与“实”映射及“互动”、学习方式,以及基本分类与过程等角度,论述了元宇宙教学;对元宇宙教学案例与实践进展进行分析;初步给出了元宇宙教学平台架构与核心功能,并进行了深入的系统阐释。最后对AI技术赋能的智慧元宇宙教学进行剖析,指出其为课程建设与教学改革开辟了新途径,在教学资源与内容、环境与空间、组织与形式、方法与技术等方面将赋予新型态,为教与学提供新选择;阐释了智慧元宇宙教学助推高等教育数字化转型走向深入的基本逻辑,并对制约元宇宙教学广泛应用需要亟待突破的技术进行剖析。元宇宙教学令人憧憬的美好明天,亟需更多理念、思想与理论上的深层次研究,同时也需要实践上的同步甚至是超前探索与尝试。这就要求教育教学学术界、科技创新技术界、研发制造产业界携手攻关,共同开创高校数字化教学转型的新未来。
智能教育中可计算感知技术:系统性综述
刘峰, 刘雅旋, 柴新宇, 季昊涵, 郑之行
计算机科学. 2024, 51 (10): 10-16.  doi:10.11896/jsjkx.240400112
摘要 ( 157 )   PDF(1929KB) ( 331 )   
参考文献 | 相关文章 | 多维度评价
随着教育技术的进步和发展,以深度学习、机器学习、虚拟现实、物联网为代表的可计算感知技术在以人为本的教育中的应用愈发广泛,同时也是赋能教育发展变革的关键力量之一。然而,目前对于可计算感知技术在智能教育中的应用还知之甚少。以面部表情、语音、文本、眼动、触觉、生理信号等可感知的物理及虚拟空间中可感知数据为基础,对当前公开发表的期刊文献和会议论文进行筛选和统计,系统分析了智能教育中可计算感知技术的进展与应用,并提出了其对教育实践的潜在影响和挑战。最后,基于结论对智能教育中可计算感知技术的未来发展方向展开了前瞻讨论。
基于深度学习的个性化学习资源推荐综述
周洋涛, 褚华, 朱非非, 李祥铭, 韩子涵, 张帅
计算机科学. 2024, 51 (10): 17-32.  doi:10.11896/jsjkx.240400088
摘要 ( 327 )   PDF(2115KB) ( 489 )   
参考文献 | 相关文章 | 多维度评价
随着信息技术与教育教学的深度融合,新型在线教育作为智慧教育的核心组成部分,为学习者提供了便捷的在线学习平台与丰富的学习资源。然而,在线教育模式的蓬勃发展也催生了“知识过载”与“知识迷航”等显著问题,极大地限制了学习者的学习增益与效率。近年来,学习资源推荐作为一种实现信息过滤与处理的关键技术手段,旨在分析学习者的历史学习行为,捕获其中蕴含的学习需求,最终实现千人千面的学习资源推荐服务。精准的个性化学习资源推荐能够有效解决在线教育场景中“知识过载”与“知识迷航”难题,实现个性化在线教育,已成为各大在线学习平台中不可或缺的核心功能之一。同时,随着深度学习技术的不断发展,基于深度学习的个性化学习资源推荐已成为计算机与教育交叉领域的研究焦点。因此,以“如何实现个性化学习资源推荐”和“如何实现对推荐结果的评估”两个问题为导向,对现有的研究工作进行了多维度、多层次、系统性的总结分析。首先,从场景特性、推荐目标、深度学习技术、边信息集成方式以及推荐模式5个维度对学习资源的个性化推荐过程进行分类与总结,以解答“如何实现个性化学习资源推荐”的问题;其次,从数据集、评估指标、以及实验方式3个方面对推荐结果的评估过程进行归纳与比较,并提供所有开源数据集的统一下载链接,以解答“如何实现对推荐结果的评估”的问题;最后,从对当前学习资源推荐方法自身局限性的攻克以及对外部新兴技术的利用与融合两个方面探讨了学习资源推荐未来的研究趋势。
主观题自动评判算法研究综述
冯筠, 栗凯旋, 高志泽樟, 黄立, 孙霞
计算机科学. 2024, 51 (10): 33-39.  doi:10.11896/jsjkx.240400008
摘要 ( 197 )   PDF(1592KB) ( 358 )   
参考文献 | 相关文章 | 多维度评价
在教育教学中,试卷评判是教师获取学生知识点掌握情况的重要途径。然而,试题评分是一个耗时的过程,主观题的评判更需要阅卷人认真、投入、细致地审阅,需要耗费大量精力。要减轻教师工作压力,提高主观题评判的效率,基于人工智能的自动评判技术非常重要,其中主观题的自动评判是难点。随着机器学习和深度学习等技术在自然语言处理领域的发展,主观题自动评判技术有了较大进展。文中将主观题分为常规型和开放型两类进行文献梳理,总结主观题自动评价的标准和公开数据集,归纳涉及的方法和技术路线,并对主观题自动评判技术未来的研究方向进行总结和展望。
课堂师生交互智能分析技术研究综述
崔家郡, 康璐, 马苗
计算机科学. 2024, 51 (10): 40-49.  doi:10.11896/jsjkx.240400084
摘要 ( 161 )   PDF(1739KB) ( 318 )   
参考文献 | 相关文章 | 多维度评价
随着教育信息化的普及与不断发展,视频、图像、语音、文本等海量课堂数据被记录下来。对这些多模态数据进行有效分析,挖掘课堂师生交互信息,不仅能够帮助教师及时发现教学中存在的问题,及时调整教学内容以提高教学质量,而且是落实“以人为本”教学理念,推进现代教育走向智能化、个性化和数字化的重要手段。文中首先论述国内外师生交互行为的传统分析方法;然后从视频、图像、语音、文本及多模态等不同角度分类梳理课堂师生交互智能分析技术的研究现状,归纳总结课堂师生交互智能分析的核心要素、数据形式、关键技术、结果呈现和应用场景;最后分析课堂师生交互的多模态智能分析技术的优势与不足以及面临的挑战和未来趋势。
群体化学习方法及其在课程教学中的应用
毛新军, 卢遥
计算机科学. 2024, 51 (10): 50-55.  doi:10.11896/jsjkx.240300033
摘要 ( 128 )   PDF(2090KB) ( 274 )   
参考文献 | 相关文章 | 多维度评价
针对当前教育教学存在的物理边界封闭、对教师教材依赖大、学习问题及其解答难以重用等问题,借鉴群体智能和开源软件的思想,提出群体化学习的理念和方法。其核心是打破传统班级、年级和学校的界限,以开放社区的形式支持学习者围绕特定的主题开展自主协作式的社会化学习,包括问题讨论、经验分享和资源共创等。这种方法可产生大量高质量、个性化的学习群智知识,支持学习者解决课程学习和实践中遇到的问题,帮助教师提升课程教学的效率和质量。文中介绍了群体化学习支撑平台LearnerHub,结合软件工程课程教学实践,分析了群体化学习方法在课程教学中的应用模式,通过调查问卷和数据分析的方法检验了该方法的有效性,结果表明学生高度认可群体化学习方法在课程学习和实践中发挥的重要作用,学生群体化学习综合实践表现与考试成绩二者之间存在正相关的关系。
基于视频理解的教学过程感知与分析
段欣然, 王玫, 韩天利, 周洪宇, 郭俊奇, 计卫星, 黄华
计算机科学. 2024, 51 (10): 56-66.  doi:10.11896/jsjkx.240400109
摘要 ( 173 )   PDF(4323KB) ( 333 )   
参考文献 | 相关文章 | 多维度评价
课堂是教育教学的核心阵地,对教师在课堂上的教学环节进行过程化监测和评价是提高课堂教学质量的有效途径。然而,现有基于人工的评价模式存在评价效率低下、易干扰课堂教学、主观误差等缺点,难以达到理想的效果。鉴于人工智能技术的快速发展,提出将以人为中心的智能感知与分析技术引入教师的教学过程中,对教师主体进行实时识别与分析。首先,通过人脸检测算法定位教师实时位置并进行位移分析;其次,利用视线估计算法对教师的关注区域进行检测;最后,采用基于骨架点的动作识别和表情识别对教师的动作和表情进行感知与分析。同时,对指标进行量化统计,以更为高效、客观地了解教师的教学特点,从而帮助教师针对性地改善其授课质量。在相同配置环境下的实验结果表明,该系统的各模块在相应任务中的表现较好,符合教学场景下的使用要求。从在真实的教学视频上的测试结果来看,所设计的系统能够较为准确地感知教师的教学状态,为提升授课质量提供建设性意见。
基于行为演化的学习模式识别及效果预测方法
黄春利, 刘桂梅, 姜文君, 李肯立, 张吉, 任德盛
计算机科学. 2024, 51 (10): 67-78.  doi:10.11896/jsjkx.240500002
摘要 ( 133 )   PDF(3403KB) ( 295 )   
参考文献 | 相关文章 | 多维度评价
在线学习为众多学习者提供了开放灵活的学习机会,却存在着学习者学习积极性不高、学习成绩不理想的问题。已有的在线学习效果预测工作着重从静态角度探究学习行为对成绩的影响,忽略了学习行为随时间的演化规律,缺少对行为背后学习模式和学习动机的深入探讨,而这两者正是影响学习效果的重要因素。为此,提出一种基于学习行为演化的学习模式识别及效果预测方法来建模学习行为与动机对学习效果的影响。首先,依据学习者的付出-收获量化学习效率,按时间构建学习效率动态演化序列;然后,使用高斯混合模型聚类真实学习数据并结合实际学习场景,识别4种典型学习模式;在此基础上,设计学习模式及动机预测模型,结合双向长短期记忆网络,构建学习效果预测模型。利用8门真实课程学习的公开数据,对每一种学习模式学习者的付出、收获演变规律进行细致分析。大量对比实验结果表明所提方法在多个性能指标上提升了6.9%~29.2%。本研究有助于在线学习者、教学者和平台准确理解学习者的学习状态,从而提升在线学习效果。
面向慕课视频的关键信息检索系统设计
赵博程, 包兰天, 杨哲森, 曹璇, 苗启广
计算机科学. 2024, 51 (10): 79-85.  doi:10.11896/jsjkx.240400087
摘要 ( 101 )   PDF(2590KB) ( 272 )   
参考文献 | 相关文章 | 多维度评价
随着互联网技术的迅猛发展,慕课等在线教育平台日益受到广泛关注。慕课作为一种创新的教育形式,有效突破了传统教育模式的地域界限,实现了优质教育资源的全球共享。通过慕课,学习者能够根据个人兴趣自主选择课程,灵活安排学习时间与进度,且能便利地进行重复学习。然而,当前慕课平台在针对授课视频中的特定知识点进行时间定位时,仍存在很大挑战,导致用户在学习关键核心知识点时需频繁拖动视频进度以寻找相应视频片段。针对这一现状,提出了一种基于多重二分匹配的注意力机制模型的慕课视频知识抽取算法。算法框架的主体部分包括字幕文本识别与生成、字幕文本分段提取、知识点抽取模型,以及知识点检索模块。实验结果表明,相对于当前的知识点抽取模型,所提模型在Inspec,NUS,Krapivin,SemEval,KP20k等多个数据集上,在部分关键指标上达到了当前的最优表现,充分证明了本系统在实际应用中的潜力和价值。
基于多阶段评审的大规模创新类竞赛评比方案
张长恩, 成清, 司悦航, 黄金才
计算机科学. 2024, 51 (10): 86-93.  doi:10.11896/jsjkx.240400063
摘要 ( 95 )   PDF(2624KB) ( 243 )   
参考文献 | 相关文章 | 多维度评价
当前,大规模创新类竞赛层出不穷,这类竞赛的评比因专家的主观差异等原因成了亟待解决的难题。关注大规模创新类竞赛评比方案的研究与设计,通过对已有竞赛的打分结果进行分析,综合对比多种不同评比方案的优缺点,探寻最优的评比方案,以尽可能使评审流程程序化、高效化,节约人力与时间资源。首先,构建专家分配模型确定评审专家“交叉分发”方案,运用改进模拟退火算法求解,验证了模型与算法的高精度和高效率;然后,构建加权模型对比4类标准分计算方法,设计基于专家权重的改进标准分计算方法;最后,考虑大极差对创新性的关联性,建立极差回归模型,进行基于极差的模型评估。所提模型与算法适用范围广,具有重要现实参考意义与高应用价值。
基于边缘计算和WebRTC的元宇宙教育通信技术方案研究与实现
牛冠冲, 刘飞翔, 杨雯, 苗启广, 毛亮
计算机科学. 2024, 51 (10): 94-104.  doi:10.11896/jsjkx.231200082
摘要 ( 104 )   PDF(4700KB) ( 269 )   
参考文献 | 相关文章 | 多维度评价
元宇宙教育将元宇宙应用于教育领域,为学生创造丰富多样的学习场景和资源,提供个性化的学习推荐和指导。在元宇宙场景中,可以通过边缘计算技术提升音视频传输性能和降低通信成本,包括远程控制时延的降低、终端设备能效提升等。因此,针对VR,AR教育交互场景中的设备成本高、通信时延大等问题,提出了基于边缘计算和WebRTC的通信技术方案,解决教育场景下大量用户接入造成网络拥塞的问题,构建元宇宙教育的基础通信设施。通过云端所部署的Unity渲染平台,在边缘端部署WebRTC多用户通信模块,实现极低延迟的视音频传输,提升移动边缘平台的传输性能。最后,构建云边端协同的音视频传输系统,通过实际的边缘计算传输策略和端到端实验验证,实现了低时延、高性能的元宇宙教育系统,且验证了元宇宙教育场景的可行性。
基于AU的多任务学生情绪识别方法研究
张笑云, 赵晖
计算机科学. 2024, 51 (10): 105-111.  doi:10.11896/jsjkx.240300059
摘要 ( 121 )   PDF(2146KB) ( 258 )   
参考文献 | 相关文章 | 多维度评价
智能教育快速发展,运用人工智能提升教育质量和效率已成为趋势。学生作为教育的核心,其情绪状态对教育成效具有至关重要的影响。为了深入研究学生情绪,收集了课堂场景中的学生学习视频,包括听课和小组讨论两种情境,并据此建立了一个多任务学生情绪数据库。面部作为内在情绪状态的直接外在体现,显示出AU与情绪之间的紧密关联。在此基础上,提出了一个基于多任务学习的学生情绪识别模型Multi-SER。该模型通过结合AU识别和学生情绪识别两项任务,挖掘各个AU与学生情绪之间的关联关系,进而提升模型在学生情绪识别方面的性能。在多任务实验中,Multi-SER模型的情绪识别准确率达到了80.87%,相比单情绪识别任务模型SE-C3DNet+,效果提升了3.11%。实验结果表明,通过多任务学习挖掘AU和情绪之间的关联关系,模型在分类各种情绪方面的性能得到了提升。
基于ConvNeXt的智慧课堂中的眼部情感识别及其可视化
张立国, 徐鑫, 董宇欣
计算机科学. 2024, 51 (10): 112-118.  doi:10.11896/jsjkx.240400118
摘要 ( 100 )   PDF(3005KB) ( 315 )   
参考文献 | 相关文章 | 多维度评价
通过面部表情识别和情绪分析,观测者能够根据所观察到的实体状态了解学习者的学习效果,如通过课堂中学生所展现出的情绪波动,来辨别学生对新知识的接受程度,从而更便捷、直观地理解学生的疑惑。然而,在许多情况下,学生的面部可能会被学习用品、前排同学等遮挡,导致面部情感识别准确性不高。与整张脸相比,眼部区域作为情感表达的核心部位,通常会受到观察者更多的关注,在相同的课堂环境下眼部也更不容易被遮挡。眼睛是展现情感最重要的部位之一,在情绪变化期间的眼部表情变化可以提供更多的情绪信息。特别是当一个人承受外部压力并必须抑制面部表情时,眼神很难欺骗。因此,对眼部复杂表情进行情绪识别和分析具有重要研究价值和挑战性。针对这种挑战,首先构建了一个用于分类眼部表情复杂情绪的数据集,包括5种基本情绪,另外还定义了5种复杂情绪。其次,提出了一种新颖的模型,根据数据集中输入图像中提取的眼部特征准确地对情绪进行分类。最后,介绍了一种基于眼部识别的情绪分析可视化方法,该方法可以分析复杂情感和基础情感的波动,并为基于眼部进行进一步的情绪分析提供了新的解决方案。
Student Academic Performance Predictive Model Based on Dual-stream Deep Network
XIE Hui, ZHANG Pengyuan, DONG Zexiao, YANG Huiting, KANG Huan, HE Jiangshan, CHEN Xueli
计算机科学. 2024, 51 (10): 119-128.  doi:10.11896/jsjkx.240300097
摘要 ( 82 )   PDF(1910KB) ( 218 )   
参考文献 | 相关文章 | 多维度评价
Blended teaching is one of the essential teaching methods with the development of information technology.Constructing a learning effect evaluation model is helpful to improve students' academic performance and helps teachers to better implement course teaching.However,a lack of evaluation models for the fusion of temporal and non-temporal behavioral data leads to an unsatisfactory evaluation effect.To meet the demand for predicting students' academic performance through learning behavior data,this study proposes a learning effect evaluation method that integrates expert perspective indicators to predict academic performance by constructing a dual-stream network that combines temporal behavior data and non-temporal behavior data in the learning process.In this paper,firstly,the Delphi method is used to analyze and process the course learning behavior data of students and establish an effective evaluation index system of learning behavior with universality;secondly,the Mann-Whitney U-test and the complex correlation analysis are used to analyze further and validate the evaluation indexes;and lastly,a dual-stream information fusion model,which combines temporal and non-temporal features,is established.The learning effect evaluation model is built,and the results of the mean absolute error(MAE)and root mean square error(RMSE) indexes are 4.16 and 5.29,respectively.This study indicates that combining expert perspectives for evaluation index selection and further fusing temporal and non-temporal behavioral features that for learning effect evaluation and prediction is rationality,accuracy,and effectiveness ,which provides a powerful help for the practical application of learning effect evaluation and prediction.
“五位一体”通信原理课程智慧教学模式研究与实践
马英杰, 杨亚涛, 肖嵩, 李莉
计算机科学. 2024, 51 (10): 129-134.  doi:10.11896/jsjkx.240300007
摘要 ( 111 )   PDF(4119KB) ( 262 )   
参考文献 | 相关文章 | 多维度评价
面向教育教学数字化转型的战略需求,针对“通信原理”课程特点,基于OBE理念提出了“五位一体”通信原理课程智慧教学新模式。“通信原理”课程具有突出的理论性、系统性、工程性和应用性特点。从全局性出发,对课程体系进行系统性的设计,以立德树人、为党育人、全方位育才为使命;以学生发展为中心,从重构教学内容、构建课程思政系统化体系、学生项目实践、打造智慧课堂和多元评价机制5个方面构建了“五位一体”智慧教学体系。采用雨课堂线上线下混合式教学、虚拟仿真项目教学和B站微课教学等数字化、信息化教学手段,利用技术赋能教学,打造智慧课堂。将思政教育有机融汇于智慧课堂教学,起到“润物无声”、潜移默化的效果,引发学生的知识共鸣、情感共鸣、价值共鸣。所提出的“五位一体”智慧教育教学新范式能够推进信息技术、智能技术与教育教学的深度融合,实现教学手段智能化、教学资源泛在化、教学点评实时化、课程考核多元化。
基于多尺度特征图卷积网络的教学行为识别及分析
李佳楠, 李锐宜, 赵至夫, 宋娟, 韩嘉泷, 朱桐
计算机科学. 2024, 51 (10): 135-143.  doi:10.11896/jsjkx.240400089
摘要 ( 113 )   PDF(2224KB) ( 279 )   
参考文献 | 相关文章 | 多维度评价
在教育领域,课堂教学评价是提高教学质量的关键环节之一。随着数字化教育的推广,寻求一种智能化的评价方法变得尤为重要。为此,提出了一种基于骨架行为识别和滞后序列分析的新型方法,旨在更准确地对教师的教学行为进行捕获和分析,在减少人力资源消耗的同时,降低教学评价的主观性。首先,提出多尺度特征图卷积网络,并将其用于教师课堂行为分析。该网络在空间维度上使用多尺度语义特征融合模块捕捉骨架点和肢体部位两个尺度的特征;在时间维度上使用多尺度时序特征提取模块,并分别从全局和局部两个角度提取骨架数据的时间特征。然后,构建了教师课堂行为分析数据集,并在该数据集上验证了所提方法的有效性。最后,利用所提的骨架行为识别模型和滞后序列分析法,搭建了一套教学行为识别与分析系统。在进行不同课堂教学行为识别时,所提方法在教室行为识别与分析方面具有显著的优势。
教育元宇宙视域下虚拟交互式师范生教学技能训练模式的创新构建
杨楷芳, 李君池, 许艳, 公衍超
计算机科学. 2024, 51 (10): 144-152.  doi:10.11896/jsjkx.240400120
摘要 ( 138 )   PDF(4914KB) ( 298 )   
参考文献 | 相关文章 | 多维度评价
随着信息技术的快速发展,在卓越教师培养的过程中注重教育数字化改革已经成为未来教育高质量发展的必然要求。近年来,元宇宙及教育元宇宙概念成为研究热点,并为师范生教学技能训练方式改革带来新的思路。传统师范生教学技能训练主要以课堂教学实践为核心,受时间和空间的限制,师范生的个性化、专门性、针对性训练缺乏。随着信息技术的发展,“互联网+”训练模式、移动训练模式等被提出,但训练过程存在沉浸性不高、互动性较差等问题。因此,融合教育元宇宙理念,提出虚拟交互式师范生教学技能训练模式,以体态技能和导入技能的训练为例,介绍教育元宇宙视域下的虚拟交互式师范生教学技能训练模式的构建与实践,并对实践效果进行分析,验证了虚拟交互式教学技能训练模式对师范生教学技能训练的有效性。
基于特征相似性和杰卡德中值理论的学习路径推荐方法
杨鹏飞, 王姝祺, 黄嘉阳, 张文娟, 王泉, 钟昊迪
计算机科学. 2024, 51 (10): 153-161.  doi:10.11896/jsjkx.240400111
摘要 ( 102 )   PDF(3466KB) ( 261 )   
参考文献 | 相关文章 | 多维度评价
新高考改革使得越来越多的高校从专业招生向大类招生迈进。相关研究指出,学生在专业分流选择时存在盲目性。如何解决由专业选择不平衡问题所导致的“冷门专业过冷,热门专业过热”的局面,成为大类培养模式面临的核心难题。文中提出了一种结合特征相似性和杰卡德中值理论的学习路径推荐方法CFSJM,旨在为学生在选择专业时提供方向导航和学习路径推荐。该方法利用图嵌入模型Node2vec学习学生与知识点之间的交互,以获取学生节点的特征表示。通过训练线性回归模型预测学生的专业方向,并根据特征相似性生成学习路径候选集,进而引入杰卡德中值理论生成学习路径。实验结果表明,CFSJM方法在大类招生模式下的线下教学数据中的准确率优于现有方法,为充分发挥大类招生在培养创新型人才和提升高校办学质量方面的优势提供了新的思路。
先决条件关系信息增强的课程知识图谱关系预测方法
杨佳琦, 贺超波, 官全龙, 林晓凡, 梁卓明, 罗辉琼
计算机科学. 2024, 51 (10): 162-169.  doi:10.11896/jsjkx.240400090
摘要 ( 121 )   PDF(3046KB) ( 260 )   
参考文献 | 相关文章 | 多维度评价
大量课程知识图谱在自动答疑、学习路径规划及学习资源推荐等智能化教学应用中发挥着重要的支撑作用,然而实体间关系缺失导致的不完整问题显著降低了它们的应用价值。关系预测是自动化补全课程知识图谱缺失关系的主要手段,但现有方法仅直接使用稀疏的拓扑结构信息,未能挖掘利用其特有的先决条件关系信息进一步提升预测性能。针对该问题,设计了一种先决条件关系信息增强的课程知识图谱关系预测方法PRIERP。该方法首先设计基于语义路径计算的先决条件关系信息提取机制,然后分别基于拓扑结构信息和先决条件关系信息构建双视图,并设计有向图Transformer从双视图学习课程知识图谱的低维表征,最后基于多层感知机分类模型实现端到端的关系预测。在两个典型课程知识图谱HhsMath和ML上进行相关实验,结果表明PRIERP优于其他代表性方法。在HhsMath中,PRIERP在MRR,Hits@1,Hits@3和Hits@10评价指标上相比基线方法至少分别提升2.43%,5.93%,4.73%和1.72%。此外,关系预测的典型案例分析结果也证明了PRIERP的有效性。
基于速度与准确率权衡的深度认知诊断模型
程艳, 周子为, 马明宇, 林庆龙, 詹勇鑫, 万凌峰
计算机科学. 2024, 51 (10): 170-177.  doi:10.11896/jsjkx.240300121
摘要 ( 103 )   PDF(2294KB) ( 248 )   
参考文献 | 相关文章 | 多维度评价
智能教育中,认知诊断通过分析学习者的学习行为数据来理解学习者的认知状态。现有基于深度学习方法的认知诊断模型默认假设学习者在作答过程中有足够的作答时间来完全发挥知识掌握水平,未考虑学习者在作答过程中的作答速度与作答准确率之间的权衡策略对发挥知识掌握水平的影响。针对上述问题,提出了一种基于速度与准确率权衡的深度认知诊断模型,首先构建认知风格模糊集解释学习者的权衡策略,然后通过动态逻辑回归函数模拟学习者作答过程中的速度与准确率权衡关系,实现对学习者理论上能达到最高的知识掌握水平与实际作答中发挥出来的知识掌握水平的区分诊断。此外还引入了作答时间属性和题目类型属性,以更准确地表征认知诊断交互函数中的题目参数。大量实验表明,该模型相比同类最优模型在3个公开数据集上准确度分别提升2.58%,2.86%,5.18%,且能为预测结果提供作答时间层面的解释,具有一定的优越性。
计算机软件
面向业务的资源按需解析模型构建研究
刘耀, 秦迅, 刘天吉
计算机科学. 2024, 51 (10): 178-186.  doi:10.11896/jsjkx.230800191
摘要 ( 88 )   PDF(2409KB) ( 230 )   
参考文献 | 相关文章 | 多维度评价
针对在项目开发过程中新需求来临时,需要对自然语言处理工具和资源解析插件进行重新需求分析、重复开发等问题,提出了一套面向业务的资源按需解析方案。首先,提出了一种从需求到代码的资源按需解析方法,针对需求文本本身进行需求概念标引模型的构建。构建的需求概念标引模型的准确率、召回率、F1值等指标均高于其他分类模型。然后,针对需求文本与代码的关联,建立从需求文本到代码库类别的映射机制。对于模型的映射结果,使用前K准确率(percision@K)作为评价指标,最终准确率达到60%,具有一定的实用价值。综上所述,探索了一套具有需求解析能力、实现需求与代码关联的资源按需解析关键技术,并贯穿需求文本分类、需求代码库分类、代码库检索到插件生成的整个流程,形成了完整的“需求-代码-插件-解析”的业务闭环,通过实验验证了所提方法对于资源按需解析的有效性,为业务需求分析与软件复用提供了思路,与现有用于业务需求的解析和代码生成的大语言模型相比,所提方法聚焦于具体业务领域内的含有业务特点的插件代码复用全流程的实现。
面向开源协作数字生态的信息服务与数据挖掘
夏小雅, 赵生宇, 韩凡宇, 毕枫林, 王伟, 周烜, 周傲英
计算机科学. 2024, 51 (10): 187-195.  doi:10.11896/jsjkx.230900071
摘要 ( 121 )   PDF(1984KB) ( 223 )   
参考文献 | 相关文章 | 多维度评价
开源软件在大规模发展与普及的同时也构筑了一个开源开发与协同的生态系统,在这个系统中,个人与组织协同开发所有人都可以使用的高质量软件。以GitHub为代表的社会化协作平台进一步促进了大规模、分布式、细粒度的代码协作与技术社交,无数开发者每天在其上提交代码、评审代码、报告bug,或提出新的功能请求,如何利用这些海量的协作行为数据挖掘有价值的信息是当前的研究难点。因此,设计并实现了一个面向开源协作数字生态的一站式数据挖掘系统OpenDigger,目标是构建开源领域的数据基础设施,促进开源生态的持续发展。OpenDigger系统主要由数据采集服务、数据存储模块、标签数据模块和信息服务模块构成,它基于OLAP列式数据库和图数据库,持续采集多源开源生态数据,并通过统一的接口为不同用户群体提供各类开源信息服务。OpenDigger从协作关系网络视角挖掘开源数字生态中的关键信息,相比传统统计指标,协作网络视角更好地展现了开源项目与开发者的关联特性,用户可以使用在线分析环境或CLI工具对开源生态数据进行建模与分析。OpenDigger服务于蚂蚁金服、阿里巴巴、木兰开源社区等多家企业与社区,为OSPO(Open Source Program Office,开源办公室)从业者和开源项目运营负责人提供开源数字洞察能力。
关键字敏感的嵌入式设备固件模糊测试方法
司健鹏, 洪征, 周振吉, 陈乾, 李涛
计算机科学. 2024, 51 (10): 196-207.  doi:10.11896/jsjkx.230700068
摘要 ( 110 )   PDF(3213KB) ( 232 )   
参考文献 | 相关文章 | 多维度评价
大部分嵌入式设备的固件提供Web接口,方便用户对设备进行配置和管理。然而,这些Web接口常常存在安全问题,给嵌入式设备的安全带来挑战。针对嵌入式设备固件中Web接口的漏洞检测方法误报率较高的问题,提出一种关键字敏感的嵌入式设备固件模糊测试方法KS-Fuzz(Keyword Sensitive Fuzzing),高效地对嵌入式设备固件中Web接口的处理逻辑进行模糊测试。该方法通过前后端文件的关联分析,生成高质量的测试用例,在模糊测试过程中记录目标设备后端文件对前端文件关键字的引用,引导测试用例的变异,扩大模糊测试的覆盖范围。文中使用KS-Fuzz对多款主流品牌的嵌入式设备进行测试,以评估KS-Fuzz的漏洞挖掘能力,并与SaTC,IOTScope,FirmFuzz等现有漏洞挖掘方法进行比较。结果表明,相比现有漏洞挖掘方法,KS-Fuzz通过对前后端文件关联性的分析,可以快速遍历目标设备的功能接口,在模糊测试过程中发现更多的安全问题。
高健壮性二进制应用程序裁剪
丁铎, 孙聪, 郑涛
计算机科学. 2024, 51 (10): 208-217.  doi:10.11896/jsjkx.230700008
摘要 ( 98 )   PDF(2776KB) ( 247 )   
参考文献 | 相关文章 | 多维度评价
应用程序的常用功能仅占其所有功能的小部分。冗余功能代码造成应用程序攻击面扩大,从而增大代码重用攻击风险。二进制程序裁剪能够在分析应用程序二进制的基础上,识别并删除程序冗余代码,减小程序攻击面。现有二进制裁剪方法依赖人工构造的输入产生初始控制流,并依赖启发式方法扩展控制流图,导致方法健壮性和可扩展性受限。文中提出并实现了一种高健壮性二进制应用程序裁剪方法(RBdeb),使用黑盒模糊测试技术获取具有更高健壮性的合法执行轨迹集合,基于图同构算法自动分类相似库函数,提出的路径发现算法从初始执行轨迹构成的二进制控制流子图出发,扩展二进制控制流路径和同类库函数调用,生成高健壮性的裁剪结果二进制文件。实验结果表明,相比现有方案,RBdeb具有更高的路径覆盖率和裁剪后二进制健壮性,路径发现算法和库分类方法具有更强的可扩展性,所提方法能够裁剪大规模实际应用程序。
数据库&大数据&数据科学
基于邻居采样和图注意力机制的产业链风险评估模型
孙鹏钊, 毕可骏, 唐潮, 李冬芬, 应时, 王瑞锦
计算机科学. 2024, 51 (10): 218-226.  doi:10.11896/jsjkx.230900145
摘要 ( 103 )   PDF(2861KB) ( 217 )   
参考文献 | 相关文章 | 多维度评价
风险评估是提高产业链韧性的重要途径,也是降低产业链不稳定性的有效手段。然而,现有风险评估的研究基于供应链结构,忽略了其他因素,无法准确地刻画产业链上下游各节点的关联关系,导致评估效果存在偏差。针对上述问题,考虑到产业链内部各节点相互关联、风险状况多样、存在风险传递的特性,提出了基于邻居采样和图注意力机制的产业链风险评估模型GANS。首先,构建了产业链的异质图,利用“产品-公司”“产品-产品”刻画了产业链节点之间的关联关系,并从产业链中提取财务数据等作为节点的数据特征;其次,提出了基于元路径和公司投融资关联规则的公司关系图生成模块,实现对产业链中公司节点关系的高效转化和结构特征的高效学习;接着,针对生成的多种公司关系图,设计了结合邻居采样和图注意力机制的产业链风险评估模块,对节点邻域特征进行随机采样和聚合,同时结合注意力机制对基于多种公司图的节点特征进行自适应聚合,并通过分类器实现节点级风险评估;最后,依据节点风险等级与节点的结构特征对产业链进行风险评估。实验表明,在真实产业链数据集上,GANS在准确性、F1分数等方面均优于现有的模型,证明了GANS实现产业链风险评估的准确性和有效性。
结构影响力及标签冲突感知的图课程学习方法
刘祖龙, 陈可佳
计算机科学. 2024, 51 (10): 227-233.  doi:10.11896/jsjkx.230800167
摘要 ( 97 )   PDF(2810KB) ( 229 )   
参考文献 | 相关文章 | 多维度评价
近年来,图神经网络(GNNs)已成为图学习领域的热点研究问题。受益于消息传递机制,GNNs在各类基于图的任务上均取得了优越的性能。现有的GNNs方法大多基于图中所有节点的训练难度相同的假设,然而,节点在结构影响力和邻域标签异配性等方面具有明显的差异。为此,提出了一种结构影响力及标签冲突感知的图课程学习方法(SILC-GCL),基于节点的训练难度对GNNs模型进行课程学习。首先,设计了一种综合考虑节点的PageRank影响力值以及邻域标签冲突程度的训练难度测量器;其次,采用了一个训练调度器,用于在每个训练阶段选择训练难度合适的节点并生成一个由易到难的训练节点序列;最后在GNNs骨架模型上进行训练。在6个现实网络数据集上进行的节点分类实验均验证了SILC-GCL方法的有效性。
NLGAE:一种基于改进网络结构及损失函数的图自编码器节点分类模型
廖彬, 张陶, 于炯, 李敏
计算机科学. 2024, 51 (10): 234-246.  doi:10.11896/jsjkx.230700122
摘要 ( 111 )   PDF(3898KB) ( 263 )   
参考文献 | 相关文章 | 多维度评价
利用图嵌入方法将图的拓扑结构、节点属性等高维异构信息映射到稠密的向量空间,是解决图数据由非欧空间性带来的计算不友好、邻接矩阵的高度空间复杂性等问题的主流方法。在对经典图自编码器模型GAE与VGAE所存在的问题进行分析的基础上,尝试从编码器、解码器及损失函数3个方面对基于图自编码器的图嵌入方法进行改进,提出一种基于改进网络结构及损失函数的图自编码器模型NLGAE。首先,在模型结构设计上,一方面将编码器中堆叠的图卷积层倒置,以解决GAE与VGAE中无参Decoder缺乏灵活性并且表达能力不足的问题,另一方面引入注意力机制的图卷积网络GAT来解决节点之间的权重系数固化的问题;其次,重新设计的损失函数能够同时考虑到图结构与节点特征属性两部分信息。对比实验结果表明:NLGAE作为一种无监督模型,能够学习到高质量的节点嵌入特征,在下游节点分类任务上优于DeepWalk,GAE,GrpahMAE,GATE等经典无监督模型,并且在选择合适分类模型的情况下,甚至优于GAT和GCN等有监督的图神经网络模型。
面向多尺度最近时间序列的全序链集挖掘算法
王少鹏, 冯淳恺
计算机科学. 2024, 51 (10): 247-260.  doi:10.11896/jsjkx.230800146
摘要 ( 81 )   PDF(4824KB) ( 255 )   
参考文献 | 相关文章 | 多维度评价
挖掘时间序列中的全链集是一个新兴领域。据了解,当前并无多尺度最近时间序列的全链集挖掘算法存在。对多尺度最近时间序列下全序链集的挖掘问题进行研究,在现有LRSTOMP和ALLC算法的基础上提出了一种具有增量计算特性的挖掘算法MTSC(Mining Time Series All-Chain Sets over Multi-scale Nearest Time Series,MTSC)。该算法依次使用LRSTOMP与ALLC算法对第一个最近时间序列成员内容进行处理,得到该成员上的全序链集挖掘结果,同时保留该成员相关的PL和PR结构。从第二个最近时间序列成员开始,MTSC算法中的LRSTOMP过程只需要处理当前最近时间序列成员相对于前一个最近时间序列成员的新增部分,进一步结合前一个最近时间序列成员上的PL和PR,可以增量获得当前最近时间序列成员上的PL和PR结构,在此基础上使用ALLC算法得到该成员上的全序链集挖掘结果。相较于对每一个最近时间序列成员内容都使用LRSTOMP和ALLC算法处理的Naive方式,MTSC算法利用增量计算的思想,避免了对全部数据进行重复性计算,从而加快了算法的执行速度,具有更高的时间效率。基于公有数据样本Penguin和TiltABP的仿真实验验证了该算法的有效性,实验结果表明其性能与Naive算法完全一致,且对于以上数据样本,在空间开销增加1.1%~9.7%的情况下,可以实现时间效率80%~88.3%的提升。
计算机图形学&多媒体
基于深度学习的工业缺陷检测研究进展
洪景山, 祝颖丹, 宋康康, 吕东喜, 陈明达, 胡海根
计算机科学. 2024, 51 (10): 261-275.  doi:10.11896/jsjkx.230800158
摘要 ( 455 )   PDF(3518KB) ( 327 )   
参考文献 | 相关文章 | 多维度评价
基于深度学习的机器视觉技术在工业缺陷检测上具有重要的应用价值,相较于传统方法可显著提高检测质量和效率,同时降低人工成本。通过分析近年来深度学习在缺陷检测方面的研究与应用,归纳其难点与相关的解决方法,将问题分为缺陷数据集在建立过程中存在的问题与检测模型的选择两个方面。首先,在数据层面,针对缺陷的样本少、数据标注类型复杂、数据成像质量低等问题,对应分析了少样本学习,无监督、半监督、自监督、弱监督学习以及数据增强、图像增强、图像翻译的应用;其次,在检测算法模型的选择上,根据模型类型的不同,分为基于CNN、基于Transformer以及混合模型3类进行讨论,同时根据检测任务需求的不同,又分别从图像分类、目标检测、语义分割3个方面展开论述。此外,总结了工业上常用的轻量化模型的设计方法。最后,对该领域未来的发展方向进行了讨论与展望。
基于深度学习的病理切片质量控制算法综述
丁维龙, 刘津龙, 朱伟, 廖婉茵
计算机科学. 2024, 51 (10): 276-286.  doi:10.11896/jsjkx.231000167
摘要 ( 140 )   PDF(2015KB) ( 258 )   
参考文献 | 相关文章 | 多维度评价
病理切片是病理医生对肿瘤患者的病程及预后进行诊断和分析的重要依据。然而,由于切片的制备过程自动化程度较低,人为操作的失误和设备噪声均会降低切片的质量,进而影响诊断。当前病理切片的质量控制主要采用人工抽样检查的方式,该方式工作强度大,工作时间长,易因视觉疲劳造成评估偏差。借助深度学习技术对病理切片进行质量控制受到了医学界和工业界的关注,并取得了一定的进展。文中对该领域的研究现状进行了回顾:首先简要介绍了病理切片的制作和数字化流程,分析了质量控制工作中存在的困难和挑战;然后对现有的关于病理切片的质量控制相关工作进行了分析和总结,从染色标准化、聚焦质量评估、伪影检测、图像的修复与重建等方面,对现有工作的方法理论和应用现状进行了概述;最后对该领域未来可能的研究热点进行了展望。
基于可见光-红外跨域迁移的红外弱小目标检测
薛如翔, 卫俊杰, 周华伟, 杨海, 王喆
计算机科学. 2024, 51 (10): 287-294.  doi:10.11896/jsjkx.230800013
摘要 ( 158 )   PDF(2986KB) ( 293 )   
参考文献 | 相关文章 | 多维度评价
红外弱小目标检测任务是红外探测领域的重点研究内容之一。然而由于其应用场景的特殊性,包含红外弱小目标的数据并不多见,且标注往往并不充分,这给由数据驱动的深度学习目标检测模型带来了挑战和困难。针对红外弱小目标数据集少、缺乏标记信息等问题,提出一种基于可见光-红外跨域迁移的红外弱小目标检测模型,将数据量更丰富的可见光域监督信息迁移到红外域中,实现红外域的无监督训练。首先,在YOLOv5的基础上设计通道增强的数据处理方法,利用低成本的通道分离技巧将可见光图像转换成类红外图像,缩小可见光域和红外域之间的模态差异。然后,构建多尺度域自适应模块,采用对抗训练的方式,对骨干网络提取得到的不同尺度特征在特征空间中进行域混淆以减小域偏移的影响,提高模型对弱小目标的检测性能。实验结果表明,所提方法改进后的模型相比各版本的YOLOv5模型检测精度均有所提升;与其他现有的无监督域自适应目标检测算法相比,所提方法在红外弱小目标的检测精度上明显占优。
基于类注意力的眼睛凝视估计网络
徐金龙, 董明瑞, 李颖颖, 刘艳青, 韩林
计算机科学. 2024, 51 (10): 295-301.  doi:10.11896/jsjkx.230900094
摘要 ( 106 )   PDF(2317KB) ( 227 )   
参考文献 | 相关文章 | 多维度评价
近年来,眼睛凝视估计引起广泛关注。基于RGB外观的凝视估计方法使用普通摄像机和深度学习来进行凝视估计,避免了像商用眼动仪一样使用昂贵的红外设备,为更准确和成本更低的眼睛凝视估计提供了可能。然而,RGB外观图像中包含如光照强度、肤色等多种与凝视无关的特征,这些无关特征会在深度学习回归的过程中产生干扰,进而影响凝视估计的精度。针对以上问题,提出了一种名为类注意力网络(CA-Net)的新架构,它包含通道、尺度、眼睛3种不同的类注意力模块,通过这些类注意力模块可以提取和融合不同种类的注意力编码,从而降低与凝视无关特征所占的权重。在GazeCapture数据集上的大量实验表明,在基于RGB外观的凝视估计方法中,相比现有的最先进方法,CA-Net在手机和平板上分别能够提高约0.6%和7.4%的凝视估计精度。
面向异构图像压缩感知的阶数自适应多假设重构
郑颙铣, 刘浩, 燕帅, 陈根龙
计算机科学. 2024, 51 (10): 302-310.  doi:10.11896/jsjkx.230800156
摘要 ( 85 )   PDF(2554KB) ( 218 )   
参考文献 | 相关文章 | 多维度评价
大数据时代到来,使得图像传感应用面临大维度处理与大容量传输的挑战,压缩感知技术及相关算法在一定程度上解决了该问题。然而,现有压缩感知算法存在对异构图像集泛化性不足的问题,需要为此类图像集设计高泛化性的压缩感知重构算法。因此,基于泛化性较高的多假设预测机制,提出一种阶数自适应多假设重构算法。首先通过窗口自适应线性预测器对各块进行预处理,根据预处理获得的相关性指标,改变多假设搜索窗口的大小,并依据相似度对搜索窗口内的预测块进行排序,结合自适应的搜索窗口挑选不同数量的高相似预测块,生成多假设预测的重构图像。选取自然图像集以及X光胸片和脑磁两个异构图像集进行实验,在不同采样率下对比所提算法与传统的多假设压缩感知重构算法以及两种新近提出的基于多假设预测的算法性能。实验结果表明,所提算法具有良好的性能提升。在自然图像集下,相比两种新近提出的基于多假设预测的重构算法,所提算法保持了一定的恢复质量,且运行时间分别减少了17.5%,28.7%。此外,相比两种新近提出的算法,在胸片图像集下,所提算法分别获得了1.16dB,1.43dB的平均PSNR提升,以及36.1%,21.5%的平均运行时间减少;在脑磁图像集下,所提算法分别获得了1.64dB,1.97dB的平均PSNR提升,以及平均28.6%,26.1%的运行时间减少。整体而言,所提算法具有较低的时间复杂度、较高的恢复质量,综合性能更佳。
基于联合增强图像对的红外可见光深度展开图像融合网络
袁天蕙, 干宗良
计算机科学. 2024, 51 (10): 311-319.  doi:10.11896/jsjkx.230800069
摘要 ( 100 )   PDF(5607KB) ( 246 )   
参考文献 | 相关文章 | 多维度评价
受到采集环境的影响,红外可见光融合图像有时会存在亮度不足、细节信息不够的问题。为此,提出了一种基于联合增强图像对的红外可见光深度展开图像融合网络,同时将原始红外-可见光图像对和红外-可见光图像增强对作为输入,提高网络信息融合能力。文中首先提出了一种残差展开模块,在此基础上构建了基于迭代的残差展开卷积网络用于特征提取,使其根据不同的初始化参数提取对应图像的背景和细节信息。此外,在特征融合卷积融合网络中引入了维度拼接操作和上下采样卷积块,实现联合红外-可见光图像增强对的特性汇聚,最大限度地保留源图像的差异特征。同时,优化了损失函数权重设计,以获得最佳的融合结果。在多个数据库上进行了大量实验,结果表明,与现有典型的融合方法相比,所提算法的融合图像在主观视觉和客观指标评价上均具有较好性能,在暗照度环境下优于其他方法。
人工智能
基于锐度感知增强卷积神经网络的变工况机械故障诊断
范家源, 徐德胜, 罗灵鲲, 胡士强
计算机科学. 2024, 51 (10): 320-329.  doi:10.11896/jsjkx.230900139
摘要 ( 108 )   PDF(2909KB) ( 254 )   
参考文献 | 相关文章 | 多维度评价
传统的深度迁移学习网络从有标签的源域故障数据中学习并迁移知识,完成无标签目标域上的诊断任务,有效解决了机械故障诊断中变工况场景面临的数据特征空间非对称问题。然而其知识迁移模块加剧了深度学习网络结构的复杂性,导致其损失函数的地貌特征比浅层网络复杂得多,优化难度更高。传统方法无法感知损失函数的地貌特征,容易使模型参数陷入参数泛化间隙大的局部最小值处,导致模型泛化性差,诊断精度降低。为了应对这一挑战,研究提出锐度感知增强的卷积神经网络(Sharpness Awareness Reinforced Convolutional Neural Network,SA-CNN),通过感知一定范围内模型损失函数的锐度,联合优化损失函数与其地貌特征的平坦程度,约束模型参数向损失函数锐度降低的方向收敛,进而提升模型的泛化性能。经典机械故障诊断数据集上的实验结果表明,相比传统的深度迁移模型,所提方法在变工况场景下进行跨域机械故障诊断时性能提升显著。
零边界条件下一维非线性细胞自动机可逆性的判定算法
马骏驰, 陈伟霖, 王晨, 林德福, 王超
计算机科学. 2024, 51 (10): 330-336.  doi:10.11896/jsjkx.240100207
摘要 ( 92 )   PDF(1884KB) ( 202 )   
参考文献 | 相关文章 | 多维度评价
可逆性的性质对于经典的计算机科学理论模型——细胞自动机(Cellular Automata,CA)具有重要意义。尽管CA在零边界条件下的线性规则的可逆性问题已经得到了大量的研究,但非线性规则目前还很少被探索。文中研究了在有限域$\mathbb{Z}_{p}$上一般一维CA的可逆性问题,找到了一种优化Amoroso无限CA满射性判定算法的方法。基于此,文中还提出了在零边界条件下判定一维CA可逆性的算法,其中包括一种在零边界条件下判定一维CA严格可逆性的算法,以及一种基于桶链的在零边界条件下计算一维CA的可逆性函数的算法。这些判定算法不仅适用于线性规则,也适用于非线性规则。除此以外,还证实了可逆性函数总是有一个周期的,且其周期性与对应桶链的周期性有关。文中给出了一些可逆CA的实验结果,并通过实验结果对理论部分进行了补充验证,进一步支持了文章的研究结论。
基于多关系视图轴向注意力的文档级关系抽取
吴皓, 周刚, 卢记仓, 刘洪波, 陈静
计算机科学. 2024, 51 (10): 337-343.  doi:10.11896/jsjkx.230800033
摘要 ( 104 )   PDF(2715KB) ( 251 )   
参考文献 | 相关文章 | 多维度评价
文档级关系抽取旨在从文档中提取多个实体之间的关系。针对现有工作在不同关系类型的条件下,对于实体间的多跳推理能力受限的问题,提出了一种基于多关系视图轴向注意力的文档级关系抽取模型。该模型将依据实体间的关系类型构建多视图的邻接矩阵,并基于该多视图的邻接矩阵进行多跳推理。基于两个文档级关系抽取基准数据集GDA和DocRED分别进行实验,结果表明,所提模型在生物数据集GDA上的F1指标达到85.7%,性能明显优于基线模型;在DocRED数据集上也能够有效捕获实体间的多跳关系。
基于多步句子选择-重写模型生成科技文献创新点
许贤哲, 陈景强
计算机科学. 2024, 51 (10): 344-350.  doi:10.11896/jsjkx.230800080
摘要 ( 79 )   PDF(2782KB) ( 220 )   
参考文献 | 相关文章 | 多维度评价
近年来科技文献数量的显著增加,使得研究人员难以跟上自己所在领域的最新进展。为了保持对前沿研究的追踪,研究者通常依赖于阅读文献中的创新点,该部分简明扼要地概括了关键研究成果。然而,许多作者在文中并未充分地呈现文章的创新内容,这导致读者难以快速掌握研究的核心内容。为了解决这一问题,提出了一个全新的任务,即自动生成科技文献的创新点摘要。该任务的难点之一在于目前缺少相关数据集,于是构建了科技创新点摘要语料库(SCSC)。另一个难点在于目前现有的生成式或抽取式模型在生成创新点方面分别存在冗余度过高和句与句之前缺乏关联性的问题。为了满足生成简洁、高质量创新点的需求,提出了MSSRsum模型(一个多步句子选择-重写模型)。最终实验表明,所提模型在SCSC和arXiv数据集上优于基线模型。
化学物质诱导疾病关系抽取:基于证据聚焦的图推理方法
周雪阳, 傅启明, 陈建平, 陆悠, 王蕴哲
计算机科学. 2024, 51 (10): 351-361.  doi:10.11896/jsjkx.230800111
摘要 ( 89 )   PDF(3438KB) ( 240 )   
参考文献 | 相关文章 | 多维度评价
针对现有方法在挖掘化学物质与疾病之间的相互作用关系时存在过多地关注全局信息而忽略少量的证据线索和局部提及交互的问题,提出了一种基于证据聚焦的提及水平文档级关系抽取方法(Evidence Focused Mention U-shaped Network,EF-MUnet)。该方法首先基于上下文感知策略建模提及特征,并利用二维卷积捕获邻近提及之间的局部交互;其次为避免无关上下文的干扰,提出两种证据聚焦策略ATT-EF和RL-EF,前者将相似度作为证据线索的衡量指标,后者基于强化学习利用延迟反馈无监督地学习最优证据提取策略;最后使用U-net网络捕获实体水平的全局特征,充分挖掘语义关系。实验结果表明,与已有方法相比,EF-MUnet在生物医学数据集CDR上的F1评价指标提升了9.7%,并且对于句间关系的抽取更具有优势。此外,在抽取药物突变相互作用的数据集DMI上,EF-MUnet也取得了最高98.6%的准确率,证明了它是一种有效的生物医学关系抽取方法并具有较好的泛化能力。
基于OpenFaaS的多边缘管理框架
林璟峰, 李鸣, 陈星, 莫毓昌
计算机科学. 2024, 51 (10): 362-371.  doi:10.11896/jsjkx.230800203
摘要 ( 82 )   PDF(4134KB) ( 267 )   
参考文献 | 相关文章 | 多维度评价
移动边缘计算(Mobile Edge Computing,MEC)是一种利用靠近移动设备的边缘节点提供的计算能力,来提升性能的前沿技术。现有的一些先进的计算卸载方法,已能够支持在MEC环境中基于函数粒度进行动态卸载。函数即服务(Function as a Service,FaaS)作为无服务架构的一种经典范式,提供了一种在函数粒度上构建和拓展应用程序的新方式。相比传统的方式,FaaS提供了理想的资源弹性。OpenFaaS作为当下流行的开源FaaS项目,为FaaS平台的搭建提供了良好的基础。将先进的计算卸载方法与FaaS解决方案(OpenFaaS)进行整合,是有意义且具有挑战的。为此,文中设计并实现了一个基于OpenFaaS的多边缘管理框架,该框架实现了对多个边缘上OpenFaaS的搭建与状态管理。同时,对于需要部署的函数,将其重构并部署到OpenFaaS上,在运行时能够灵活地在多个OpenFaaS间调度函数执行。针对5个实际的Java智能应用对该框架进行了评估,结果表明该框架可以有效管理多个边缘,且与本地运行相比,该框架平均可节省10.49%~49.36%的响应时间。
信息安全
基于智能合约的流数据授权撤销方案研究
门蕊蕊, 贾洪勇, 都金如
计算机科学. 2024, 51 (10): 372-379.  doi:10.11896/jsjkx.230700094
摘要 ( 103 )   PDF(2577KB) ( 235 )   
参考文献 | 相关文章 | 多维度评价
物联网设备和服务将实时生成的流数据加密后进行外包存储,并通过访问控制对用户进行授权,当用户的身份或权限发生变更时,需要撤销用户的权限。现有撤销方案通常存在密钥频繁更新和重加密密文的问题,导致撤销效率低下,灵活度不足,难以实现实时撤销,面临数据泄露风险。为解决流数据外包存储场景下的实时授权撤销问题,提出了一种基于智能合约的去中心化授权撤销方案。在边缘计算和区块链相结合的物联网架构下,将流数据按照时间间隔分块,使用HASH树生成与块对应的大量且唯一的密钥,并对分块数据进行对称加密;树节点创建访问令牌并通过代理重加密技术进行共享,实现了可更改的访问策略和高效动态数据共享;利用智能合约技术创建访问控制列表和不当行为列表,对用户权限进行定时撤销和即时撤销操作,实现了去中心化的实时授权撤销。安全性分析和仿真实验证明所提方案与其他相关的研究方案相比,提供了更好的安全性、功能、通信和计算成本,更具有效性。
SSPN-RA:基于SS-petri网的工业控制系统安全一体化风险评估方法
马梓刚, 麻荣宽, 李贝贝, 谢耀滨, 魏强, 彭慜威
计算机科学. 2024, 51 (10): 380-390.  doi:10.11896/jsjkx.231000189
摘要 ( 94 )   PDF(2353KB) ( 215 )   
参考文献 | 相关文章 | 多维度评价
随着信息化与工业化的融合不断加深,工业控制系统中信息域与物理域交叉部分越来越多,传统信息系统的网络攻击会威胁工业控制系统网络。传统的工业控制系统安全评估方法只考虑功能安全的风险,而忽略了信息安全风险对功能安全的影响。文中提出一种基于改进petri网的工业控制系统功能安全和信息安全一体化风险建模方法(Safety and Security Petri Net Risk Assessment,SSPN-RA),其中包括一体化风险识别、一体化风险分析、一体化风险评估3个步骤。所提方法首先识别并抽象化工业控制系统中的功能安全与信息安全数据,然后在风险分析过程中通过构造结合Kill Chain的petri网模型,分析出功能安全与信息安全中所存在的协同攻击路径,对petri网中功能安全与信息安全节点进行量化。同时,通过安全事件可能性以及其造成的各类损失计算出风险值,实现对工业控制系统的一体化风险评估。在开源的仿真化工工业控制系统下验证该方法的可行性,并与功能安全故障树分析和信息安全攻击树分析进行对比。实验结果表明,所提方法能够定量地得到工业控制系统的风险值,同时也解决了功能安全与信息安全单一领域分析无法识别的信息物理协同攻击和安全风险问题。
基于协同网络与度量学习的标签噪声鲁棒联邦学习方法
吴飞, 张家宾, 岳晓凡, 季一木, 荆晓远
计算机科学. 2024, 51 (10): 391-398.  doi:10.11896/jsjkx.230900050
摘要 ( 103 )   PDF(2268KB) ( 250 )   
参考文献 | 相关文章 | 多维度评价
针对联邦学习中标签噪声问题的研究较少,目前的主流方法是,服务器端引入基准数据集对客户端的模型进行评估,对客户端的聚合权重、特征类中心进行控制等,但大多数方法区分噪声客户端/噪声样本的能力尚有提升空间。文中提出了一种基于协同网络与度量学习的标签噪声鲁棒联邦学习方法。该方法由以下3部分组成:1)客户端互评分机制:客户端为彼此模型评分,构建评分矩阵,进一步将其转化为邻接矩阵,以区分干净/噪声客户端。2)协同网络模块:通过构建两个协同对等的联邦网络模型,使用简森-香农散度为协同网络彼此的训练区分干净样本与噪声样本。3)联邦-协同网络三元组损失:为噪声样本设计损失函数,约束同一噪声样本协同网络的输出特征。在CIFAR-10和CIFAR-100两个公开数据集上进行实验验证,结果表明所提方法在准确性上具有优势。
融合Inception与SE-Attention的加密流量移动业务识别
王依菁, 王清贤, 丁大钊, 闫廷聚, 曹琰
计算机科学. 2024, 51 (10): 399-407.  doi:10.11896/jsjkx.230900103
摘要 ( 87 )   PDF(3248KB) ( 269 )   
参考文献 | 相关文章 | 多维度评价
移动设备通常接入无线局域网,并依赖WiFi加密协议对网络中数据链路层流量进行加密,以维护通信安全。然而,现有加密流量识别方法主要针对网络层及以上的流量载荷进行分析,无法有效识别链路层加密流量的移动业务类别。针对该问题,提出了一种在WiFi加密场景下基于链路层流量的移动业务识别方法。通过被动嗅探WiFi数据帧,提取链路层中可用的流量侧信道特征,将流量数据转换为二维直方图矩阵。融合Inception网络和SE-Attention机制,提出识别模型——SE-Inception,旨在更好地捕捉到流量数据帧分布特征中的细节和全局信息,突出对重要特征的关注,以提高识别准确率。文中采用真实数据集进行实验验证,结果表明该方法在WiFi加密场景下可有效识别链路层加密流量的移动业务类别,平均准确率可达98.29%,相比于已有的识别方法具有更优的性能。
基于生成对抗网络的系统调用主机入侵检测技术
樊燚, 胡涛, 伊鹏
计算机科学. 2024, 51 (10): 408-415.  doi:10.11896/jsjkx.230700014
摘要 ( 115 )   PDF(2367KB) ( 245 )   
参考文献 | 相关文章 | 多维度评价
程序的系统调用信息是检测主机异常的重要数据,然而异常发生的次数相对较少,这使得收集到的系统调用数据往往存在数据不均衡的问题。较少的异常系统调用数据使得检测模型无法充分理解程序的异常行为模式,导致入侵检测的准确率较低、误报率较高。针对以上问题,提出了一种基于生成对抗网络的系统调用主机入侵检测方法,通过对异常系统调用数据的增强,缓解数据不平衡的问题。首先将程序的系统调用轨迹划分成固定长度的N-Gram序列,其次使用SeqGAN从异常数据的N-Gram序列中生成合成的N-Gram序列,生成的异常数据与原始数据集相结合,用于训练入侵检测模型。在一个主机系统调用数据集ADFA-LD及一个安卓系统调用数据集Drebin上进行了实验,所提方法的检测准确率分别为0.986和0.989,误报率分别为0.011和0,检测效果优于现有的基于混合神经网络的模型、WaveNet、Relaxed-SVM及RNN-VED的入侵检测研究方法。
医疗场景下基于属性的可净化可协同数据共享方案
王政, 王经纬, 殷新春
计算机科学. 2024, 51 (10): 416-424.  doi:10.11896/jsjkx.230700187
摘要 ( 91 )   PDF(2277KB) ( 227 )   
参考文献 | 相关文章 | 多维度评价
密文策略属性基加密(Ciphertext Policy Attribute-Based Encryption,CP-ABE)方案能够实现对密文的细粒度访问控制,确保只有经过授权的用户才能访问数据,从而保证数据的安全。然而,随着云计算和物联网技术在医疗行业的广泛应用,传统的 CP-ABE 方案在新型医疗物联网场景下逐渐无法满足数据共享在访问策略表达和密文安全性方面的需求,如多学科会诊、患者隐私数据存储等。为此,文中提出一种基于属性的可净化可协同数据共享方案,通过密文净化机制可以有效应对恶意数据拥有者的威胁。此外,该方案可以在访问结构中指定协助结点,使得具有不同属性的多个用户可以合作进行数据访问。安全分析表明,所提方案在选择明文攻击下具有不可区分安全性;性能分析表明,本文方案与其他方案相比,计算开销更低。
基于近端线性组合的信号识别神经网络黑盒对抗攻击方法
郭宇琦, 李东阳, 闫镔, 王林元
计算机科学. 2024, 51 (10): 425-431.  doi:10.11896/jsjkx.230900054
摘要 ( 105 )   PDF(3258KB) ( 264 )   
参考文献 | 相关文章 | 多维度评价
随着深度学习在无线通信领域特别是信号调制识别方向的广泛应用,神经网络易受对抗样本攻击的问题同样影响着无线通信的安全。针对无线信号在通信中难以实时获得神经网络反馈且只能访问识别结果的黑盒攻击场景,提出了一种基于近端线性组合的黑盒查询对抗攻击方法。该方法首先在数据集的一个子集上对每个原始信号样本进行近端线性组合,即在非常靠近原始信号的范围内与目标信号进行线性组合(加权系数不大于0.05),并将其输入待攻击网络以查询识别结果。通过统计网络对全部近端线性组合识别出错的数量,确定每类原始信号最容易受到线性组合影响的特定目标信号,将其称为最佳扰动信号。在攻击测试时,根据信号的类别选择对应最佳扰动信号执行近端线性组合,生成对抗样本。实验结果显示,该方法在选定子集上将每种调制类别的最佳扰动信号添加在全部数据集上能将神经网络识别准确率从94%降至50%,且相较于添加随机噪声攻击的扰动功率更小。此外,生成的对抗样本对于结构近似的神经网络具有一定迁移性。这种方法在统计查询后生成新的对抗样本时,易于实现且无需再进行黑盒查询。
专利交易中区块链应用的三方演化博弈分析
康朕玮, 李静, 朱建明
计算机科学. 2024, 51 (10): 432-441.  doi:10.11896/jsjkx.230800116
摘要 ( 119 )   PDF(4777KB) ( 253 )   
参考文献 | 相关文章 | 多维度评价
区块链技术有助于应对专利交易中信息不透明、确权难等问题,为专利交易模式的创新提供了新的选择。通过分析区块链在专利交易中的作用,构建由交易申请方、交易平台、意向受让方组成的三方演化博弈模型。基于博弈收益矩阵分析专利交易系统的演化稳定点,讨论主体的行为策略;并在此基础上,对不同情境进行初始参数赋值,通过仿真分析验证关键因素对专利交易系统及各参与主体行为策略的影响。研究结果表明:参数的数值关系会影响专利交易系统的演化稳定策略;交易平台的区块链应用策略主要受到运营成本、欺诈行为所带来损失的影响;区块链作用下掩饰成本的增加,能够抑制交易申请方的欺诈行为;调查成本与所遭受损失的降低,有助于促使意向受让方选择交易。在丰富相关理论研究的同时,为专利交易中区块链应用实践提供参考。