计算机科学

第49卷第1期目录

计算机科学. 2022, 49 (1): 0-0.

摘要 ( 325 )

PDF(391KB) ( 677 )

相关文章 | 多维度评价

消解逻辑悖论建立元知识智能化体系

郑智捷

计算机科学. 2022, 49 (1): 9-16. doi:10.11896/jsjkx.210700023

摘要 ( 911 )

PDF(4996KB) ( 1779 )

参考文献 | 相关文章 | 多维度评价

高庆狮院士于2006年发表《新模糊集合论基础》专著,为消解模糊逻辑系列悖论进行逻辑理论基础探索;并于2009年在科学出版社发表《统一语言学基础》专著,为多语言计算前沿构造理论基础支撑。这两部专著在他的创新理论基础研究中为传世瑰宝。在悼念高庆狮院士逝世10周年之际,文中利用最新向量逻辑——变值体系,来展现在高老师的研究方向中元知识系统体系架构建模的最新进展。从向量逻辑出发,综合共轭结构、元知识模型以及各类新型处理机制,在现代逻辑和数学中判定一个复杂系统是否包含经典逻辑悖论,对保证该类系统能否存活起到核心判别作用。从分类和判别解析的角度,悖论可以分为两类模式:逻辑悖论和语义悖论。利用共轭环构造4条色带,系统化地消解莫比乌斯环展现的单面特性,展示一系列几何拓扑逻辑等学科内蕴的逻辑悖论,通过共轭环结构,形成完备的消解体系。相关的结构包括易经、微分几何、微分几何拓扑、整体变分泛函优化等复杂动态系统。随着系统化地消解莫比乌斯拓扑几何逻辑悖论,针对复杂知识系统体系架构,描述适配的相关模块及其子模块的体系架构,从经典逻辑出发,系统地建立经典逻辑、有限自动机、图灵机、冯纽曼体系。利用消解莫比乌斯悖论的向量逻辑、共轭结构和变值体系,系统化地构造量子图灵机、多元复函数向量机、复杂智能化系统体系架构以及统一语言学分析系统等,为新型元知识体系构造新型复杂智能化系统开辟道路。

融合特定语言适配模块的多语言神经机器翻译

刘俊鹏, 苏劲松, 黄德根

计算机科学. 2022, 49 (1): 17-23. doi:10.11896/jsjkx.210900005

摘要 ( 821 )

PDF(1989KB) ( 1410 )

参考文献 | 相关文章 | 多维度评价

多语言神经机器翻译利用单一的编码器-解码器模型对多种语言之间的翻译同时进行建模。多语言神经机器翻译不仅能够促进关联语言之间的知识迁移,提高低资源语言的翻译质量,并且能够实现未见语言对之间的翻译。现有多语言神经机器翻译仍然存在语言多样性建模能力不足和未见语言对翻译质量不佳的问题。为此,首先在现有的适配器模型基础上提出变维双语适配器模型,在Transformer模型的每个子层之间加入双语适配器以抽取每个语言对的独特特征,并通过改变适配器隐层维度调整编码器和解码器两端的特定语言表达空间;其次,提出一种共享单语适配器模型,对每种语言的独特特征进行建模。在IWSLT多语言翻译数据集上的实验结果表明,变维双语适配器模型能够显著提升多语言翻译的性能,而单语适配器模型能够在不影响多语言翻译性能的条件下提高未见语言对的翻译质量。

基于语种关联度课程学习的多语言神经机器翻译

于东, 谢婉莹, 谷舒豪, 冯洋

计算机科学. 2022, 49 (1): 24-30. doi:10.11896/jsjkx.210800254

摘要 ( 424 )

PDF(2038KB) ( 957 )

参考文献 | 相关文章 | 多维度评价

近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题。针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和收敛速度。具体来说,提出了两种度量语种关联度的指标:使用奇异向量典型相关分析对不同语言进行排序以及使用余弦相似度对特定语言中的不同句子进行排序。进一步,文中提出以验证集损失为课程替换标准的课程学习策略,使模型训练由整体训练转化为一系列课程上的训练,降低了训练难度。该方法填补了课程学习策略在多语言神经机器翻译领域的空白。文中在平衡和非平衡的IWSLT多语言数据集和Europarl语料库数据集上进行了实验,结果表明,所提方法优于多语言基线翻译系统,最多可使训练时间缩短64%。

蒙汉神经机器翻译研究综述

侯宏旭, 孙硕, 乌尼尔

计算机科学. 2022, 49 (1): 31-40. doi:10.11896/jsjkx.210900006

摘要 ( 639 )

PDF(2542KB) ( 1422 )

参考文献 | 相关文章 | 多维度评价

机器翻译是利用计算机将一种语言转换成另一种语言的过程,凭借着对语义的深度理解能力,神经机器翻译已经成为目前主流的机器翻译方法,在众多拥有大规模对齐语料的翻译任务上取得了令人瞩目的成就,然而对于一些低资源语言的翻译任务效果仍不理想。蒙汉机器翻译是目前国内主要的低资源机器翻译研究之一,蒙汉两种语言的翻译并不简单地是两种语言的相互转换,更是两个民族之间的交流,因此受到国内外的广泛关注。文中主要对蒙汉神经机器翻译的发展历程和研究现状进行阐述,随后选取了近年来蒙汉神经机器翻译研究的前沿方法,包括基于无监督学习和半监督学习的数据增强方法、强化学习方法、对抗学习方法、迁移学习方法和预训练模型辅助的神经机器翻译方法等,并对这些方法进行了简要介绍。

面向小语种机器翻译的平行语料库构建方法

刘妍, 熊德意

计算机科学. 2022, 49 (1): 41-46. doi:10.11896/jsjkx.210900012

摘要 ( 670 )

PDF(1581KB) ( 1909 )

参考文献 | 相关文章 | 多维度评价

神经机器翻译模型的训练效果在很大程度上取决于平行语料库的规模和质量。除了一些常见语言外,汉语与小语种间高质量平行语料库的建设一直处于滞后状态。现有小语种平行语料库多采用自动句子对齐技术利用网络资源构建而成,在文本质量和领域等方面有诸多局限性。采用人工翻译的方式可以构建高质量平行语料库,但是缺乏相关经验和方法。文中从机器翻译实践者和研究者角度出发,介绍了经济高效的人工构建小语种平行语料库的工作,包括其总体目标、实施过程、流程细节和最后结果。在构建过程中尝试并积累了各种经验,形成了小语种到汉语平行语料库构建方法、建议的总结。最终,成功构建了波斯语到汉语、印地语到汉语、印度尼西亚语到汉语各50万条高质量平行语料。实验结果表明,所构建的平行语料库有较好的质量,提高了小语种神经机器翻译模型的训练效果。

多语言语音识别声学模型建模方法最新进展

程高峰, 颜永红

计算机科学. 2022, 49 (1): 47-52. doi:10.11896/jsjkx.210900013

摘要 ( 734 )

PDF(1410KB) ( 2173 )

参考文献 | 相关文章 | 多维度评价

随着多媒体信息和通信技术的快速发展,网络上的多语言语音数据日益增多。语音识别作为语音分析与处理的核心技术,如何快速地把中文和英文等少数多资源主要语言处理能力推广到更多的低资源语言,是当前识别技术迫切需要突破的瓶颈。文中试图总结声学模型建模领域的最新进展,探讨传统语音识别技术从单语言向多语言跨越过程中可能面临的困难。并在此基础之上,探索了最新的端到端语音识别技术在关键词检索系统构建上的作用,以进一步改善系统的整体效果。最后总结了如下最新研究进展:1)基于模型参数共享的多语言声学建模;2)基于语种分类信息的多语言声学建模;3)基于帧级别对齐的端到端关键词检索技术。

基于端到端语音识别的关键词检索技术研究

杨润延, 程高峰, 刘建

计算机科学. 2022, 49 (1): 53-58. doi:10.11896/jsjkx.210800269

摘要 ( 720 )

PDF(1586KB) ( 1331 )

参考文献 | 相关文章 | 多维度评价

近十年来,端到端的语音识别框架发展迅速。区别于传统的基于隐马尔可夫模型的语音识别框架,端到端语音识别拥有众多新特性,而且可以达到相同或更优秀的性能。因此,端到端语音识别吸引了越来越多的关注,已经成为了与传统语音识别并列的第二类主流框架。针对端到端语音识别无法提供关键词检索所需的关键词准确时间起止点与可靠置信度的问题,提出了一种基于端到端语音识别和帧级别对齐的关键词检索框架,并在越南语数据集上进行了实验验证。首先,使用端到端语音识别模型解码待测语句,得到N-最佳假设;然后,从一个与上述识别模型联合训练的音素分类器中获得逐帧音素概率,使用一个基于动态规划的对齐算法为检出的N-最佳假设和逐帧音素概率进行对齐,进而得到N-最佳假设中各个单词的时间起止点和置信度;最后,在N-最佳假设中匹配关键词,并利用时间起止点和置信度合并重复匹配的关键词,得到最终检索结果。在一个越南语自由交谈数据集上的实验表明,提出的关键词检索系统的F1值可以达到77.6%,相对于传统的基于隐马尔可夫模型的关键词检索系统的F1值提升了7.8%,而且可以提供可靠的关键词置信度。

基于wav2vec预训练的样例关键词识别

李昭奇, 黎塔

计算机科学. 2022, 49 (1): 59-64. doi:10.11896/jsjkx.210900007

摘要 ( 467 )

PDF(1823KB) ( 1300 )

参考文献 | 相关文章 | 多维度评价

样例关键词识别是将语音关键词片段与语音流中的片段匹配的任务。在低资源或零资源的情况下,样例关键词识别通常采用基于动态时间规正的方法。近年来,神经网络声学词嵌入已成为一种常用的样例关键词识别方法,但神经网络的方法受限于标注数据数量。使用wav2vec预训练可以减少神经网络对数据量的依赖,提升系统的性能。使用wav2vec模型提取的预训练特征直接替换梅尔频率倒谱系数特征后,在SwitchBoard语料库中提取的数据集上使双向长短时记忆网络的神经网络声学词嵌入系统的平均准确率提高了11.1％,等精度召回值提高了10.0%。将wav2vec特征与梅尔频率倒谱系数特征相融合以提取嵌入向量的方法进一步提高了系统的性能,与仅使用wav2vec的方法相比,融合方法的平均准确率提高了5.3％,等精度召回值提高了2.5%。

多语言问答研究综述

刘创, 熊德意

计算机科学. 2022, 49 (1): 65-72. doi:10.11896/jsjkx.210900003

摘要 ( 806 )

PDF(1925KB) ( 1393 )

参考文献 | 相关文章 | 多维度评价

多语言问答是自然语言处理领域的研究热点之一,其目的是给定不同语种的问题和文本,模型能够返回正确的答案。随着机器翻译技术的快速发展及多语言预训练技术在自然语言处理领域中的广泛应用,多语言问答也取得了较快的发展。文中首先系统地梳理了当前多语言问答方法的相关工作,并将多语言问答方法分为基于特征的方法、基于翻译的方法、基于预训练的方法和基于双重编码的方法,分别介绍了每类方法的使用和特点;然后系统地探讨了当前多语言问答任务的相关工作,将多语言问答任务分为基于文本的多语言问答任务和基于多模态的多语言问答任务,并分别给出每个多语言问答任务的基本定义;接着总结了这些任务中的数据集统计、评价指标,以及涉及的问答方法;最后展望了多语言问答的未来发展方向。

融合多策略数据增强的低资源依存句法分析方法

线岩团, 高凡雅, 相艳, 余正涛, 王剑

计算机科学. 2022, 49 (1): 73-79. doi:10.11896/jsjkx.210900036

摘要 ( 579 )

PDF(2164KB) ( 1210 )

参考文献 | 相关文章 | 多维度评价

依存句法分析旨在识别句子中词与词之间的句法依赖关系。依存句法能为信息抽取、自动问答和机器翻译等任务提供句法特征,提高模型性能。训练数据规模对依存句法分析模型的性能具有重要影响,训练数据的缺乏会带来严重的未知词问题和模型过拟合问题。文中针对低资源依存句法分析问题,提出了多种数据增强策略。所提方法通过同义词替换有效扩充了训练数据,缓解了未知词问题。通过多种Mixup的数据增强策略,有效缓解了模型过拟合问题,提高了模型的泛化能力。在(Universal Dependencies treebanks,UD treebanks)数据集上的实验结果表明,所提方法有效提升了小规模训练语料条件下泰语、越南语和英语依存句法分析的性能。

非均衡数据分类经典方法综述与面向医疗领域的实验分析

江昊琛, 魏子麒, 刘璘, 陈俊

计算机科学. 2022, 49 (1): 80-88. doi:10.11896/jsjkx.210200124

摘要 ( 373 )

PDF(2115KB) ( 3499 )

参考文献 | 相关文章 | 多维度评价

近年来,人工智能技术被广泛地应用于多个领域。其中,智慧医疗场景得到了普遍关注,并产生了大量临床辅助诊断和医疗方案推荐的实际应用。然而,由于人工智能技术的本质在于通过从大量真实数据中进行模式抽取,从而预测未知情况,因此真实数据的数据特征和数据质量将直接影响人工智能应用的效果。相比其他智能应用领域,由于罕见病患者在人群中总是占极少数,医疗数据具有天然的非均衡的特点,而高度非均衡的数据在机器学习领域被认为是难于学习的。针对这一应用现状,文中首先围绕“数据非均衡”问题开展了文献调研,尝试通过寻找该问题的通用解决办法来指导在智慧医疗环境下的应用。之后,以数据挖掘领域的会议SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)近年来涉及非均衡数据集的工作为分析样本,统计针对特定领域的“数据非均衡”问题人们倾向选择的处理方法。最后,通过医学数据分析中的两个典型应用场景,对调研获得的知识和方法进行实验应用,从而验证了调研和统计分析中所得出方法的可用性。

一种面向动态科研网络的社区检测算法

蒲实, 赵卫东

计算机科学. 2022, 49 (1): 89-94. doi:10.11896/jsjkx.210100023

摘要 ( 544 )

PDF(1701KB) ( 3013 )

参考文献 | 相关文章 | 多维度评价

科研网络是一类动态变化的异构信息网络,科研网络上的社区检测能挖掘出学术主体的所属社区并发现蕴含于科研社区中的洞察。既有的社区检测算法忽略了科研网络的动态特征和科研主体间的特殊关系,未将科研社区内部的紧密程度和社区间的关系纳入社区检测算法中予以优化,对此提出了一种基于动态科研网络表示学习的社区检测算法DANE-CD。首先基于科研网络自编码器学习科研网络中学术主体的表示向量,然后创新性地在表示学习过程中融入了基于模块度和团队断裂带两个维度的聚类优化,最后基于堆栈自编码器构造了动态科研网络表示学习模型,同时完成了对科研网络的社区检测。在DBLP和HEP-TH两个真实科研数据集上进行了实验,实验结果显示算法在准确率、归一化互信息和模块度3个指标上优于既有科研社区检测算法,可以较好地完成动态科研网络下的社区检测任务。

面向海量空间数据的分布式距离连接算法

王如斌, 李瑞远, 何华均, 刘通, 李天瑞

计算机科学. 2022, 49 (1): 95-100. doi:10.11896/jsjkx.210100060

摘要 ( 372 )

PDF(2162KB) ( 1468 )

参考文献 | 相关文章 | 多维度评价

空间距离连接是空间数据分析最基本的操作之一,具有广泛的应用场景。针对现有分布式方法的空间域选取过大、数据倾斜、自连接较慢的问题,提出了一种新的面向海量空间数据的分布式距离连接算法JUST-Join。首先,JUST-Join仅选取必要的空间区域作为全局域,能够提前过滤数据,减少无效的数据传输和不必要的计算开销;然后,同时考虑了参与连接的两个数据集的分布,从而缓解了数据倾斜问题;最后,针对自连接情形的冗余计算,采用平面扫描算法来进一步提高效率。文中使用Spark实现了JUST-Join算法,并利用真实的数据集做了大量实验。实验结果表明,JUST-Join算法在效率和扩展性方面都优于现有的最先进的分布式空间分析系统。

基于DeepFM和卷积神经网络的集成式多模态谣言检测方法

陈志毅, 隋杰

计算机科学. 2022, 49 (1): 101-107. doi:10.11896/jsjkx.201200007

摘要 ( 831 )

PDF(2092KB) ( 3167 )

参考文献 | 相关文章 | 多维度评价

随着以微博为代表的社交媒体越来越流行,谣言信息借助社交媒体迅速传播,容易造成严重的后果,因此自动谣言检测问题受到了国内外学术界、产业界的广泛关注。目前,越来越多的用户使用图片来发布微博,而不仅仅是文本,微博通常由文本、图像和社会语境组成。因此,文中提出了一种基于深度神经网络,针对配文文本内容、图像以及用户属性信息的多模态网络谣言检测方法DCNN。该方法由多模态特征提取器和谣言检测器组成,多模态特征提取器分为3部分,即基于TextCNN的文本特征提取器、基于VGG-19的图片特征提取器和基于DeepFM算法的用户社会特征提取器,分别用于学习微博不同模态上的特征表示,以形成重新参数化的多模态特征,特征融合后将该融合后的多模态特征作为谣言检测器的输入进行分类检测。在微博数据集上对该算法进行了大量实验,实验结果表明DCNN算法将识别准确率从78.1%提高到了80.3%,验证了DCNN算法和其中对社会特征建立特征交互方法的可行性与有效性。

一种可用于分类型属性数据的多变量回归森林

刘振宇, 宋晓莹

计算机科学. 2022, 49 (1): 108-114. doi:10.11896/jsjkx.201200189

摘要 ( 634 )

PDF(1623KB) ( 1244 )

参考文献 | 相关文章 | 多维度评价

针对线性回归、SVR以及大部分多变量回归树等回归模型不能直接利用分类型属性进行回归分析的问题,提出了一种可联合多种类型属性的决策树结点划分方法。该方法通过定义样本集合在分类型属性上的中心以及样本到中心的距离,使得分类型属性也可以像数值型属性一样参与样本的聚类过程,从而形成样本集的划分。之后,文中又为由该方法产生的决策树选择了合适的集成方案,生成的集成器被称为聚类回归森林(CRF)。最后,在12个UCI公开数据集上对比CRF与其他9个回归模型的回归平均绝对误差(MAE)和均方根误差(RMSE),实验结果表明,CRF在10个回归模型中具有最好的表现。

融合时间特性和用户偏好的卷积序列化推荐

陈晋鹏, 胡哈蕾, 张帆, 曹源, 孙鹏飞

计算机科学. 2022, 49 (1): 115-120. doi:10.11896/jsjkx.201200192

摘要 ( 464 )

PDF(2002KB) ( 1006 )

参考文献 | 相关文章 | 多维度评价

推荐系统如今已被广泛应用于生活中,大大便利了人们的生活。传统的推荐方法主要是针对用户与物品的交互情况进行分析,分析用户与物品的历史记录,得到的只是用户过去对于物品的喜好程度。序列化推荐系统通过分析用户近一段时间与物品交互的序列,来考虑用户前后行为的关联性,能够获得用户短期内对物品的喜好程度。然而,序列化方法强调的是用户与物品在短期的联系,忽视了物品属性之间存在的关系。针对以上问题,文中提出了融合时间特性和用户偏好的卷积序列化推荐(Convolutional Embedding Recommendation with Time and User Preference,CERTU)模型。该模型能够分析物品之间存在的多样性关系,从而捕获用户对物品随时间变化的动态喜好程度这一特性。除此之外,该模型进一步考虑了物品序列中存在的单个物品和多个物品对下一物品推荐的影响。实验结果表明,CERTU模型的性能优于当前的基线方法。

结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究

张亚迪, 孙悦, 刘锋, 朱二周

计算机科学. 2022, 49 (1): 121-132. doi:10.11896/jsjkx.201100148

摘要 ( 407 )

PDF(2786KB) ( 790 )

参考文献 | 相关文章 | 多维度评价

聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用。通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来。作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点。然而,受收敛规则的影响,K-means算法仍然存在着对初始类簇中心的选取非常敏感、不能很好地处理非凸型分布和有离群值的数据集等问题。文中提出了一种基于密度参数和中心替换的改进K-means算法DC-Kmeans。该算法采用数据对象的密度参数来逐步确定初始类簇中心,使用中心替换方法更新偏离实际位置的初始中心,因而比传统聚的类算法更加精确。为了获得最佳聚类效果,文中同时提出了一个能够对聚类结果进行有效评价的新聚类有效性指标SCVI和一个能够快速获得目标数据集最佳类簇数的新算法OCNS。实验结果表明,所提聚类方法对各种类型的数据集都是有效的。

基于生成对抗网络和元路径的异质网络表示学习

蒋宗礼, 樊珂, 张津丽

计算机科学. 2022, 49 (1): 133-139. doi:10.11896/jsjkx.201000179

摘要 ( 636 )

PDF(2247KB) ( 1036 )

参考文献 | 相关文章 | 多维度评价

现实世界中的信息网络大多为异质信息网络,旨在表示低维空间中节点数据的网络表示方法已普遍用于分析异质信息网络,从而有效融合异质网络中丰富的语义信息和结构信息。但是现有的异质网络表示方法通常采用负采样从网络中随机选择节点,并且对节点和边的异质性学习能力不足。受生成式对抗网络和元路径的启发,文中提出了一种新型的异质网络表示方法。首先对采样方法使用元路径的策略进行改进,根据元路径不同的权重取样,使样本更好地体现节点之间存在的直接和间接关系,增强样本的语义关联。然后在生成对抗的博弈过程中使模型充分考虑节点和边的异质性并具备关系感知能力,实现对异质信息网络的表示学习。实验结果表明,与目前的表示算法相比,该模型学习到的表示向量在分类和链路预测实验中具有更好的性能表现。

基于多头注意力机制的用户窃电行为检测

肖丁, 张玙璠, 纪厚业

计算机科学. 2022, 49 (1): 140-145. doi:10.11896/jsjkx.210100177

摘要 ( 586 )

PDF(1880KB) ( 1415 )

参考文献 | 相关文章 | 多维度评价

窃电对社会和经济发展造成了重大损害。如何基于电力大数据来检测用户恶意窃电行为,已受到学术界和工业界的广泛关注。针对传统方法依赖于手工特征、行为序列表征不足和检测精度差等问题,提出了一种基于多头注意力机制的窃电检测模型(Electricity Theft Detection Based on Multi-Head Attention,ETD-MHA)。该模型基于双向门控循环神经网络(Bidirectional Gated Recurrent Unit,BiGRU)充分捕获用户用电行为序列的时序特征,引入多头注意力机制来进一步增强关键特征的区分度,并通过加深网络来提高学习效果。在爱尔兰和中国国家电网智能电表数据集上进行了大量的实验,结果表明,相比传统的逻辑回归(Linear Regression,LR)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)等多种算法,所提模型展现出了明显的优势。例如,在爱尔兰智能电表数据集上,其AUC值相比LR算法最高提升了34.6%。

基于邻域一致性的异常检测序列集成方法

刘意, 毛莺池, 程杨堃, 高建, 王龙宝

计算机科学. 2022, 49 (1): 146-152. doi:10.11896/jsjkx.201000156

摘要 ( 406 )

PDF(2104KB) ( 927 )

参考文献 | 相关文章 | 多维度评价

异常检测已广泛应用于多个应用领域,如网络入侵检测、信用卡欺诈检测等。数据维度的增加导致出现许多不相关和冗余的特征,这些特征会掩盖相关特征,出现假阳性结果。由于高维数据具有稀疏性和距离聚集效应,传统的基于密度、距离等的异常检测算法不再适用。大部分基于机器学习的异常检测研究都关注单一模型,而单一模型在抗过拟合能力上存在一定的不足。集成学习模型有着良好的泛化能力,而且在实际应用中展现出比单一模型更好的预测准确性。文中提出了基于邻域一致性的异常检测序列集成方法(Locality and Consistency Based Sequential Ensemble Method for Outlier Detection,LCSE)。首先基于多样性构造异常检测基本模型,其次根据全局集成一致性筛选出异常候选点,最后考虑数据局部邻域相关性选择并组合基本模型结果。通过实验验证,LCSE相比传统方法异常检测的准确率平均提升了20.7%,与集成算法LSCP_AOM和iForest相比,性能 (AUC)平均提升了3.6%,因此其性能优于其他集成方法和神经网络方法。

面向电子病历语义解析的疾病辅助诊断方法

范红杰, 李雪冬, 叶松涛

计算机科学. 2022, 49 (1): 153-158. doi:10.11896/jsjkx.201100125

摘要 ( 439 )

PDF(1762KB) ( 1057 )

参考文献 | 相关文章 | 多维度评价

针对面向电子病历的疾病辅助诊断问题,文中将词向量和文本判别方法应用到电子病历的文本语义解析任务中。具体地,采用预训练语言模型作为字符的语义表征,从而对文本特征进行准确表达,在卷积神经网络中提取N元特征后,使用胶囊单元对特征进行聚类,从而更好地捕获文本的高层语义特征,同时减少对数据量的需求。实验发现,基于ERNIE+CNN+Capsule的组合模型在真实的电子病历数据集上取得了良好的效果。此外,受图像风格迁移的启发,文中训练了从电子病历文本到病情自述文本的风格转换模型,利用非平行数据,在风格转换模型的基础上,增加了对抗思想和困惑度评价指标,可以有效缓解训练数据和测试数据分布不一致的问题。最后,相比ALBERT_tiny,BERT等模型,所提模型在病历文本上获得了86.89%的F1值,提升了1.36%~3.68%;在泛化性能任务评估中,获得了94.95%的F1值。实验证明,所提模型在保证较高准确率的前提下,可以有效适应疾病辅助诊断。

面向企业工程问题的专家推荐算法

马建红, 张烔

计算机科学. 2022, 49 (1): 159-165. doi:10.11896/jsjkx.201200227

摘要 ( 542 )

PDF(2130KB) ( 859 )

参考文献 | 相关文章 | 多维度评价

企业生产一线经常会遇到各种工程难题,需要在专家的帮助下才能得到有效解决。当前的学术资源推荐系统没有深入挖掘问题与解决方案之间的潜在知识关联,无法针对某一工程问题推荐出合适的专家。针对待解决的企业工程问题推荐专家进行的系统研究如下:1)通过专家合著网络来计算专家影响力,并结合作者次序信息构成合著者之间的偏序信息,提出了融入合著者偏序信息的主题模型,即APO-ACT模型,使作者-会议-主题(ACT)模型能更好地挖掘核心专家,更适用于推荐系统;2)通过问题知识模型挖掘问题与解决方案间的潜在知识关联。融合企业创新方法案例库,针对待解决的企业工程问题文本描述,提出并实现了一种将理论、技术及实践相结合的专家推荐算法。通过实验证明,基于APO-ACT主题模型的推荐方法在保证推荐准确率的同时能够更好地挖掘核心专家,优于基于内容的推荐和基于ACT主题模型的推荐。

星型高影响的空间co-location模式挖掘

马董, 李新源, 陈红梅, 肖清

计算机科学. 2022, 49 (1): 166-174. doi:10.11896/jsjkx.201000186

摘要 ( 317 )

PDF(3709KB) ( 790 )

参考文献 | 相关文章 | 多维度评价

空间co-location模式是其实例在空间邻域内频繁并置出现的一组空间特征集。传统的空间co-location模式挖掘方法通常假设空间实例相互独立,并采用参与度作为模式有趣性的唯一度量指标,没有考虑不同特征或相同特征不同实例在空间邻域内所产生的影响差异,因此挖掘的结果往往缺乏相关性和可解释性。文中提出了一种星型高影响的空间co-location模式及挖掘方法,能够有效发现自身影响高且在邻域范围内也具有一定影响的空间co-location模式。首先,定义了度量模式影响的两个指标:模式影响参与度和模式影响占有度。其次,提出了挖掘星型高影响co-location模式的基础挖掘算法和剪枝策略。最后,通过在大量的真实和合成数据集上进行实验,分析了挖掘算法的效率和挖掘效果。实验结果表明,所提出的星型高影响co-location模式的度量方法和挖掘算法能够挖掘出较强相关性的co-location模式。

动态低采样环境光遮蔽的实时光线追踪分子渲染

李家振, 纪庆革

计算机科学. 2022, 49 (1): 175-180. doi:10.11896/jsjkx.210200042

摘要 ( 554 )

PDF(2726KB) ( 877 )

参考文献 | 相关文章 | 多维度评价

分子可视化工作中高质量的分子渲染效果对研究人员观察生物分子结构尤为重要。主流分子可视化工具中常用的光栅化方法渲染效果不佳,不利于研究人员观察分子结构。先进的光线追踪渲染技术可以实现高质量的渲染效果,但目前工具中支持光线追踪的分子渲染方法存在使用平台限制、实时性能不足以及渲染质量不佳的问题。文中提出一种动态低采样环境光遮蔽的实时光线追踪分子渲染方法,其中提出了光线追踪中简易的重投影方法,用于实现动态低采样环境光遮蔽的时间性降噪;以及提出了阴影光线包装策略,改进了光线遍历场景时的计算并行度。实验结果表明,所提方法在个人电脑上可达到实时交互渲染性能,并且在“天河二号”平台上与先进的VMD-OSPRay方法相比,该方法获得了1.40~1.64倍的性能加速,同时改善了动态图像严重的噪点问题。

基于骨架模态的多级门控图卷积动作识别网络

干创, 吴桂兴, 詹庆原, 王鹏焜, 彭志磊

计算机科学. 2022, 49 (1): 181-186. doi:10.11896/jsjkx.201100164

摘要 ( 545 )

PDF(2636KB) ( 943 )

参考文献 | 相关文章 | 多维度评价

人类动作识别是一个极具挑战性的研究课题,广泛应用于安全监控、人机交互和自动驾驶等领域。近年来,图卷积网络在建模非欧几里德结构数据上取得了巨大成功,为骨架模态动作识别提供了新思路。由于骨架预定义图包含大量噪声,现有方法多使用高阶空域特征对空间依赖性进行建模。然而,仅关注高阶子集并不能在全局上反映顶点之间的动态相关性。此外,主流方法中模拟时间依赖性使用的卷积神经网络或循环神经网络也无法捕获多范围的时序关系。为了解决这些问题,文中提出了一种基于骨架模态的多级门控图卷积动作识别网络框架。具体地,提出了门控时序卷积模块来提取时域顶点之间的多时期依赖关系;同时,通过多维注意力机制来增强图的全局表征。为了验证所提方法的有效性,在NTU-RGB+D和Kinetics两个大型视频行为识别基准数据集上进行了实验。结果表明,所提方法的性能优于目前最先进的方法。

基于低秩矩阵估计的暗光图像增强模型

王以涵, 郝世杰, 韩徐, 洪日昌

计算机科学. 2022, 49 (1): 187-193. doi:10.11896/jsjkx.210600090

摘要 ( 434 )

PDF(2534KB) ( 1248 )

参考文献 | 相关文章 | 多维度评价

在暗光或逆光拍照时,获得的图像常常出现过暗或光照分布不均的现象,导致图像视觉质量较差。基于Retinex模型的暗光增强模型能实现有效地光照增强。但此类暗光增强模型也存在一些问题,即待处理图像中暗光区域的可视度虽然得到了有效改善,但其中隐藏的噪声也被放大和凸显,依旧影响了增强结果的视觉质量。为解决这一问题,构建了基于低秩矩阵估计的暗光图像增强模型。首先,构建包含噪声项的Retinex模型并对其进行交替优化,将暗光图像分解为光照层I以及反射层R。在这一过程中,利用低秩矩阵估计实现了对R层的噪声抑制。其次,考虑到在去噪过程中产生的图像细节被模糊的问题,进一步利用光照层I作为导向图,来融合包含和不包含去噪效果的两种增强图像,实现兼顾噪声抑制和图像原有细节保持的效果。与多种类型的暗光增强方法进行对比,所提模型在直观视觉比较和客观量化指标比较方面均取得了较好的结果。

基于自适应码率移动增强现实应用的能效优化研究

陈乐, 高岭, 任杰, 党鑫, 王祎昊, 曹瑞, 郑杰, 王海

计算机科学. 2022, 49 (1): 194-203. doi:10.11896/jsjkx.201100107

摘要 ( 503 )

PDF(3997KB) ( 992 )

参考文献 | 相关文章 | 多维度评价

随着移动增强现实(Mobile Augmented Reality,MAR)技术的飞速发展,MAR应用的种类及功能也越来越丰富多样,与此同时用户对MAR应用的视频质量及响应时间也提出了更高的要求。通常来说,MAR应用会将计算密集型任务(目标识别及渲染)卸载到云端或边缘服务器进行处理,并将渲染后的图像下载到移动端。但由于移动网络状态的不稳定性及网络带宽的限制,海量数据的传输将延长MAR应用响应时间,进而增加移动设备的传输能耗开销,严重影响用户使用体验。由此,文中提出了一种基于梯度提升回归(Gradient Boosting Regression,GBR)的自适应码率控制模型。该模型通过感知当前网络环境及拍摄内容,预测用户观感需求并对非关注点部分进行低码率压缩,从而在不影响用户体验的情况下尽可能地降低传输数据量,缩短响应时间。具体来说,通过分析200个热门视频的视频特征,构建视频特征同用户观感需求的内在联系,从而针对不同的用户需求提供合适的视频码率配置,由此达到维持体验、减少时延、节约能耗的目标。实验结果显示,同直接下载渲染后的1080p视频相比,提出的自适应码率控制模型在尽可能维持用户观感体验的前提下,每帧的下载时间平均减少了58%(19.13 ms)。

一种高精度路面裂缝检测网络结构:Crack U-Net

祝一帆, 王海涛, 李可, 吴贺俊

计算机科学. 2022, 49 (1): 204-211. doi:10.11896/jsjkx.210100128

摘要 ( 629 )

PDF(3818KB) ( 1463 )

参考文献 | 相关文章 | 多维度评价

路面裂缝对行车安全有很大的潜在威胁,以往的人工检测方法效率不高。现有裂缝检测方法模型泛化能力低,在复杂背景下的裂缝分割能力差且效率不高。为了解决这些问题,文中提出了一种基于编码器-解码器结构的新改进型网络结构Crack U-Net,目的是提高路面裂缝检测的模型泛化性以及检测精度。首先,Crack U-Net用密集连接结构增强了基于编码器-解码器的网络U-Net模型,在以往结构的基础上提高了网络各层特征信息利用率,增强了模型的鲁棒性;其次,Crack U-Net使用由残差块和mini-U组成的Crack U-block作为网络的基础卷积模块,相比传统双层卷积层,Crack U-block可以提取出更丰富的裂缝特征;最后,在Crack U-Net的下采样节点中使用了空洞卷积替代传统卷积核,以充分捕获图像边缘的裂缝特征。为验证Crack U-Net模型的有效性,在公开裂缝数据集上进行了一系列测试。实验结果显示,Crack U-Net在数据集上的AIU值比以往方法提升了2.2%,在裂缝分割精度、泛化性上都优于现有方法。另外,参数轻量化部分的实验证明,Crack U-Net可以进行很大程度的模型剪枝,无人机等移动设备将可满足剪枝后的Crack U-Net模型所需的计算资源。

面向多标签小样本学习的双流重构网络

方仲礼, 王喆, 迟子秋

计算机科学. 2022, 49 (1): 212-218. doi:10.11896/jsjkx.201100143

摘要 ( 591 )

PDF(2244KB) ( 1321 )

参考文献 | 相关文章 | 多维度评价

多标签图像分类问题是计算机视觉领域的重要问题之一,它需要对图像中的所有标签进行预测。而一幅图像中待分类的标签个数往往不止一个,同时图像中对象的大小、位置和姿态的变化都会对模型的分类性能产生影响。因此,如何有效地提高图像特征的准确表达能力是一个亟需解决的难题。针对上述难题,文中提出了一个新颖的双流重构网络来对图像进行特征抽取。具体而言,该模型首先应用一个双流注意力网络来对图像进行基于通道信息和空间信息的特征提取,并经过特征拼接使得图像特征同时兼顾通道特征细节信息和空间特征细节信息。其次,该模型引入了重构损失函数,对双流网络进行特征约束,迫使上述两种分歧特征具有相同的特征表达能力,以此促使提取的双流特征共同向真值特征迫近。在基于VOC 2007和MS COCO多标签图像数据集上的实验结果表明,所提出的双流重构网络能够准确有效地提取出显著特征,并产生更好的分类精度。同时,鉴于重建损失对模型的解拟合作用,将该方法应用在小样本场景上,实验结果显示,所提模型对小样本数据同样具有较好的分类精度。

基于视觉方面注意力的图像文本情感分析模型

袁景凌, 丁远远, 盛德明, 李琳

计算机科学. 2022, 49 (1): 219-224. doi:10.11896/jsjkx.201000074

摘要 ( 630 )

PDF(2378KB) ( 1274 )

参考文献 | 相关文章 | 多维度评价

社交网络已经成为人们日常生活中不可分割的一部分,对社交媒体信息进行情感分析有助于了解人们在社交网站上的观点、态度和情绪。传统情感分析主要依赖文本内容,随着智能手机的兴起,网络上的信息逐渐多样化,除了文本内容,还包括图像。通过研究发现,在多数情况下,图像对文本有着支持增强作用,而不独立于文本来表达情感。文中提出了一种新颖的图像文本情感分析模型(LSTM-VistaNet),具体来说,LSTM-VistaNet模型未将图像信息作为直接输入,而是利用VGG16网络提取图像特征,进一步生成视觉方面注意力,赋予文档中核心句子更高的权重,得到基于视觉方面注意力的文档表示;此外,还使用LSTM模型对文本情感进行提取,得到基于文本的文档表示。最后,将两组分类结果进行融合,以获得最终的分类标签。在Yelp餐馆评论的数据集上,所提模型在精确度上达到了62.08%,比精度较高的模型BiGRU-mVGG提高了18.92%,验证了将视觉信息作为方面注意力辅助文本进行情感分类的有效性;比VistaNet模型提高了0.32%,验证了使用LSTM模型可以有效弥补VistaNet模型中图像无法完全覆盖文本的缺陷。

基于场景先验知识的室内人体行为识别方法

刘昕, 袁家斌, 王天星

计算机科学. 2022, 49 (1): 225-232. doi:10.11896/jsjkx.201100185

摘要 ( 708 )

PDF(2920KB) ( 1238 )

参考文献 | 相关文章 | 多维度评价

目前,室内人体行为识别技术被广泛应用于视频内容理解、居家养老、医疗护理等领域,现有研究方法更多的是对人体行为进行建模,忽略了视频中场景与人体行为间的联系。为了充分利用场景信息与室内人体运动的关联性,文中对基于场景先验知识的室内人体行为识别方法进行了研究,提出了一种基于场景先验知识的双流膨胀3D行为识别网络(Scene-Prior Know-ledge Inflated 3D ConvNet,SPI3D)。首先使用ResNet152网络提取场景特征进行场景分类,再基于场景分类的结果,引入量化后的场景先验知识,通过对权值进行约束来优化总体目标函数。另外,针对现有数据集多聚焦于人体行为特征、场景复杂且场景特征不明显的问题,自建了室内场景-行为识别数据集(Scene-Action DataBase,SADB)。实验结果表明,在SADB数据集上,SPI3D网络的识别准确率为87.9%,比直接利用I3D网络的识别准确率高6%。由此可见,引入场景先验知识后的室内人体行为识别模型具有更好的表现。

基于场景图的段落生成序列图像方法

张玮琪, 汤轶丰, 李林燕, 胡伏原

计算机科学. 2022, 49 (1): 233-240. doi:10.11896/jsjkx.201100207

摘要 ( 504 )

PDF(3031KB) ( 1124 )

参考文献 | 相关文章 | 多维度评价

通过生成对抗网络进行段落生成序列图像的任务已经可以生成质量较高的图像。然而当输入的文本涉及多个对象和关系时,文本序列的上下文信息难以提取,生成图像的对象布局容易产生混乱,生成的对象细节不足。针对该问题,文中在StoryGAN的基础上,提出了一种基于场景图的段落生成序列图像方法。首先,通过图卷积将段落转换为多个场景图,每个场景图包含对应文本的对象和关系信息;然后,预测对象的边界框和分割掩膜来计算生成场景布局;最后,根据场景布局和上下文信息生成更符合对象及其关系的序列图像。在CLEVR-SV和CoDraw-SV数据集上进行测试,该方法可以生成包含多个对象及其关系的64×64像素的序列图像。实验结果表明,在CLEVR-SV数据集上,所提方法的SSIM和FID比StoryGAN分别提升了1.34%和9.49%;在CoDraw-SV数据集上,所提方法的ACC比StoryGAN提高了7.40%。所提方法提高了生成场景的布局合理性,不仅可以生成包含多个对象和关系的图像序列,而且生成的图像质量更高,细节更清晰。

基于机器学习的编译器自动调优综述

池昊宇, 陈长波

计算机科学. 2022, 49 (1): 241-251. doi:10.11896/jsjkx.210100113

摘要 ( 835 )

PDF(1692KB) ( 2826 )

参考文献 | 相关文章 | 多维度评价

现代编译器提供的优化选项众多,选择何种参数因子、选择哪些选项组合以及以何种顺序应用这些选项成为复杂的问题,其中优化次序问题是最困难的优化问题。随着传统方法的改进(迭代编译结合启发式优化搜索)以及新技术的出现(机器学习),构建一种相对高效、智能的编译器自动调优框架成为可能。文中通过调查过去数十年的相关研究,总结了前人的研究思路和应用方法。首先介绍了编译器自动调优的发展历程,包括早期的手工方法、成本函数驱动的方法、启发式优化搜索驱动的迭代编译、基于机器学习的直接预测以及机器学习驱动的迭代编译方法。然后重点梳理了基于机器学习的直接预测和机器学习驱动的迭代编译自动调优方法,统计和对比了一些较为成功的框架和最新的研究成果。最后提出了当前编译器优化存在的问题和今后的重点研究方向。

融入自注意力机制的深度学习情感分析方法

胡艳丽, 童谭骞, 张啸宇, 彭娟

计算机科学. 2022, 49 (1): 252-258. doi:10.11896/jsjkx.210600063

摘要 ( 1073 )

PDF(1915KB) ( 1752 )

参考文献 | 相关文章 | 多维度评价

文本情感极性分析是自然语言处理的热点领域,近年来基于中文语料的情感分析方法受到了学术界的广泛关注。目前大部分基于词向量的循环神经网络与卷积神经网络模型对于文本特征的提取和保留能力不足,为此文中引入了多层自注意力机制,提出了一种结合双向门控循环单元(BGRU)和多粒度卷积神经网络的中文情感极性分析方法。该方法首先使用BGRU获取文本的序列化特征信息,然后使用自注意力机制进行初步特征筛选,将处理后的特征信息导入含有不同卷积核的卷积神经网络;再使用自注意力机制对获得的局部特征进行动态权重的调整,注重关键特征的抽取;最后经Softmax获得文本情感极性。实验结果证明,模型在两种中文语料数据集上都体现了较好的分析处理性能,其中在ChineseNLPcorpus的online_shopping_10_cats数据集上取得了92.94%的情感分类准确性,在中科院谭松波学者整理的酒店评论数据集上取得了92.75%的情感分类准确度,相比目前的主流方法,其性能均有显著的提升。

基于DNA链置换的逻辑推理问题研究

吴立波, 黄玉芳

计算机科学. 2022, 49 (1): 259-263. doi:10.11896/jsjkx.210200131

摘要 ( 569 )

PDF(2708KB) ( 891 )

参考文献 | 相关文章 | 多维度评价

基于DNA链置换反应构建了逻辑推理问题的DNA计算模型。在不依托荧光标记技术等DNA实验技术的前提下,利用尽量少的DNA反应链和链置换反应以及构建0-1函数,实现了DNA链的浓度变化与布尔逻辑信号值之间的对应关系,将DNA模拟计算和数字逻辑运算相结合,设计出基于DNA链置换反应的基本逻辑运算“与”“或”“非”的DNA计算模型。利用DNA链置换反应的级联特性,将基本逻辑运算进行任意的组合,形成组合逻辑表达式,以满足不同逻辑推理问题的需求及实现完整的逻辑推理过程。通过实例得到了可满足性问题这一特殊逻辑推理问题的可行解。所有DNA链置换反应的过程和相关DNA链的浓度变化均通过Visual DSD软件仿真模拟实现。

基于信息传播的致病基因识别研究

李家文, 郭炳晖, 杨小博, 郑志明

计算机科学. 2022, 49 (1): 264-270. doi:10.11896/jsjkx.201100129

摘要 ( 395 )

PDF(2785KB) ( 954 )

参考文献 | 相关文章 | 多维度评价

基因在生命科学领域的研究中占据着重要地位,而致病基因则是关键重心之一。对致病基因的精准识别可以揭示疾病在分子层面的发病机制,为疾病的预防、诊断及治疗等多个阶段提供强力支撑。准确识别致病基因的关键在于给出基因之间的相似性度量。文中利用复杂网络对生物系统进行建模,并提出了一种带有耗散机制的多源头重启随机游走模型DRWMR来度量基因之间的功能相似程度。首先基于NCBI等生物数据库构建人类基因相互作用网络,并在KEGG的疾病-基因关联数据集上开展实验对已知致病基因进行识别。与SP,RWR和PRINCE 3种现有模型进行对比,DRWMR准确预测了581种疾病中的156种,而其余模型平均正确预测了121.3种,DRWMR的平均预测分数相比其余模型的预测分数均值高出9.46%。最后使用所提模型预测哮喘、血友病和PEHO综合征的潜在致病基因,预测结果均在文献或数据库中找到了理论或实验支持。

基于风格感知的无监督领域适应算法

宁秋怡, 史小静, 段湘煜, 张民

计算机科学. 2022, 49 (1): 271-278. doi:10.11896/jsjkx.201200094

摘要 ( 383 )

PDF(2032KB) ( 898 )

参考文献 | 相关文章 | 多维度评价

近年来,神经机器翻译的译文质量取得了显著的进步,但是其在训练过程中严重依赖平行的双语句子对。然而对于电子商务领域来说,平行资源是稀缺的,此外,文化的不同导致产品信息表达存在风格差异。为了解决这两个问题,提出了一种基于风格感知的无监督领域适应算法,该算法在互训练方法中充分利用电子商务单语数据,同时引入拟知识蒸馏的方法处理风格差异。通过获取电商产品数据信息构建非平行双语语料,基于该语料以及中英新闻平行语料进行多组实验,结果表明,相比各种无监督领域适应方法,该算法显著提高了翻译质量,较最强的基线系统提高了约5个BLEU点。此外,将该算法在Ted,Law和Medical OPUS 3类数据上进一步拓展应用,均取得了更佳的翻译效果。

高效计算因果网中的干预

李超, 覃飙

计算机科学. 2022, 49 (1): 279-284. doi:10.11896/jsjkx.210300028

摘要 ( 363 )

PDF(1532KB) ( 831 )

参考文献 | 相关文章 | 多维度评价

在因果网中,对和积问题因果效果的计算是其首要问题,从有向无环图的角度,研究者们发现每一个因果网都有一个与之对应的贝叶斯网络,干预是因果网的一个基本操作。类似于贝叶斯网络中的剪枝策略,在剪枝掉所有无效结点后,文中设计了一种优化的算法OFDo来计算对因果网中每个结点的完全原子干预。文中接着研究多干预操作,发现多干预操作具有可交换性,并基于多干预操作的可交换性证明了多干预操作的优化计算策略。最后,通过实验证实OFDo计算对因果网中所有结点完全原子干预的效率比目前的算法都好。

基于序列特征融合的蛋白质可溶性预测

牛富生, 郭延哺, 李维华, 刘文洋

计算机科学. 2022, 49 (1): 285-291. doi:10.11896/jsjkx.201100117

摘要 ( 556 )

PDF(2692KB) ( 1318 )

参考文献 | 相关文章 | 多维度评价

蛋白质可溶性在药物设计的研究中起着重要的作用,传统生物实验测试蛋白质可溶性费时费力,因此基于计算方法对可溶性进行预测成为一个重要的研究方向。针对传统可溶性预测模型不能充分表示蛋白质特征的问题,文中设计了一种基于多种蛋白质序列信息的神经网络模型PSPNet,并应用到蛋白质可溶性预测中。该模型首先使用氨基酸残基序列嵌入信息和氨基酸序列进化信息表示蛋白质序列;然后采用卷积神经网络提取氨基酸序列嵌入特征的局部关键信息;其次利用双向LSTM网络提取蛋白质序列远程依赖特征;最后利用注意力机制将该特征与氨基酸进化信息融合,并将包含了多种序列信息的融合特征用于蛋白质可溶性预测。实验结果表明,相比基准方法,该模型提高了蛋白质可溶性预测的精度,并具有良好的可扩展性。

基于领域适应嵌入的军事命名实体识别

刘凯, 张宏军, 陈飞琼

计算机科学. 2022, 49 (1): 292-297. doi:10.11896/jsjkx.201100007

摘要 ( 490 )

PDF(2065KB) ( 1033 )

参考文献 | 相关文章 | 多维度评价

为了解决单一军事领域语料不足导致的领域嵌入空间质量欠佳,使得深度学习神经网络模型识别军事命名实体精度较低的问题,文中从字词分布式表示入手,通过领域自适应方法由额外的领域引入更多有用信息帮助学习军事领域的嵌入。首先建立领域词典,将其与CRF算法结合,对收集到的通用领域语料和军事领域语料进行领域自适应分词,作为嵌入训练语料,并将词向量作为特征与字向量拼接,以丰富嵌入信息并验证分词效果;然后对训练所得的通用领域和军事领域的异构嵌入空间进行领域自适应转换,生成领域自适应嵌入,并作为基础模型BiLSTM-CRF层的输入;最后通过CoNLL-2000进行识别评价。实验结果表明,在相同模型下,输入领域适应嵌入比输入一般分词后的语料训练所得的军事领域嵌入,其模型识别的精确率(P)、召回率(R)、综合F1值(F1)分别提高了2.17%,1.04%,1.59%。

一种快速收敛的最大置信上界探索方法

敖天宇, 刘全

计算机科学. 2022, 49 (1): 298-305. doi:10.11896/jsjkx.201100194

摘要 ( 429 )

PDF(2606KB) ( 890 )

参考文献 | 相关文章 | 多维度评价

深度强化学习(Deep Reinforcement Learning,DRL)方法在大状态空间控制任务上取得了出色效果,探索问题一直是该领域的一个研究热点。现有探索算法存在盲目探索、学习慢等问题。针对以上问题,提出了一种快速收敛的最大置信上界探索(Upper Confidence Bound Exploration with Fast Convergence,FAST-UCB)方法。该方法使用UCB算法探索大状态空间,提高探索效率。为缓解Q值高估的问题、平衡探索与利用关系,加入了Q值截断技巧。之后,为平衡算法偏差与方差,使智能体(agent)快速学习,在网络模型中加入长短时记忆(Long Short Term Memory,LSTM)单元,同时使用一种改进混合蒙特卡洛(Mixed Monte Carlo,MMC)方法计算网络误差。最后,将FAST-UCB应用到深度Q网络(Deep Q Network,DQN),在控制类环境中将其与ε-贪心(ε-greedy)、UCB算法进行对比,以验证其有效性。在雅达利(Atari) 2600环境中将其与噪声网络(Noisy-Network)探索、自举(Bootstrapped)探索、异步优势行动者评论家(Asynchronous Advantage Actor Critic,A3C)算法和近端策略优化(Proximal Policy Optimization,PPO)算法进行对比,以验证其泛化性。实验结果表明,FAST-UCB算法在这两类环境中均能取得优秀效果。

视频隐私保护技术综述

金华, 朱靖宇, 王昌达

计算机科学. 2022, 49 (1): 306-313. doi:10.11896/jsjkx.201200047

摘要 ( 1128 )

PDF(1875KB) ( 1492 )

参考文献 | 相关文章 | 多维度评价

随着视频处理技术的迅速发展及硬件成本的不断降低,监控设备得到了越来越广泛的应用。视频监控普及所带来的隐私问题泄露逐渐成为了研究热点。根据目前视频隐私保护领域的研究现状,将视频隐私保护方法主要分为隐私主体识别、隐私主体保护以及隐私信息管理3个阶段,对每个阶段的算法进行分类概述并分析其优缺点,其中视频区域保护作为视频隐私保护领域的重要组成部分,联系视频编码发展历程对保护方法进行了分析和比较。最后探讨了视频隐私保护领域目前存在的问题并对未来的研究方向进行了展望,为视频隐私保护的相关研究提供了参考。

基于宏块编码信息自适应置换的H.264/AVC视频加密方法

梁剑, 何军辉

计算机科学. 2022, 49 (1): 314-320. doi:10.11896/jsjkx.201100089

摘要 ( 433 )

PDF(2396KB) ( 852 )

参考文献 | 相关文章 | 多维度评价

云存储的发展使人们愿意将个人视频数据传输至云端,但伴随而来的数据安全问题日益突出,选择加密是对视频进行隐私保护的有效手段之一。针对目前H.264/AVC视频选择加密方法普遍存在安全性不足的问题,文中提出了一种基于宏块编码信息自适应置换的H.264/AVC视频加密方法。该方法根据宏块的编码类型逐帧自适应生成伪随机序列,利用伪随机序列将宏块编码信息中的残差编码方案(Coded Block Pattern,CBP)和残差数据(Residual)在宏块间进行随机置换,同时还对I宏块的帧内预测模式以及P宏块与B宏块的运动向量差值的符号进行加密。实验结果表明,该方法可保证加密视频兼容H.264/AVC编码标准,并具有加密空间大、密钥敏感性好、视频码率变化小的特点。与现有的主流加密方案相比,所提方法在视觉安全性和抵抗最新提出的轮廓攻击方面表现更佳。

基于门限环签名的分级匿名表决方案

范家幸, 王志伟

计算机科学. 2022, 49 (1): 321-327. doi:10.11896/jsjkx.201000032

摘要 ( 371 )

PDF(1577KB) ( 1339 )

参考文献 | 相关文章 | 多维度评价

表决是现代民主社会常用的一种方式,涉及政治、股份企业、法院判决等多个领域。表决是一种特殊的投票,它只有“同意”和“否决”两个候选对象,一方票数过半即得结果。区块链作为一种自带对账功能的数字记账技术,具有时间戳、公开性、不可篡改等特性,满足表决的透明性和可验证性。为实现表决的匿名性,文中采用环签名来隐藏表决内容与表决者的对应关系。文中提出的分级匿名表决方案,实现了表决的合法性、保密性、不可重复性、可更新性和可验证性。通过为表决者产生虚拟身份形成层级机制,可用于各表决者持票数不等的场景;分级匿名表决协议将门限环签名方案运用到表决场景,使得表决过程中一旦一方票数过半即可签名得到最终的表决结果,计票过程简单、高效。

基于DPoS共识机制的区块链社区演化的可视分析方法

温啸林, 李长林, 张馨艺, 刘尚松, 朱敏

计算机科学. 2022, 49 (1): 328-335. doi:10.11896/jsjkx.201200118

摘要 ( 476 )

PDF(3537KB) ( 1060 )

参考文献 | 相关文章 | 多维度评价

DPoS(股权授权证明)是当前主流区块链共识机制之一,独特的节点竞选机制使其形成不断演化的区块链社区。对区块链社区演化模式进行分析可以发现共识机制的潜在风险,具有十分重要的研究意义。针对DPoS共识机制区块链数据,提出了一种新颖的共识机制效能组合分析策略,面向区块链社区演化模式,提出了一种多角度探索的可视分析方法。首先,量化了节点排名变化前后工作完成度与投票排名的差异,对共识机制的选择效能和激励效能进行组合分析;然后,针对共识机制组合效能、节点地域分布演化和节点间差异比较等方面设计可视化视图与交互手段;最后,基于EOS主链真实数据设计实现基于DPoS共识机制的区块链社区演化可视分析系统,并通过案例研究和专家评估验证所提方法的可用性及有效性。

基于改进哈希时间锁的区块链跨链资产交互协议

刘峰, 张嘉淏, 周俊杰, 利牧, 孔德莉, 杨杰, 齐佳音, 周爱民

计算机科学. 2022, 49 (1): 336-344. doi:10.11896/jsjkx.210600170

摘要 ( 844 )

PDF(3482KB) ( 1827 )

参考文献 | 相关文章 | 多维度评价

区块链是近年来炙手可热的技术话题之一,与其相关的研究理论正在不断丰富。然而,距离区块链技术落地仍面临着吞吐量小、处理效率低的关键问题。针对该问题,跨链技术作为一种有潜力,同时具备扩大吞吐量处理能力、提升处理效率的区块链技术而被广泛关注。文中给出了一种基于改进哈希时间锁的跨链资产交互协议(A Novel Hash-Time-Lock-Contract Based Cross-Chain Token Swap Mechanism,NCASP),创造性地为Fabric区块链引入账户体系,融合智能合约技术实现了在以太坊和Fabric联盟链网络之间的安全无缝资产交换。NCASP协议在每笔HTLC(Hash Time Lock Contract)转账中设置了不同的中间账户进行资产托管和转移,并在交易完成后及时销毁,使得在原有跨链交易速率不变的同时,保证了交易的安全性。通过对协议进行仿真模拟表明,该协议适用于以Fabric为代表的联盟链与比特币以及以以太坊为代表的公链,无需第三方区块链介入,即可实现高效安全的跨链资产交换,且在交易效率上比BSN(Blockchain Service Network)的跨链方案节省了约26.8%。改进的协议扩展了传统HTLC跨链资产方案的使用场景,使不同用户间的资产交换兼顾原子性、公平性以及透明性的特点。

面向纯文本信息隐藏的区块链隐蔽通信模型

佘维, 霍丽娟, 田钊, 刘炜, 宋轩

计算机科学. 2022, 49 (1): 345-352. doi:10.11896/jsjkx.201000112

摘要 ( 494 )

PDF(2089KB) ( 1161 )

参考文献 | 相关文章 | 多维度评价

纯文本信息隐藏容易遭受删除、更改等主动攻击,使嵌入的秘密信息遭到破坏。区块链因具有不可篡改、不可伪造、匿名性、节点信息同步等特点,成为构建隐蔽信道的天然平台,并确保秘密信息不被破坏。文中提出了一种面向纯文本信息隐藏的区块链隐蔽通信模型。首先,根据偏序关系确定嵌入秘密信息的位置,发送方使用空格法将秘密信息嵌入到纯文本内容中;然后,构建区块链网络隐蔽通信的场景,发送方将载有纯文本内容的交易发布到区块链网络上;最后,在交易打包并形成链块后,任意节点均可作为接收方获取文件,但只有受信方可以通过嵌入算法的逆过程提取出秘密信息。实验对比及分析表明,该模型具有较好的抗检测性、鲁棒性、安全性和较高的隐藏容量。更为重要的是,以区块链作为信道的方法可使受信方身份得以隐藏,通信过程的隐蔽性得到了双重保障。

一种基于Logistic-Sine-Cosine映射的彩色图像加密算法

张赛男, 李千目

计算机科学. 2022, 49 (1): 353-358. doi:10.11896/jsjkx.201000041

摘要 ( 791 )

PDF(2541KB) ( 926 )

参考文献 | 相关文章 | 多维度评价

科技的飞速发展为拍摄和分享图像带来了便利,但随着图像数据的急剧增多,泄露和篡改等安全问题也频频发生,图像加密技术的应用迫在眉睫,尤其是彩色图像的加密急需改进与发展。传统的加密技术主要是针对数据流加密,其效率低、计算量大,存在一定的局限性。基于变换域加密将图像从空域变换到频域进行加密再变换到空域,属于一种有损加密。基于混沌的加密,密钥空间大,实现简单,加密速度快,一般需要采用多个混沌系统来增强加密的安全性。为此,文中设计了一种针对彩色图像RGB三通道的简单安全的空域加密算法,先由 Logistic-Sine-Cosine映射生成较为安全的混沌序列,接着利用混沌序列设计4轮置乱和扩散像素,最后,在一系列安全性分析实验中验证了基于Logistic-Sine-Cosine 映射的彩色图像加密算法的安全性和有效性。