1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    多语言计算前沿技术* 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 多语言计算前沿技术专题序言
    黄河燕, 颜永红, 黄德根, 余正涛, 熊德意
    计算机科学    2022, 49 (1): 7-8.   DOI: 10.11896/jsjkx.qy20220101
    摘要339)      PDF(pc) (1186KB)(613)    收藏
    相关文章 | 多维度评价
    2. 消解逻辑悖论建立元知识智能化体系
    郑智捷
    计算机科学    2022, 49 (1): 9-16.   DOI: 10.11896/jsjkx.210700023
    摘要720)      PDF(pc) (4996KB)(1404)    收藏
    高庆狮院士于2006年发表《新模糊集合论基础》专著,为消解模糊逻辑系列悖论进行逻辑理论基础探索;并于2009年在科学出版社发表《统一语言学基础》专著,为多语言计算前沿构造理论基础支撑。这两部专著在他的创新理论基础研究中为传世瑰宝。在悼念高庆狮院士逝世10周年之际,文中利用最新向量逻辑——变值体系,来展现在高老师的研究方向中元知识系统体系架构建模的最新进展。从向量逻辑出发,综合共轭结构、元知识模型以及各类新型处理机制,在现代逻辑和数学中判定一个复杂系统是否包含经典逻辑悖论,对保证该类系统能否存活起到核心判别作用。从分类和判别解析的角度,悖论可以分为两类模式:逻辑悖论和语义悖论。利用共轭环构造4条色带,系统化地消解莫比乌斯环展现的单面特性,展示一系列几何拓扑逻辑等学科内蕴的逻辑悖论,通过共轭环结构,形成完备的消解体系。相关的结构包括易经、微分几何、微分几何拓扑、整体变分泛函优化等复杂动态系统。随着系统化地消解莫比乌斯拓扑几何逻辑悖论,针对复杂知识系统体系架构,描述适配的相关模块及其子模块的体系架构,从经典逻辑出发,系统地建立经典逻辑、有限自动机、图灵机、冯纽曼体系。利用消解莫比乌斯悖论的向量逻辑、共轭结构和变值体系,系统化地构造量子图灵机、多元复函数向量机、复杂智能化系统体系架构以及统一语言学分析系统等,为新型元知识体系构造新型复杂智能化系统开辟道路。
    参考文献 | 相关文章 | 多维度评价
    3. 融合特定语言适配模块的多语言神经机器翻译
    刘俊鹏, 苏劲松, 黄德根
    计算机科学    2022, 49 (1): 17-23.   DOI: 10.11896/jsjkx.210900005
    摘要610)      PDF(pc) (1989KB)(1072)    收藏
    多语言神经机器翻译利用单一的编码器-解码器模型对多种语言之间的翻译同时进行建模。多语言神经机器翻译不仅能够促进关联语言之间的知识迁移,提高低资源语言的翻译质量,并且能够实现未见语言对之间的翻译。现有多语言神经机器翻译仍然存在语言多样性建模能力不足和未见语言对翻译质量不佳的问题。为此,首先在现有的适配器模型基础上提出变维双语适配器模型,在Transformer模型的每个子层之间加入双语适配器以抽取每个语言对的独特特征,并通过改变适配器隐层维度调整编码器和解码器两端的特定语言表达空间;其次,提出一种共享单语适配器模型,对每种语言的独特特征进行建模。在IWSLT多语言翻译数据集上的实验结果表明,变维双语适配器模型能够显著提升多语言翻译的性能,而单语适配器模型能够在不影响多语言翻译性能的条件下提高未见语言对的翻译质量。
    参考文献 | 相关文章 | 多维度评价
    4. 基于语种关联度课程学习的多语言神经机器翻译
    于东, 谢婉莹, 谷舒豪, 冯洋
    计算机科学    2022, 49 (1): 24-30.   DOI: 10.11896/jsjkx.210800254
    摘要319)      PDF(pc) (2038KB)(613)    收藏
    近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题。针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和收敛速度。具体来说,提出了两种度量语种关联度的指标:使用奇异向量典型相关分析对不同语言进行排序以及使用余弦相似度对特定语言中的不同句子进行排序。进一步,文中提出以验证集损失为课程替换标准的课程学习策略,使模型训练由整体训练转化为一系列课程上的训练,降低了训练难度。该方法填补了课程学习策略在多语言神经机器翻译领域的空白。文中在平衡和非平衡的IWSLT多语言数据集和Europarl语料库数据集上进行了实验,结果表明,所提方法优于多语言基线翻译系统,最多可使训练时间缩短64%。
    参考文献 | 相关文章 | 多维度评价
    5. 蒙汉神经机器翻译研究综述
    侯宏旭, 孙硕, 乌尼尔
    计算机科学    2022, 49 (1): 31-40.   DOI: 10.11896/jsjkx.210900006
    摘要478)      PDF(pc) (2542KB)(1048)    收藏
    机器翻译是利用计算机将一种语言转换成另一种语言的过程,凭借着对语义的深度理解能力,神经机器翻译已经成为目前主流的机器翻译方法,在众多拥有大规模对齐语料的翻译任务上取得了令人瞩目的成就,然而对于一些低资源语言的翻译任务效果仍不理想。蒙汉机器翻译是目前国内主要的低资源机器翻译研究之一,蒙汉两种语言的翻译并不简单地是两种语言的相互转换,更是两个民族之间的交流,因此受到国内外的广泛关注。文中主要对蒙汉神经机器翻译的发展历程和研究现状进行阐述,随后选取了近年来蒙汉神经机器翻译研究的前沿方法,包括基于无监督学习和半监督学习的数据增强方法、强化学习方法、对抗学习方法、迁移学习方法和预训练模型辅助的神经机器翻译方法等,并对这些方法进行了简要介绍。
    参考文献 | 相关文章 | 多维度评价
    6. 面向小语种机器翻译的平行语料库构建方法
    刘妍, 熊德意
    计算机科学    2022, 49 (1): 41-46.   DOI: 10.11896/jsjkx.210900012
    摘要435)      PDF(pc) (1581KB)(1435)    收藏
    神经机器翻译模型的训练效果在很大程度上取决于平行语料库的规模和质量。除了一些常见语言外,汉语与小语种间高质量平行语料库的建设一直处于滞后状态。现有小语种平行语料库多采用自动句子对齐技术利用网络资源构建而成,在文本质量和领域等方面有诸多局限性。采用人工翻译的方式可以构建高质量平行语料库,但是缺乏相关经验和方法。文中从机器翻译实践者和研究者角度出发,介绍了经济高效的人工构建小语种平行语料库的工作,包括其总体目标、实施过程、流程细节和最后结果。在构建过程中尝试并积累了各种经验,形成了小语种到汉语平行语料库构建方法、建议的总结。最终,成功构建了波斯语到汉语、印地语到汉语、印度尼西亚语到汉语各50万条高质量平行语料。实验结果表明,所构建的平行语料库有较好的质量,提高了小语种神经机器翻译模型的训练效果。
    参考文献 | 相关文章 | 多维度评价
    7. 多语言语音识别声学模型建模方法最新进展
    程高峰, 颜永红
    计算机科学    2022, 49 (1): 47-52.   DOI: 10.11896/jsjkx.210900013
    摘要504)      PDF(pc) (1410KB)(1489)    收藏
    随着多媒体信息和通信技术的快速发展,网络上的多语言语音数据日益增多。语音识别作为语音分析与处理的核心技术,如何快速地把中文和英文等少数多资源主要语言处理能力推广到更多的低资源语言,是当前识别技术迫切需要突破的瓶颈。文中试图总结声学模型建模领域的最新进展,探讨传统语音识别技术从单语言向多语言跨越过程中可能面临的困难。并在此基础之上,探索了最新的端到端语音识别技术在关键词检索系统构建上的作用,以进一步改善系统的整体效果。最后总结了如下最新研究进展:1)基于模型参数共享的多语言声学建模;2)基于语种分类信息的多语言声学建模;3)基于帧级别对齐的端到端关键词检索技术。
    参考文献 | 相关文章 | 多维度评价
    8. 基于端到端语音识别的关键词检索技术研究
    杨润延, 程高峰, 刘建
    计算机科学    2022, 49 (1): 53-58.   DOI: 10.11896/jsjkx.210800269
    摘要537)      PDF(pc) (1586KB)(925)    收藏
    近十年来,端到端的语音识别框架发展迅速。区别于传统的基于隐马尔可夫模型的语音识别框架,端到端语音识别拥有众多新特性,而且可以达到相同或更优秀的性能。因此,端到端语音识别吸引了越来越多的关注,已经成为了与传统语音识别并列的第二类主流框架。针对端到端语音识别无法提供关键词检索所需的关键词准确时间起止点与可靠置信度的问题,提出了一种基于端到端语音识别和帧级别对齐的关键词检索框架,并在越南语数据集上进行了实验验证。首先,使用端到端语音识别模型解码待测语句,得到N-最佳假设;然后,从一个与上述识别模型联合训练的音素分类器中获得逐帧音素概率,使用一个基于动态规划的对齐算法为检出的N-最佳假设和逐帧音素概率进行对齐,进而得到N-最佳假设中各个单词的时间起止点和置信度;最后,在N-最佳假设中匹配关键词,并利用时间起止点和置信度合并重复匹配的关键词,得到最终检索结果。在一个越南语自由交谈数据集上的实验表明,提出的关键词检索系统的F1值可以达到77.6%,相对于传统的基于隐马尔可夫模型的关键词检索系统的F1值提升了7.8%,而且可以提供可靠的关键词置信度。
    参考文献 | 相关文章 | 多维度评价
    9. 基于wav2vec预训练的样例关键词识别
    李昭奇, 黎塔
    计算机科学    2022, 49 (1): 59-64.   DOI: 10.11896/jsjkx.210900007
    摘要349)      PDF(pc) (1823KB)(901)    收藏
    样例关键词识别是将语音关键词片段与语音流中的片段匹配的任务。在低资源或零资源的情况下,样例关键词识别通常采用基于动态时间规正的方法。近年来,神经网络声学词嵌入已成为一种常用的样例关键词识别方法,但神经网络的方法受限于标注数据数量。使用wav2vec预训练可以减少神经网络对数据量的依赖,提升系统的性能。使用wav2vec模型提取的预训练特征直接替换梅尔频率倒谱系数特征后,在SwitchBoard语料库中提取的数据集上使双向长短时记忆网络的神经网络声学词嵌入系统的平均准确率提高了11.1%,等精度召回值提高了10.0%。将wav2vec特征与梅尔频率倒谱系数特征相融合以提取嵌入向量的方法进一步提高了系统的性能,与仅使用wav2vec的方法相比,融合方法的平均准确率提高了5.3%,等精度召回值提高了2.5%。
    参考文献 | 相关文章 | 多维度评价
    10. 多语言问答研究综述
    刘创, 熊德意
    计算机科学    2022, 49 (1): 65-72.   DOI: 10.11896/jsjkx.210900003
    摘要624)      PDF(pc) (1925KB)(1001)    收藏
    多语言问答是自然语言处理领域的研究热点之一,其目的是给定不同语种的问题和文本,模型能够返回正确的答案。随着机器翻译技术的快速发展及多语言预训练技术在自然语言处理领域中的广泛应用,多语言问答也取得了较快的发展。文中首先系统地梳理了当前多语言问答方法的相关工作,并将多语言问答方法分为基于特征的方法、基于翻译的方法、基于预训练的方法和基于双重编码的方法,分别介绍了每类方法的使用和特点;然后系统地探讨了当前多语言问答任务的相关工作,将多语言问答任务分为基于文本的多语言问答任务和基于多模态的多语言问答任务,并分别给出每个多语言问答任务的基本定义;接着总结了这些任务中的数据集统计、评价指标,以及涉及的问答方法;最后展望了多语言问答的未来发展方向。
    参考文献 | 相关文章 | 多维度评价
    11. 融合多策略数据增强的低资源依存句法分析方法
    线岩团, 高凡雅, 相艳, 余正涛, 王剑
    计算机科学    2022, 49 (1): 73-79.   DOI: 10.11896/jsjkx.210900036
    摘要391)      PDF(pc) (2164KB)(655)    收藏
    依存句法分析旨在识别句子中词与词之间的句法依赖关系。依存句法能为信息抽取、自动问答和机器翻译等任务提供句法特征,提高模型性能。训练数据规模对依存句法分析模型的性能具有重要影响,训练数据的缺乏会带来严重的未知词问题和模型过拟合问题。文中针对低资源依存句法分析问题,提出了多种数据增强策略。所提方法通过同义词替换有效扩充了训练数据,缓解了未知词问题。通过多种Mixup的数据增强策略,有效缓解了模型过拟合问题,提高了模型的泛化能力。在(Universal Dependencies treebanks,UD treebanks)数据集上的实验结果表明,所提方法有效提升了小规模训练语料条件下泰语、越南语和英语依存句法分析的性能。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共11条记录