%A 李金廷,侯宏旭,武静,王洪彬,樊文婷 %T 语料预处理对蒙古文-汉文统计机器翻译的影响 %0 Journal Article %D 2017 %J 计算机科学 %R 10.11896/j.issn.1002-137X.2017.10.047 %P 259-264 %V 44 %N 10 %U {https://www.jsjkx.com/CN/abstract/article_16668.shtml} %8 2018-12-01 %X 传统蒙古文形态分析主要采用将蒙古文词缀和词干直接切分而仅保留词干的方法,该方法会丢掉蒙古文词缀所包含的大量语义信息。蒙古文词缀中包含大量格的附加成分,主要表征句子的结构特征,对其进行切分并不会影响词汇的语义特征,若不进行预处理则会造成严重的数据稀疏问题,从而影响翻译质量。因此,基于现有理论对语料预处理方法进行总结研究,重点研究了蒙古文格处理对翻译结果的影响,目的是从蒙古文形态分析的特殊性入手来提高蒙古文-汉文统计机器翻译的质量。通过优化预处理方法,使机器翻译结果的BLEU得分相比基线系统1提高了3.22个点。