计算机科学 ›› 2006, Vol. 33 ›› Issue (1): 226-228.
• • 上一篇 下一篇
出版日期:
发布日期:
基金资助:
Online:
Published:
摘要: 语种识别是机器翻译等多语种语言处理任务的必要预处理过程。但双字节编码语种的识别,如中文、日文等,尚未被充分研究和试验。本文采用Markov语言模型,提出并测试了一种有效的基于EM的训练算法。同时,给出了性能分析和与其他算法的比较。
关键词: 字符层马尔科夫模型 语种识别 机器翻译 多语种 马尔科夫模型 识别 字符 Markov 训练算法 预处理过程
Abstract: Language identification is a necessary pre-process in machine translation and other muhi-language applications, but no experiments hase yet been reported on double-byte encoded languages, such as Chinese and Japanese. An efficient EM based training algori
Key words: Character based markov models, Language identification, Machine translation
. 基于字符层马尔科夫模型的多语种识别[J]. 计算机科学, 2006, 33(1): 226-228. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2006/V33/I1/226
Cited