摘要: 中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获 取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通过术语的部分翻译信息,构造出3种 查询项模式,提出了多特征的翻译抽取方法。针对传统方法结果准确率不高、候选翻译千扰项多的问题,提出端类比 对齐验证、双语对齐度验证、构词法验证3种验证模型来对候选翻译进行有效验证。实验结果表明,获取的双语翻译 对准确率高,TOPl的准确率达到97. 4% , TOP3的准确率达到98.3%.
No related articles found! |
|