计算机科学 ›› 2006, Vol. 33 ›› Issue (10): 148-151.

• 计算机网络与信息安全 • 上一篇    下一篇

基于条件随机场(CRFs)的中文词性标注方法

洪铭材 张阔 唐杰 李涓子   

  1. 清华大学计算机系知识工程组,北京100084
  • 出版日期:2018-11-17 发布日期:2018-11-17

HONG Ming-Cai,ZHANG Kuo,TANG Jie,LI Juan-Zi (Knowledge Engineering Lab, DCST, Tsinghua Univ., Beijing 100084)   

  • Online:2018-11-17 Published:2018-11-17

摘要: 本文提出一种基于CRFs模型的中文词性标注方法。该方法利用CRFs模型能够添加任意特征的优点,在使用词的上下文信息的同时,针对兼类词和未登录词添加了新的统计特征。在《人民日报》1月份语料库上进行的封闭测试和开放测试中,该方法的标注准确率分别为98.56%和96.60%。

关键词: 词性标注 条件随机场 维特比解码

Abstract: This paper presents a new approach to part-of-speech (POS) tagging for Chinese texts using conditional random fields (CRFs). To take advantage of the ability of using arbitrary features as input in CRFs, not only contexts of words are exploited, but also

Key words: Part-of-speech tagging, Conditional random fields (CRFs), Viterbi decoding

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!