计算机科学 ›› 2006, Vol. 33 ›› Issue (11): 212-214.

• 计算机网络与信息安全 • 上一篇    下一篇

基于类语言模型的中文机构名称自动识别

  

  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    教育部博士点基金项目(20050007023).

  • Online:2018-11-17 Published:2018-11-17

摘要: 提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。

关键词: 类语言模型 中文机构名称识别 启发信息 Viterbi算法

Abstract: An approach based on class language model is put forward about Chinese organization automatic recogntion. Word segmentation and organization recognition can be combined. We adopted a hierarchical structure in organization model so that the organization na

Key words: Class-based language model, Chinese organization name recognition, Heuristic information,Viterbi search

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!