计算机科学 ›› 2009, Vol. 36 ›› Issue (5): 238-240.

• • 上一篇    下一篇

HNC语义标注模型的构建

  

  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文受国家973项目“自然语言理解的交互引擎研究”(2004CB318104),中国科学院声学研究所“所长择优基金”(GS13SJJ04)资助.

  • Online:2018-11-16 Published:2018-11-16

摘要: 介绍一种基于HNC理论的、人机结合的汉语语料语义标注模型。首先分析了HNC语义标注的内容,在此基础上定义了标注的流程。因标注十分复杂,在流程的主要环节使用机器标注来帮助人工标注。具体地说,在语义块切分问题上采用最大熵模型,其正确率和召回率分别达到了83.78%和91.17%;在句类判断问题上采用基于实例的模型,其正确率达到了51.64%。运用此标注模型建设了HNC语义标注语料库,目前语料规模已达到40万字。

关键词: 概念层次网络 语料库 最大熵模型

Abstract: This paper introduced a novel conceptual tagging model for corpus which is based on the Hierarchical Network of Concepts (HNC) theory,and which benefits from manual work and automatic machine. Firstly, the contents of tagging were given, and the process o

Key words: HNC, Corpus, Maximum entropy model

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!