计算机科学 ›› 2007, Vol. 34 ›› Issue (1): 166-169.

• 计算机网络与信息安全 • 上一篇    下一篇

汉语句间成分共享类型及分布研究

  

  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文承国家973项目“自然语言理解的交互引擎研究”(2004CB318104)、中科院声学所知识创新工程项目“HNC语言知识处理理论及技术”的资助.致谢 本文的诸多认识得益于黄曾阳教授的句群语料标注及注释,在此谨致谢意.

  • Online:2018-11-16 Published:2018-11-16

摘要: 自然语言中语句之间经常出现句子成分共享的情况。本文以计算语言学理论为指导,首先明确了便于计算机自动处理的句子和句群的定义。以此为基础,获得了真实语料中句群单位内相关数据的统计结果。进而依据语句的定义分析了语句之间语义块共享的类型。给出了语句间语义块共享的具体分类。统计了真实语料中各共享类型的分布数据。同时本文还对统计数据进行了分析,统计结果符合常人对语料的直觉定性判断。本文的结果有助于语句之间成分共享和句群的计算机自动分析。

关键词: 中文信息处理 自然语言理解 语句分析 句群分析 语义块共享

Abstract: The sentence elements are usually shared among Chinese sentences. In order to analyze this problem, the definitions of sentence and sentence group are introduced based on a computing linguistie theory. The definitions are suitable to computer processing.

Key words: Chinese information processing, Natural language understanding, Sentence analysis, Sentence group analy- sis, Semantic chunk share

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!