计算机科学 ›› 2005, Vol. 32 ›› Issue (1): 177-181.

• 软件工程与数据库技术 • 上一篇    下一篇

基于主题区域发现的中文自动文摘研究

胡珀 何婷婷 姬东鸿   

  1. 华中师范大学计算机科学与技术系,武汉430079 新加坡国立信息通信研究院,新加坡119613
  • 出版日期:2018-11-17 发布日期:2018-11-17

  • Online:2018-11-17 Published:2018-11-17

摘要: 自动文摘是自然语言处理领域的一项重要的研究课题。文中提出了一种基于主题区域发现的中文自动文摘的方法。该方法的特色在于:产生的文摘能在尽可能全面地覆盖全文多个主题的同时,显著地缩减自身的冗余,从而能有效地平衡两者之间的矛盾。通过采用K—medoids的聚类算法联同新的自定义目标函数的聚类分析方法,实现了段落自适应聚类下的文本潜在主题区域的发现及其在自动文摘领域的应用。此外,一种基于表达熵的新的评价因子被用来评价摘要的冗余。实验结果验证了该方法的可行性,有效性,是对中文自动文摘研究的一种有意义的探索。

关键词: 主题区域发现 中文自动文摘 聚类分析 表达熵 文本检索

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!