计算机科学 ›› 2015, Vol. 42 ›› Issue (1): 227-231.doi: 10.11896/j.issn.1002-137X.2015.01.050

• 人工智能 • 上一篇    下一篇

面向用户查询意图的句子相似度分层计算

李景玉,张仰森,陈若愚   

  1. 北京信息科技大学智能处理信息研究所 北京100192,北京信息科技大学智能处理信息研究所 北京100192,北京信息科技大学智能处理信息研究所 北京100192
  • 出版日期:2018-11-14 发布日期:2018-11-14
  • 基金资助:
    本文受国家自然科学基金(61070119,61370139),北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519),北京市教委专项(PXM2013_014224_000042,PXM2014_014224_000067)资助

User Query Intention Oriented Hierarchical Sentence Similarity Computation

LI Jing-yu, ZHANG Yang-sen and CHEN Ruo-yu   

  • Online:2018-11-14 Published:2018-11-14

摘要: 为进一步提高句子相似度算法的准确性并提升其在复杂语境中的适用性,综合编辑距离、关键词及同义词语义方法,设计出面向用户查询意图的句子相似度分层算法。在充分分析实验数据用途的基础上,研究数据的特征分布,借助自然标注将句子相似度计算建模为多层次优化问题。经仿真实验证实该算法是有效的,F值可达到0.6019。

关键词: 句子相似度计算,语义一致,编辑距离,关键词特征,用户查询意图

Abstract: In order to improve the accuracy of sentence similarity computation algorithm and further enhance its applicability in complex context,a hierarchical sentence similarity algorithm for user-oriented query intention was designed,integrating technologies such as edit distance,keyword and synonyms semantic method,and natural annotation.With thorough analyzing of the experimental data and its feature distribution,a multi-level optimization strategy was put forward.The experimental results confirm the algorithm in this paper is effective and achieves F-value of 0.6019.

Key words: Sentence similarity computation,Semantic conformity,Edit distance,Keyword feature,User query intention

[1] 车万翔,刘挺,秦兵,等.基于改进编辑距离的中文相似句子检索[J].高级技术通讯,2004,4(7):15-19
[2] 吕学强,任飞亮,黄志丹,等.句子相似模型和最相似句子查找算法[J].东北大学学报:自然科学版,2003,4(6):531-534
[3] 杨思春,等.一种改进的句子相似度计算模型[J].电子科技大学学报,2006,5(6):956-959
[4] 赵臻,吴宁,等.基于多特征融合的句子语义相似度计算[J].计算机工程,2012,38(1):171-173
[5] 程传鹏,吴志刚.一种基于知网的句子相似度计算方法[J].计算机工程与科学,2012,4(2):172-175
[6] 刘宏哲.一种基于本体的句子相似度计算方法[J].计算机科学,2013,40(1):251-256
[7] 李彬,刘挺,秦兵,等.基于语义依存的汉语句子相似度计算[J].计算机应用研究,2003(12):15-17
[8] 王品,黄广君.信息检索中句子相似度计算[J].计算机工程,2011,7(12):38-40
[9] 李茹,王智强,等.基于框架语义分析的汉语句子相似度计算[J].计算机研究与发展,2013,50(8):1728-1736
[10] 孙茂松.基于互联网自然标注资源的自然语言处理[J].中文信息学报,2011,5(6):26-32
[11] 百度Q-T语义一致大赛 [DB/OL].http://openresearch.baidu.com/activityindex.jhtml?channelId=452
[12] NLPIR汉语分词系统[DB/OL].http://ictclas.nlpir.org/
[13] 董振东,董强.知网[DB/OL].http://www.keenage.com
[14] 梅家驹,竺一鸣,高蕴琦,等.同义词词林[M].上海:上海辞书出版社,1993:106-108

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!