计算机科学 ›› 2015, Vol. 42 ›› Issue (1): 227-231.doi: 10.11896/j.issn.1002-137X.2015.01.050
李景玉,张仰森,陈若愚
LI Jing-yu, ZHANG Yang-sen and CHEN Ruo-yu
摘要: 为进一步提高句子相似度算法的准确性并提升其在复杂语境中的适用性,综合编辑距离、关键词及同义词语义方法,设计出面向用户查询意图的句子相似度分层算法。在充分分析实验数据用途的基础上,研究数据的特征分布,借助自然标注将句子相似度计算建模为多层次优化问题。经仿真实验证实该算法是有效的,F值可达到0.6019。
[1] 车万翔,刘挺,秦兵,等.基于改进编辑距离的中文相似句子检索[J].高级技术通讯,2004,4(7):15-19 [2] 吕学强,任飞亮,黄志丹,等.句子相似模型和最相似句子查找算法[J].东北大学学报:自然科学版,2003,4(6):531-534 [3] 杨思春,等.一种改进的句子相似度计算模型[J].电子科技大学学报,2006,5(6):956-959 [4] 赵臻,吴宁,等.基于多特征融合的句子语义相似度计算[J].计算机工程,2012,38(1):171-173 [5] 程传鹏,吴志刚.一种基于知网的句子相似度计算方法[J].计算机工程与科学,2012,4(2):172-175 [6] 刘宏哲.一种基于本体的句子相似度计算方法[J].计算机科学,2013,40(1):251-256 [7] 李彬,刘挺,秦兵,等.基于语义依存的汉语句子相似度计算[J].计算机应用研究,2003(12):15-17 [8] 王品,黄广君.信息检索中句子相似度计算[J].计算机工程,2011,7(12):38-40 [9] 李茹,王智强,等.基于框架语义分析的汉语句子相似度计算[J].计算机研究与发展,2013,50(8):1728-1736 [10] 孙茂松.基于互联网自然标注资源的自然语言处理[J].中文信息学报,2011,5(6):26-32 [11] 百度Q-T语义一致大赛 [DB/OL].http://openresearch.baidu.com/activityindex.jhtml?channelId=452 [12] NLPIR汉语分词系统[DB/OL].http://ictclas.nlpir.org/ [13] 董振东,董强.知网[DB/OL].http://www.keenage.com [14] 梅家驹,竺一鸣,高蕴琦,等.同义词词林[M].上海:上海辞书出版社,1993:106-108 |
No related articles found! |
|