计算机科学 ›› 2013, Vol. 40 ›› Issue (5): 251-252.

• 人工智能 • 上一篇    下一篇

一种基于二叉树的数学公式匹配算法

秦玉平,唐亚伟,伦淑娴,王秀坤   

  1. 渤海大学工学院 锦州121000;渤海大学信息科学与技术学院 锦州121000;渤海大学工学院 锦州121000;大连理工大学计算机科学与技术学院 大连116024
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文受国家自然科学基金(60974071),辽宁省自然科学基金(201202003),辽宁省教育厅重点实验室项目(LS2010180)资助

Mathematical Formula Matching Algorithm Based on Binary Tree

QIN Yu-ping,TANG Ya-wei,LUN Shu-xian and WANG Xiu-kun   

  • Online:2018-11-16 Published:2018-11-16

摘要: 提出了一种基于二叉树结构的LaTeX格式数学公式匹配算法。首先根据数学公式的LaTeX格式生成其二叉树表示,并对树形结构作归一化处理,然后先序遍历二叉树得到公式元素序列,并对序列中的变量名称作归一化处理。对于待匹配的两个数学公式,根据两个公式元素序列对应位相同的公式元素数计算两个公式的相似度。实验结果表明,该算法实现了数学公式的准确匹配,是一种较实用的算法。

关键词: 数学公式,二叉树,归一化,相似度

Abstract: A mathematical formula matching algorithm based on binary tree was proposed.Firstly,generating the binary tree form of a mathematical formula by its LaTeX form,normalizing the binary tree structure,and then pre-order traversing the binary tree to get the formula elememn sequence,normalizing the variable names.For two mathematical formulas to be matched,the similarity is computed by the number of the equal formula element at corresponding position.The experimental results show that the algorithm realizes the accurately recognition of mathematical formula,so it is a more practical algorithm.

Key words: Mathematical formula,Binary tree,Normalization,Similarity

[1] Mander U,Baker B S.Deducing similarities in java sources from bytecode [C]∥Usenix 1998Annual Technical Conference.New Orleans:The Advanced Computing Systems Association,1998:179-190
[2] 史彦军,滕弘飞,金博.抄袭论文识别研究与发展[J].大连理工大学学报,2005,5(1):50-57
[3] 鲍军鹏,沈钧毅,刘晓东,等.自然语言文档复制检测研究综述[J].软件学报,2003,4(10):1753-1761
[4] 金博,史彦军.基于篇章结构相似度的复制检测算法[J].大连理工大学学报,2007,7(1):125-130
[5] 秦新国.基于句子相似度的文档复制检测算法研究[J].现代图书情报技术,2007(11):63-66
[6] Si A,Leong H V,Lau R W H.CHECK:A document plagiarism detection system[C]∥Proceedings of the ACM Symposium for Applied Computing.1997:70-77
[7] 郭育生,黄磊,刘昌平.基于多候选的数学公式识别系统[J].计算机研究与发展,2007,4(7):1144-1150
[8] Chan K F,Yeung D Y.Mathematical Expression Recognition:A Survey [J].International Journal on Document Analysis and Recognition,2000,3(1):3-15
[9] 靳简明,江红英,王庆人.数学公式图像处理综述[J].模式识别与人工智能,2005,8(4):429-440
[10] Lee H-J,Wang J-S.Design of a Mathematical Expression Recognition System[J].Pattern Recogniton Letters,1997,8(8):289-298
[11] 靳简明,江红英,王庆人.数学公式识别系统:MatheReader[J].计算机学报,2006,9(11):2018-2026
[12] 刘宏哲,须德.基于本体的语义相似度和相关度计算研究综述[J].计算机科学,2012,9(2):8-13
[13] 林学民,王炜.集合和字符串的相似度查询[J].计算机学报,2011,34(10):1853-1862

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!