计算机科学 ›› 2009, Vol. 36 ›› Issue (9): 227-230.

• 人工智能 • 上一篇    下一篇

Web表格定位技术的研究与实现

廖涛,刘宗田,孙荣   

  1. (安徽理工大学计算机科学与工程学院 淮南 232001);(上海大学计算机工程与科学学院 上海 200072)
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文受国家自然科学基金(60575035),上海市重点学科建设项目(J50103)资助。

Research and Implementation of Web Table Positioning Technology

LIAO Tao, LIU Zong-tian, SUN Rong   

  • Online:2018-11-16 Published:2018-11-16

摘要: Web表格的定位作为Web表格抽取的一个重要研究内容,现在越来越得到更多人的重视。根据Web表格的结构标记和自定义的启发式规则,通过对

嵌套问题的解决、数据表格完整性的判断、
树的通历来完成表格的定位。

关键词: DOM树,表格定位,启发式规则,

嵌套,遍历

Abstract: Web table positioning technology is considered as essential components of Web table information extraction,and more and more people pay attention to them This paper realized table positioning according to Web table structure label and heuristic method rules of user-definition,which includes the solution of

nesting problem,the deterurination of table data's integrality, and traversal of
tree.

Key words: DOM tree, Table positioning, Heuristic method rules,

nesting, Traversal

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!