计算机科学 ›› 2005, Vol. 32 ›› Issue (8): 182-185.

• 软件工程与数据库技术 • 上一篇    下一篇

基于标记树的Web页面区域划分和搜索方法

胡飞   

  1. 重庆教育学院,重庆400067 南京大学计算机科学与技术系,南京210093
  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    鸣谢:拙作是在南京大学计算机科学与技术系博士生导师陈世福悉心指导下完成的,在此表示由衷感谢.

Hu Fei   

  • Online:2018-11-17 Published:2018-11-17

摘要: Web页面的布局可以分为:主要内容、单位标识、导航信息、交互信息和版权申明。我们在处理这些页面时往往只关心主要内容,而且可以从语义上快速定位到主要内容,但是软件系统要做到这一点就非常困难。本文提出一种基于标记树的Web页面区域划分和搜索方法,让软件系统可以忽略别的区域,快速定位到主要内容。对于大量Web页面处理而言,这种方法可以起到减少时间,缩小空间的作用,Web页面越多,效果就越显著。

关键词: Web页面布局 页面结构 页面区域 标记树 标记树模式 Web页面 搜索方法 区域划分 快速定位 软件系统

Abstract: A Web page can be divided into several parts, they are “the main part, the department logo, the navigation bar, the hyperlinks and the copyright”. How to get the main part of Web pages. It's easy for humankind, but hard for computer pocessing. In this pap

Key words: Web page layout, Web page structure, Web page area, Tag tree, Tag tree model

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!