计算机科学 ›› 2005, Vol. 32 ›› Issue (8): 179-181.

• 软件工程与数据库技术 • 上一篇    下一篇

基于访问内容类型统计的Web Robot检测算法

郭伟刚 鞠时光   

  1. 广东佛山科学技术学院信息中心,佛山528000 江苏大学计算机学院,镇江212013
  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    致谢:张又又老师提供了本文的实验数据,在此表示衷心感谢!

Guo WeiGang;Ju ShiGuang   

  • Online:2018-11-17 Published:2018-11-17

摘要: 随着搜索引擎的广泛使用,由此而引起的网络机器人(Web Robot)对于Web站点的访问所产生的影响必须引起重视。该文分析了网络机器人的访问行为特点,提出了一个基于访问内容类型统计的检测算法。经实验验证,该算法可以有效地检测未知的和不遵守网络机器人排斥标准的Rohot。

关键词: 搜索引擎 网络机器人 内容分类 检测 Web 日志 Web站点 检测算法 Robot 统计

Abstract: With the widely use of search engines, the impact Web robots have on the Web sites should not be ignored. After analyzing the navigational patterns of Web robots, a new algorithm based on content classification and statistics is proposed. The experiment s

Key words: Search engine, Web robot, Content classification, Detection, Web log

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!