计算机科学 ›› 2004, Vol. 31 ›› Issue (8): 95-96.

• 计算机网络与信息安全 • 上一篇    下一篇

一种基于RPUC的Web文档索引库的更新算法

熊海灵 伍胜 余建桥 李航   

  1. 西南农业大学信息学院,重庆400716
  • 出版日期:2018-11-17 发布日期:2018-11-17

  • Online:2018-11-17 Published:2018-11-17

摘要: 为提高搜索引擎文档索引库有效性验证的效率,本文提出了一种综合考虑网页更新频度、用户兴趣度及其内容重要程度诸因素相结合以确定文档索引库更新队列的算法。算法将用户的检索率、点击率、网页的Page Rank位和更新频度作为一个特征向量,与不同种类的网页的特征权值组成的矩阵相乘,求得网页的类型向量,依据类型向量实现对文档索引库更新队列的优化,算法改进了统一更新策略周期长、单一更新策略可能产生改变频繁而非常重要的网站长期叉得不到更新的问题。

关键词: RPUC Web文档 索引数据库 检索率 Page Rank 更新频度 点击率

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!