计算机科学 ›› 2007, Vol. 34 ›› Issue (6): 210-213.

• • 上一篇    下一篇

中文网页分类研究与系统实现

段军峰 黄维通 陆玉昌   

  1. 清华大学计算机科学与技术系,北京100084
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    国家自然科学基金项目(60473115)资助.

DUAN Jun-Feng, HUANG Wei-Tong ,LU Yu-Chang (Department of Computer Science and Technology,Tsinghua University,Beijing 100084)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 近年来,网页分类研究逐渐成为网络挖掘和文本挖掘的研究热点,针对中文网页分类的研究也日益增多。本文详细介绍了一个中文网页分类系统的设计与实现,并且提出了一些网页预处理和特征处理的方法。实验结果表明,本文的方法可以使中文网页分类性能由81.5%提高至94.9%。

关键词: 中文网页分类 网页预处理 特征抽取

Abstract: Web-page classification has become a hotspot in the fields of Web mining and text mining in recent years. Studies towards Chinese Web-page are more and more. A detailed design and implementation of a Chinese Web-page classification system is introduced, a

Key words: Chinese Web-page classification,Web-page preprocessing,Feature extraction

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!