计算机科学 ›› 2007, Vol. 34 ›› Issue (8): 177-179.

• 计算机网络与信息安全 • 上一篇    下一篇

针对中文文本自动分类算法的评估体系

徐威 董渊 白若鹞 张素琴   

  1. 清华大学计算机科学与技术系,北京100084
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    国家自然科学基金(No.60573017).

XU Wei, DONG Yuan, BAI Rou-Yao, ZHANG Su-Qing (Department of Computer Science and Teehnology,Tsinghua Univ. , Beijing 100084)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 中文文本自动分类能够帮助人们更有效地利用不断膨胀的海量中文信息.现有中文文本自动分类算法基于不同原理,性能各异,适用于不同情况.对于分类算法的比较评估能够确定某个分类算法的适用环境和性能特征.目前缺乏针对中文文本自动分类算法的系统评估体系.本文将引入一个评估体系,并基于该体系实现一个开放的研究平台,得出若干已有中文文本自动分类算法的比较结果.

关键词: 文本分类 评估体系 中文分词 特征选择 语料库

Abstract: Automated text categorization on Chinese helps people make more effective use of the growing Chinese information on the Internet. Current algorithms have different performance according to the environment. Evaluation to the algorithms tells the feature of

Key words: Text categorization,Evaluation system,Chinese word division,Feature selection,Corpus

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!