计算机科学 ›› 2009, Vol. 36 ›› Issue (2): 142-145.

• • 上一篇    下一篇

文本分类中用于协同的特征集分割

张博锋 苏金树   

  1. 国防科学技术大学计算机学院,长沙410073
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文受国家自然科学基金(90604006)资助.

ZHANG Bo-feng ,SU Jin-shu (School of Computer,National University of Defense Teehnology,Changsha 410073,China)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 用于文本分类领域的协同训练往往需要特征集的一个自然独立分割,但对大多数语料而言这种分割都很难获取或不存在。给出了特征子集间在类别下条件独立性的定量描述,并在此意义下提出了局部特征集分割的策略,以及两种分别基于样本聚类和图分块的以独立性为前提的特征集分割算法。在两个语料库上的分类实验证明:在该方法所获得的特征集分割下,协同训练方法能有效利用未标注样本提高分类器的综合效果,从而有效扩展了协同训练的可用性。

关键词: 文本分类 协同训练 特征集分割 局部自适应聚类 图分块

Abstract: In the area of text categorization, co-training method always needs a naturally independent split of the feature set which is hardly to obtain or rarely exists for most of the corpus. This paper presented the quantitative description of the conditional in

Key words: Text categorization,Co-training, Feature set splitting,Locally adaptive clustering,Graph partitioning

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!