计算机科学 ›› 2008, Vol. 35 ›› Issue (3): 142-145.

• • 上一篇    下一篇

本体驱动的文本虚拟样本构造方法研究

王晓东 郭雷 方俊   

  1. 西北工业大学自动化学院,陕西西安710072
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    基金项目:国家自然科学基金资助项目(60675015).

WANG Xiao-Dong, GUO Lei ,FANG Jun (College of Automation, Northwestern Polyteehnieal University, Xi'an 710072)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 构造虚拟样本能够为机器学习中的训练集融入先验知识,从而改善标注瓶颈问题。提出了一种本体驱动的文本虚拟样本构造方法。在确保类别不变性的前提下,该方法依据领域相关本体所明晰表达的领域知识,基于本体树的点、边、子树,从同义、父子、语义同构的多个词义关系角度实现了文本虚拟样本的构造。初步实验表明,该方法与原分类及类似方法相比具有更好的分类精度和推广能力。

关键词: 虚拟样本 文本分类 本体 本体树 领域知识

Abstract: Constructing virtual examples can incorporate prior knowledge into training set in machine learning, so as to alleviate the labeling bottleneck. An Ontology-driven scheme to construct text virtual sample is proposed. Under the precondition of label invari

Key words: Virtual example, Text categorization, Ontology, Ontology tree, Domain knowledge

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!