计算机科学 ›› 2005, Vol. 32 ›› Issue (5): 167-169.

• • 上一篇    下一篇

利用prefix—hash—tree实现从中文文本到事务数据的转换

钱铁云 王元珍 冯小年   

  1. 华中科技大学计算机学院数据库与多媒体技术研究所,武汉430074 中国电力财务有限公司华中分公司,武汉430077
  • 出版日期:2018-11-17 发布日期:2018-11-17

  • Online:2018-11-17 Published:2018-11-17

摘要: 电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时问而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix—hash—tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法郝具有较好的效率。

关键词: 中文文本 hash 事务 自动文本分类 电子文档 分类方法 文本转换 数据结构 实验证明 重构算法 准确率 结构化 特殊性 结构相 关联

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!