计算机科学 ›› 2005, Vol. 32 ›› Issue (5): 167-169.
• • 上一篇 下一篇
钱铁云 王元珍 冯小年
出版日期:
发布日期:
Online:
Published:
摘要: 电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时问而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix—hash—tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法郝具有较好的效率。
关键词: 中文文本 hash 事务 自动文本分类 电子文档 分类方法 文本转换 数据结构 实验证明 重构算法 准确率 结构化 特殊性 结构相 关联
钱铁云 王元珍 冯小年. 利用prefix—hash—tree实现从中文文本到事务数据的转换[J]. 计算机科学, 2005, 32(5): 167-169. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2005/V32/I5/167
Cited