计算机科学 ›› 2004, Vol. 31 ›› Issue (6): 64-67.

• 计算机网络与信息安全 • 上一篇    下一篇

适于Internet新闻文本实时分类的动态向量空间模型DVSM

张晓辉 李莹 常桂然 赵宏   

  1. 东北大学软件中心,沈阳110004
  • 出版日期:2018-11-17 发布日期:2018-11-17

  • Online:2018-11-17 Published:2018-11-17

摘要: 传统向量空间模型(VSM)特征间无关联,且不能动态增量训练,不适合主题和焦点实时变化的Internet新闻信息,为此提出了一种改进的文本实时分类模型——动态向量空间模型(DVSM)。通过对VSM的特征提取策略进行改进,提出了特征聚合和增量训练算法。通过将对分类有相同贡献的文本特征词聚合,使用它们共同的分类贡献向量特征模式作为文本特征向量的基本维;采用增量动态训练改变对分类贡献已改变的特征词在文本向量的特征模式中的位置,适应Internet新闻信息的实时特性。使用静态训练集和动态训练集进行的DVSM与传统V

关键词: 动态向量空间模型 特征聚合 增量动态训练 Internet新闻分类 DVSM 分类贡献向量特征模式

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!