计算机科学 ›› 2005, Vol. 32 ›› Issue (9): 160-163.

• 计算机网络与信息安全 • 上一篇    下一篇

基于余弦相似度的文本空间索引方法研究

  

  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    中国博士后科学基金资助(20040236463).

  • Online:2018-11-17 Published:2018-11-17

摘要: 基于相似度的数据空间索引在数据挖掘及数据可视化等方面有着重要的应用.本文以新闻的标题为研究对象,提出了以CrossAVL为基础的文本对象层次式聚类方法以及文本信息空间索引算法FastMap-MDS,有效地保持了文本对象间的相似信息.实验表明,该方法具有较高的效率和精度.

关键词: 余弦相似度 数据空间 索引方法 数据挖掘 数据可视化 数据库

Abstract: Spatial index for data based on similarity can be employed by applications on data mining and data visualization widely. To build spatial index of news title, this paper implements hierarchical cluster algorithm for news titles with CrossAVL as data struc

Key words: Similarity, Spatial index, Hierarchical cluster

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!