计算机科学 ›› 2002, Vol. 29 ›› Issue (1): 118-121.

• 计算机网络与信息安全 • 上一篇    下一篇

一种检测多语言文本相似重复记录的综合方法

俞荣华 田增平 周傲英   

  1. 复旦大学计算机系上海200433
  • 出版日期:2018-11-17 发布日期:2018-11-17

  • Online:2018-11-17 Published:2018-11-17

摘要: Detecting approximate duplicate records in database is a key problem related to data quality.In this paper,we present a synthetical approach for recognizing clusters of approximately duplicate records of multi-language data.The key ideas are:(1) an effici

关键词: 数据仓库 数据挖掘 数据库 信息重复 多语言文本相似重复记录方法 检测

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!