一种检测多语言文本相似重复记录的综合方法

计算机科学 ›› 2002, Vol. 29 ›› Issue (1): 118-121.

• 计算机网络与信息安全 • 上一篇下一篇

一种检测多语言文本相似重复记录的综合方法

俞荣华田增平周傲英

复旦大学计算机系上海200433

出版日期:2018-11-17 发布日期:2018-11-17

Online:2018-11-17 Published:2018-11-17

摘要/Abstract

摘要： Detecting approximate duplicate records in database is a key problem related to data quality.In this paper,we present a synthetical approach for recognizing clusters of approximately duplicate records of multi-language data.The key ideas are:(1) an effici

俞荣华田增平周傲英. 一种检测多语言文本相似重复记录的综合方法[J]. 计算机科学, 2002, 29(1): 118-121. https://doi.org/

参考文献

Metrics

Viewed

Full text

Abstract

Cited

Shared

Discussed

一种检测多语言文本相似重复记录的综合方法

PDF (PC)

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

Metrics

本文评价

推荐阅读 0