计算机科学 ›› 2012, Vol. 39 ›› Issue (7): 161-164.
• 数据库与数据挖掘 • 上一篇 下一篇
李海峰,章宁,柴艳妹
出版日期:
发布日期:
Online:
Published:
摘要: 传统频繁项集挖掘技术无法高效获取不确定性数据中有价值的信息。通过研究频繁模式增长树的算法原 理,根据不确定性数据的特点提出了一种有效的不确定性数据预处理方法PCAFP-Growth。利用主成分分析的方法 进行数据的降维,并使用模糊关联分析法将数据概率进行分类,实现数据剪枝。在理论研究基础上,通过实验对数据 集进行了验证。结果表明,基于主成分分析法的剪枝策略在稠密数据集上能够有效提高运算速度,减少内存的使用。
关键词: 不确定性数据,频繁项集,主成分分析,模糊关联
Abstract: Traditional studies of frectuent itemset mining cannot obtain information from uncertain data efficiently. We studied the frequent pattern tree and proposed an effective uncertain data preconditioning method, the PCAFP-Growth, which can reduce the itemset dimensions with principal component analysis method,and prune data with fuzzy associa- lion analysis. Our experimental results over real world datasets show that our method is effective and efficient
Key words: Uncertain data, Frequent itemset, Principle component analysis, Fuzzy association
李海峰,章宁,柴艳妹. 不确定性数据上频繁项集挖掘的预处理方法[J]. 计算机科学, 2012, 39(7): 161-164. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2012/V39/I7/161
Cited