基于索引数组和复合频繁模式树的频繁闭项集挖掘算法

计算机科学 ›› 2007, Vol. 34 ›› Issue (8): 165-167.

• 软件工程与数据库技术 • 上一篇下一篇

基于索引数组和复合频繁模式树的频繁闭项集挖掘算法

出版日期:2018-11-16 发布日期:2018-11-16
基金资助:
国家科技成果重点推广项目计划（2003EC000001）资助.

Online:2018-11-16 Published:2018-11-16

摘要/Abstract

摘要： 频繁闭项集惟一确定频繁项集且规模小得多.CROP是一种基于复合频繁模式树的、频繁闭项集高效挖掘算法,但存在着候选结点过多的问题.这些非闭合结点的生成、检查和剪裁带来了大量不必要的操作.提出了一种改进的频繁闭项集挖掘算法CROP_Index.该算法用＂索引数组＂来组织数据,找到频繁共同出现的项集.基于二进制位图,给出了一个包含索引的计算方法,并利用索引启发信息合并,得到复合型频繁模式树的初始结点;同时给出一些新的性质,使得改进的算法只生成闭合结点,从而节省了大量不必要的操作,缩小了搜索空间.实验结果表明该算

关键词: 数据挖掘关联规则频繁闭项集索引数组复合频繁模式树

Abstract: The set of frequent closed itemsets determines exactly the complete set of all frequent itemsets and is usually much smaller than the latter. Based on compound frequent itemset tree （CFIST）, CROP is an efficient algorithm for mining frequent closed itemse

Key words: Data mining, Association rule, Frequent closed itemset, Index array, Compound frequent itemset tree

. 基于索引数组和复合频繁模式树的频繁闭项集挖掘算法[J]. 计算机科学, 2007, 34(8): 165-167. https://doi.org/