翻新时间:2023-08-07
有效的不确定数据概率频繁项集挖掘算法
摘要:针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFPGrowth)算法。该算法通过逐条读取不确定事务数据库中数据,构造类似频繁模式树(FPTree)的紧凑树结构,同时更新项头表中保存所有尾节点相同项集的期望值的动态数组。当所有事务数据插入到改进的不确定数据频繁模式树(PUFPTree)中以后,通过遍历数组得到所有的概率频繁项集。最后通过实验结果和理论分析表明:PUFPGrowth算法可以有效地发现概率频繁项集;与不确定数据频繁模式增长(UFGrowth)算法和压缩的不确定频繁模式挖掘(CUFPMine)算法相比,提出的PUFPGrowth算法能够提高不确定数据概率频繁项集挖掘的效率,并且减少了内存空间的使用。
关键词:数据挖掘;不确定数据;可能世界模型;概率频繁项集;频繁模式
中图分类号: TP301.6 文献标志码:A
英文摘要
Abstract:When using the way of pattern growth to construct tree structure, the exiting algorithms for mining probabilistic frequent itemsets suffer many problems, such as generating large number of tree nodes, occupying large memory space and having low efficiency. In order to solve these problems, a Progressive Uncertain Frequent Pattern Growth algorithm named PUFPGrowth was proposed. By the way of reading data in the uncertain database tuple by tuple, the proposed algorithm constructed tree structure as compact as Frequent Pattern Tree (FPTree) and updated dynamic array of expected value whose header table saved the same itemsets. When all transactions were inserted into the Progressive Uncertain Frequent Pattern tree (PUFPTree), all the probabilistic frequent itemsets could be mined by traversing the dynamic array. The experimental results and theoretical analysis show that PUFPGrowth algorithm can find the probabilistic frequent itemsets effectively. Compared with the Uncertain Frequent pattern Growth (UFGrowth) algorithm and Compressed Uncertain FrequentPattern Mine (CUFPMine) algorithm, the proposed PUFPGrowth algorithm can improve mining efficiency of probabilistic frequent itemsets on uncertain dataset and reduce memory usage to a certain degree.
英文关键词
Key words:data mining; uncertain data; possible world model; probabilistic frequent itemset; frequent pattern
0 引言
[9]CHUI CK, KAO B, HUNG E. Mining frequent itemsets from uncertain data [C]// PAKDD 2007: Proceedings of the 11th Pacific-
Asia conference on Advances in Knowledge Discovery and Data Mining, LNCS 4426. Berlin: Springer, 2007: 47-58.
下载文档
网友最新关注
- 秋天来了
- 大树
- 我的爸爸
- 树叶
- 小尾巴
- 我的同桌
- 小河里的水
- 属相
- 小兔运南瓜
- 论本领
- 我
- 喜欢
- 阳光妈妈
- 可爱的小白兔
- 我的爷爷
- 职业经理人是职业领导者吗?-企业管理论文(1)论文
- 员工激励-人力资源管理论文(1)论文
- 沃尔-玛特的理念定位-企业管理论文论文
- 试谈办事的学问-企业管理论文(1)论文
- 企业人才的留与流-人力资源管理论文(1)论文
- 职业经理人的素质及其素质的培养-企业管理论文(1)论文
- 中国企业战略实施存在的问题-企业战略论文(1)论文
- 以质量创造品牌-市场营销管理论文(1)论文
- 中小企业最佳融资决策-企业战略论文(1)论文
- 试析秘书科学在我国产生的社会动因-企业管理论文(1)论文
- 中、西职业经理人的差异-企业管理论文(1)论文
- 职业经理的道德观-企业管理论文(1)论文
- 职业生涯:如何成为不可缺少的人?职业指导论文(1)论文
- 定制营销-21世纪的营销手段-市场营销管理论文论文
- Murry Dalziel谈杰出CEO的素质-企业管理论文(1)论文
- 《永生的眼睛》教学设计三
- 《永生的眼睛》教学设计二
- 《永生的眼睛》美文欣赏 父亲的眼睛
- 《永生的眼睛》趣闻故事
- 《永生的眼睛》考点练兵 阅读篇
- 《永生的眼睛》训练素材
- 《永生的眼睛》范文习作
- 《永生的眼睛》作家作品及写作背景
- 《永生的眼睛》教学设计四
- 《永生的眼睛》写作指导
- 《永生的眼睛》考点练兵 积累篇
- 《花的勇气》趣闻故事
- 《永生的眼睛》美文欣赏 别用眼睛伤害他
- 《花的勇气》随堂练习 巩固篇
- 《永生的眼睛》重点字词梳理