RSS
热门关键字:  数据挖掘  人工智能  数据仓库  搜索引擎  数据挖掘导论

本科毕业论文中关联规则挖掘的简介

来源: 作者:互联网作品 时间:2007-02-07 点击:

[12,13]。通过遍历一大堆事务数据中,从一个一个的单个项开始记数,每次遍历完所有的事务后,裁减掉支持度记数少于用户给定的支持度的项,然后逐步扩展到多项事务。最后保留下来的频繁项集,通过子集产生法来产生关联规则,然后去掉其中置信度低于用户指定的最低置信度的关联规则,最后剩下的就是满足用户需要的关联规则。
Apriori算法的特点就是在于从单项开始,每次剪裁一点,利用Apriori性质[13],有效避免了对很多不可能的项的搜索过程。
2.1 Apriori性质
    Apriori性质:频繁项集的所有非空子集都必须也是频繁的。如果项集I不满足最小支持度阈值s,则I不是频繁的,即P(I) < s。如果项A添加到I,则结果项集(I ∪ A)不可能比I更频繁出现。因此,(I,A)也不是频繁的,即P(I ∪ A) < s
    Apriori性质主要是用于搜索频繁项集的时候对候选式的筛选过程。Apriori算法中利用Apriori性质,能够比较好地避免盲目的搜索,提高频繁项集的查找效率。
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?