支持度:就是一个元组在整个数据库中出现的概率。如上面的例子中
可信度:它是针对规则而言的。对于一般的规则,它的可信度 数据挖掘研究院
提高率(或者叫兴趣度):对于上面的一个规则,我们可以发现,当我们从从数据库中直接取
S(A)=0.45。=p(condition and result)/p(condition)。例如有如下规则:If B and C then A。则它的可信度是:p(B and C and A)/p(B and C)=5%/15%=0.33。A的时候,概率是45%;可在我们的规则中,取到A的概率却只有33.3%。显然,这种情况是我们不愿意见到的,我们应该略去这样的一些规则。所以我们引入了兴趣度的概念,具体的公式如下:兴趣度=p(condition and result)/p(condition)*p(result)。当兴趣度大于1的时候,这条规则就是比较好的;当兴趣度小于1
