RSS
热门关键字:  数据挖掘  数据仓库  商业智能  人工智能  搜索引擎

数据挖掘-支持度

来源: 作者: 时间:2007-09-23 点击:
定义1:设关联规则ab在事务集中成立,把d中包含a∪b的事务占整个数据集d的百分比,即概率p(t(a∪b))称为支持度,记为s 
 
定义2:表达某一特定关联出现的频率在关联规则中称为支持度.当情况一出现时,发生情况二的概率在关联规则中称为可信度
 
 
定义3:我们对支持度-文档集在整个文档集中出现的频度,作如下的定义:定义3支持度设D是文档的集合,任意XD,其支持度定义为:s(X)=1‖X‖∑ni=1∑‖X‖j=1αij(4)其中,.‖X‖是X中文档的个数.该定义将X的支持度定义为X中文档与主题关联的平均值为此,我们对支持度-文档集在整个文档集中出现的频度,作如下的定义:定义3支持度设D是文档的集合,任意XD,其支持度定义为:s(X)=1‖X‖∑ni=1∑‖X‖j=1αij(4)其中,.‖X‖是X中文档的个数.该定义将X的支持度定义为X中文档与主题关联的平均值
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?