定义1:设关联规则ab在事务集中成立,把d中包含a∪b的事务占整个数据集d的百分比,即概率p(t(a∪b))称为支持度,记为s
定义2:表达某一特定关联出现的频率在关联规则中称为支持度.当情况一出现时,发生情况二的概率在关联规则中称为可信度
定义3:我们对支持度-文档集在整个文档集中出现的频度,作如下的定义:定义3支持度设D是文档的集合,任意XD,其支持度定义为:s(X)=1‖X‖∑ni=1∑‖X‖j=1αij(4)其中,.‖X‖是X中文档的个数.该定义将X的支持度定义为X中文档与主题关联的平均值为此,我们对支持度-文档集在整个文档集中出现的频度,作如下的定义:定义3支持度设D是文档的集合,任意XD,其支持度定义为:s(X)=1‖X‖∑ni=1∑‖X‖j=1αij(4)其中,.‖X‖是X中文档的个数.该定义将X的支持度定义为X中文档与主题关联的平均值

