RSS
热门关键字:  数据挖掘  人工智能  数据仓库  搜索引擎  数据挖掘导论

关联规则的自动综合评价方法

来源: 作者:互联网作品 时间:2007-02-07 点击:

这两种情况下的算术平均值可以用来作为衡量规则潜在有用性的度量指标,计为USI,其取值于0~1之间,最重要的或最感兴趣的值为1,不重要或不感兴趣的值为0。
2.3 简洁度
简洁度(记为CN)是用来衡量关联规则的最终可理解程度的指标。它也表现在两个方面:一方面表现在规则的个数上,如果规则项数很多将不利于对这条规则的理解。因此,规则的项数越少,规则的简洁性越好。另一方面表现在规则所包含的抽象层次上,规则包含的抽象层次越高,它对应的解释力越强。
3 综合评价指标
由上述两个层次的评价可看出,客观评价指标有三个:支持度s、可信度c和相关强度corrR,支持度和可信度的取值在0~1之间;主观评价指标有三个:新颖度Wi、用户感兴趣度USI和简洁度CN。规则的综合评价指标(记为RI)应该是主客观评价指标的有机结合,可以将其定义为上述几个评价指标的几何加权平均:
     
(6)
 
其中需要解决的重要问题是各个评价指标的权值的确定,而这与应用的领域是密切相关的,同时与最终用户也有很大的关系。如果应用的领域是科学领域,那么对有效性要求就比较高,因此,赋予有效性度量标准的权值较大,而其他的较小;如果在商业领域,则注重时效性和有用性,所以对简洁性和有用性的度量标准所赋予的权值较大。确定权值的具体方法可根据模糊数学等提供的方法来计算。
4 实例分析
航空维修差错经常导致飞行事故。我们收集了某型飞机航空维修差错数据2300条,属性大类分为管理状态、机务人员状态、维修环境、机务人员活动四类。现就维修人员状态的身心状态、机组协作状态、预先准备状态三个属性,对它们进行语言值的处理后,利用Apriori算法[4]进行挖掘,得到部分规则置于知识库中,然后再利用综合评价算法,在USI=1的情况下,对其他规则进行评价,结果以规则兴趣度的大小顺序显示(如表1)。从航空维修人为因素故障分析系统结论可知,结果是有效的。
表1 综合评价结果(以规则兴趣度表示)
序号
条件1
条件2
结果
支持度
可信度
规则兴趣度
1
预先准备 充分
机组协作 好
故障 很少
0.33
0.72
7.53
2
身心状态 不好
机组协作 不好
机务问题 多
0.22
0.88
6.32
3
预先准备 充分
身心状态 好
机务问题 很少
0.27
0.92
4.37
4
预先准备 不充分
身心状态 好
机务问题 较少
0.25
0.78
3.46
5
身心状态 不好
机组协作 好
故障 少
0.36
0.84
2.49
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?
热点关注
相关文章