RSS
热门关键字:  数据挖掘  数据仓库  商业智能  人工智能  搜索引擎

有关CHI-SQUARE的问题

来源: 作者:互联网作品 时间:2007-03-26 点击:
各位老师,大家好。
 
我在学习《数据挖掘,概念与技术》。
 
其中的92页(第二版,英文版)提到:
用CHI-SQUARE方法进行对连续属性的离散化处理的时候,对相邻间隔中CHI-SQUARE值最小的间隔进行合并,因为CHI-SQUARE值最小,意味着这两个间隔具有相似的类分布(class distribution).
 
同时,在68页提到了用CHI-SQUARE衡量两个特征之间的相关性。
在进行特征筛选时,CHI-SQUARE方法是一种优秀的特征筛选方法。两个特征的CHI-SQUARE值越大,说明这两个特征的相关性越强。
 
以上的两种说法之间是否存在矛盾呢,如何理解?
 
 
Thank you very much.
 
MOKURAM
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?