各位老师,大家好。
我在学习《数据挖掘,概念与技术》。
其中的92页(第二版,英文版)提到:
用CHI-SQUARE方法进行对连续属性的离散化处理的时候 ,对相邻间隔中CHI-SQUARE值最小的间隔进行合并 ,因为CHI-SQUARE值最小,意味着这两个间隔具有相似的类 分布(class distribution).
同时,在68页提到了用CHI-SQUARE衡量两个特征之间的相 关性。
在进行特征筛选时,CHI-SQUARE方法是一种优秀的特征筛选 方法。两个特征的CHI-SQUARE值越大,说明这两个特征的相 关性越强。
以上的两种说法之间是否存在矛盾呢,如何理解?
Thank you very much.
MOKURAM

