3-强连通划分
利用强连通构件的方法,对矩阵进行划分
相似度矩阵是稀疏的
稀疏矩阵的强连通构件是密集的
密集对象之间存在较高的相似度,可以归为一类 数据挖掘交友
文档相似度具有一定的传递型
数据挖掘交友
数据挖掘论坛
文本相似度矩阵的稀疏特性过于显著,使得强连通聚类结果簇的粒度太小,因此,需要进行多次迭代的层次聚类 数据挖掘论坛
提取结果簇的特征向量,定义如下:
数据挖掘论坛
对上次聚类结果的簇进行计算,提取簇的特征信息
选择满足特定条件的结果簇,进行下一次迭代的聚类
重复进行1和2两步操作,直到满足指定结束条件为止。
经过多次的迭代操作,最终结果将形成一个层次聚类结果 数据挖掘研究院
数据挖掘工具
数据挖掘研究院
资料全文下载 数据挖掘实验室