引言
随着Internet网的普及,用户访问Web的规律,成了In2 ternet环境下各企业共同关注的一大热点" Web日志挖掘作为Web挖掘的一个重要组成部分,包含 了大量的用户访问信息,对之进行分析,从中挖掘出用户的行 为模式,有其独特的理论和实践意义" Web日志挖掘的方法主要有三种:聚类分析,关联分析, 序列分析"它们也是传统数据挖掘的主要方法"我们对用户行 为采用的是聚类分析,即在没有先验知识的情况下,把用户会 话划入到多个簇中,使簇内的相似性和簇间的相异性最大" 由于Web日志数据量大,且用户上网可能出于不同目的, 所以在抽取用户行为模式上有着多种解决方案,如果想找出一 个最优方案的话那么使用遗传算法可以达到更快更好的效 果[1]"最近,Nasraoui和Krishnapuram[2]提出了专门针对于 聚类操作的改进的遗传算法:小环境无监督聚类算法(UNC), 该算法重在挖掘类的特征与其基因的合作关系,适合挖掘具有 噪音和不完整数据的大量数据集"然而,UNC是基于欧几里 德空间的二维模型,数据表示不直观,因此我们对UNC进行 改进,提出了具有层次结构的UNC(L-UNC)"它不同于传 统的数据平面表示,使数据表示更为直观"由于我们解决方案 并没有确定类的数量和分类原型,所以它除了针对数据挖掘和 Web挖掘外,还能适合各种应用" 数据挖掘论坛
............. 数据挖掘交友
more detail.... 数据挖掘研究院