yale, orange, 还有个专名文本聚类的工具,翻翻前面的帖子 数据仓库
这个要数CMU的Bow(libbow)了。http://www.cs.cmu.edu/~mccallum/bow/ 搜索引擎