lucene/nutch
- Lucene倒排索引原理
- Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He on...
- 作者:发表于:2008-06-25 20:16:37 点击:77 评论:0 查阅全文...
- Lucene几种中文分词的总结
- 目前最新版本的lucene自身提供的StandardAnalyzer已经具备中文分词的功能,但是不一定能够满足大多数应用的需要。 另外网友谈的比较多的中文分词器还有: CJKAnalyzer ChineseAnalyzer IK_CAnalyzer(MIK_CAnalyzer...
- 作者:发表于:2008-06-25 20:16:10 点击:140 评论:0 查阅全文...
- Lucene 基础指南(Java版)
- 作者:lighter, 江南白衣 Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 * Documen...
- 作者:发表于:2008-06-25 20:13:54 点击:179 评论:0 查阅全文...
- Grails的全文检索插件
- Searchable Plugin The Searchable Plugin aims to provide rich search features to Grails applications with minimum effort, and still give you power and flexibility when you need it. It is built on the f...
- 作者:发表于:2008-06-25 20:12:46 点击:27 评论:0 查阅全文...
- J2EE Search的增删查改及检索初步实现
- 准备数据库:数据库采用mysql,表(book),为演示方便,字段只有2个(id,name) 准 备 包:Hibernate 3.2 Core Libraries Hibernate 3.2 Annotations Hibernate 3.2 Entity Manager Hibernate 3.2 Search Spring 2...
- 作者:发表于:2008-06-25 20:11:37 点击:50 评论:1 查阅全文...
- 全文检索引擎Lucene源码分析-analysis包
- 我的毕业设计是基于全文检索引擎工具包Luncene的analysis包而实现的,期间查看了该包的源码并作了一些分析,现在贴出来以供参考。 注:这里分析的只是analysis包的一些基本类,而不是全部。 1、Token类: packageorg.apache.lucene.analysis; publicfinalclassToken{ St...
- 作者:互联网作品发表于:2007-04-12 01:19:33 点击:240 评论:0 查阅全文...
- Lucene1.9搜索引擎改进特性列表
- Lucene1.9改进特性列表 1.9RC1 注:lucene2.0发布版本并不是100%的和1.4.3版兼容。也就是说在你用2.0版本的Lucene开发包替换原来的1.4.3版本时,应该让你的应用程序首先和1.9的兼容。 使用前提: 1.编译和使用Lucene需要Java1.4或以上版本。 Lucene1.9在运行时的变化:...
- 作者:互联网作品发表于:2007-04-12 01:19:07 点击:79 评论:0 查阅全文...
- 从Larbin看互联网爬虫设计
- 互联网是一个庞大的非结构化的数据库,将数据有效的检索并组织呈现出来有着巨大的应用前景,尤其是类似RSS的以XML为基础的结构化的数据越来越多,内容的组织方式越来越灵活,检索组织并呈现会有着越来越广泛的应用范围,同时在时效性和可读性上也会有越来越高的要求。这...
- 作者:互联网作品发表于:2007-04-12 01:18:32 点击:124 评论:0 查阅全文...
随机推荐

