《Lucene2.1的新变化》的相关内容
相关讨论
Lucene2.1的新变化
1.9 到 2.0 的改动不是很多,主要是废弃了一些 API , 2.0 起了一个过渡的作用。 2.1 是在 2.0 基础上做了很多的改进,提升了性能,修复了一些 Bug 等。 Lucene2.1 在索引的格式上做了一些改进,所以旧版本的 Lucene 是无法访问 2.1 版的索引文件。但是 2.1 版本的可以读写旧版本的索引文件。保持向下的兼容性。这点需要我们在使用时注意。 下面简单的列出一些新 ...
by grantbb 2007-03-22 浏览 (3392) 回复 (7) 关键字:
Lucene-2.0学习文档(1)
[原创]Lucene-2.0学习文档
作者:Javafish(likunkun)
Email:javafish@sunxin.org
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。
其功能非常的强大,api也很简单。总得来说用Lucene来进行建立
和搜索和操作数据库是差不多的(有点像),Document可以看作是
数据库的一行记 ...
by likunkun 2006-12-21 浏览 (13133) 回复 (14) 关键字: lucene
搜索篇:lucene的简单实例<一>
说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别.
其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来...
1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三 ...
by lighter 2006-12-19 浏览 (15000) 回复 (29) 关键字: lucene
Lucene-2.0学习文档(3)
接http://www.javaeye.com/post/190335
到现在我们已经可以用lucene建立索引了
下面介绍一下几个功能来完善一下:
1.索引格式
其实索引目录有两种格式,一种是除配置文件外,每一个Document独立成为一个文件(这种搜索起来会影响速度)。另一种是全部的Document成一个文件,这样属于复合模式就快了。
2.索引文件可放的位置:
索引可以存放在两个地 ...
by likunkun 2006-12-21 浏览 (6238) 回复 (0) 关键字: lucene
初次使用lucene2.0的心得和疑问
这几天一直在看有关lucene的资料,在网上查了下,发现好多文章都是重复的,也有将的不错的文章,但大多例子都是基于lucene1.4.3的。本人刚接触lucene,在此一点小小的心得和疑问。请看下面:
lucene的基本特性可以参考:
初识lucene
Lucene基本使用介绍
网上大家对中文分词插件IK_CAnalyzer的评价不错,目前IK_CAnalyzer的最新版本是1.4,是在lucen ...
by stephen722 2007-07-11 浏览 (2349) 回复 (7) 关键字:
相关博客
Lucene2.1的新变化
1.9 到 2.0 的改动不是很多,主要是废弃了一些 API , 2.0 起了一个过渡的作用。 2.1 是在 2.0 基础上做了很多的改进,提升了性能,修复了一些 Bug 等。 Lucene2.1 在索引的格式上做了一些改进,所以旧版本的 Lucene 是无法访问 2.1 版的索引文件。但是 2.1 版本的可以读写旧版本的索引文件。保持向下的兼容性。这点需要我们在使用时注意。 下面简单的列出一些新 ...
by grantbb 2007-03-22 浏览 (4917) 回复 (7) 关键字:
lucene2.0学习文档
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索与操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接数据库一样简单。
值得一提的是:2006年6月1号Lucene2.0发布,它与以前广泛应用和 ...
by oudoud 2008-07-03 浏览 (95) 回复 (0) 关键字:
Lucene2.0
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索与操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接数据库一样简单。
值得一提的是:2006年 ...
by liheqian_0083 2007-05-21 浏览 (60) 回复 (0) 关键字:
Lucene-2.0学习文档
Lucene-2.0学习文档
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索和操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接数据库一样简单。
值得一提的是:2006年6月1号Lucene2.0 ...
by lihaiyan 2007-09-27 浏览 (299) 回复 (1) 关键字:
相关圈子讨论
有关lucene 索引pdf格式文档的问题
环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2
//索引文档LuceneInActionCH.pdf
File indexDir = new File("C:\\index"); // 索引文件存放路径
File dataDir = new File("C:\\file"); // 文件所存路径
Analyzer analyzer ...
by xxwang1984 2008-07-11 浏览 (336) 回复 (13)
多线程建立索引要如何设计?
多线程建立索引要如何设计?
请各位给我些意见。
要注意到哪些问题?
我要在线程里为txt文件或者数据库的某个表的数据建立索引,建立过索引的文件我想在下一次建立时这个文件就不要再重新建立,然后再合并了。而是只为新的文件建索引,然后跟旧的segment合并。
by harryKuo 2007-10-08 浏览 (748) 回复 (8)
关于lucene的分词和查询
我想问下,如果我把一个中文字符传在索引的时候进行了分词,查询的时候也使用同一个分词器.
如何让查询按照最大匹配度去进行?
比如索引里的字符传是"问题说明越详细",分词分成了"问题","说明","越","详细".
我用"如果问题说明越详细,回答也会越准确!"去查询,希望能查询到这个结果,需要怎么做?
刚接触lucene,还很不熟悉.
by shadowlin 2008-05-26 浏览 (1193) 回复 (18)
google search
这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文 本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000 ‘000个网页。我们可以从 http://google.stanford.edu/ 下载。
设 计搜索引擎 ...
by dogstar 2008-05-29 浏览 (441) 回复 (0)
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (306) 回复 (2)
相关新闻
Ruby on Rails 2.0的新功能介绍
万众瞩目的Ruby on Rails 2.0已经发布了,Rails框架在2004年诞生以来,一直保持着相当快的版本升级速度:2005年发布了Rails1.0版本,2006年初发布Rails1.1版本,2007年初发布Rails1.2版本,而还没有等到2008年,在2007年圣诞前夕的12月6日,Rails2.0已经发布。
Rails框架每个大的版本升级都给我们带来了相当多的新功能,新惊喜。Rai ...
by robbin 2007-12-10 浏览 (3546) 回复 (4) 关键字: rails
我恨Django的5个理由和我爱Django的5个理由
我恨Django的5个理由
虽然我喜欢Django,但是无论如何它也有瑕疵的,让我先把"丑话"说在前面吧.
Ajax很难和Django一起用
大部分的Django社区都认为把Javascript helpers和python framework放到一起并不是个很好的主意。虽然我理解Javascrip是基本知识,人人都懂得一些,但是我仍然不赞同这个主意。SQL和Javascript一样也是基本知 ...
by levis2000 2008-04-22 浏览 (2406) 回复 (11) 关键字: django python
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1598) 回复 (7) 关键字: spindle

