《更新lucene到2.3 建立索引遇到的困扰》的相关内容
相关讨论
Lucene2.3性能提升
最近Lucene2.3发布,最大的变化是使用了新的索引算法,使用新的in-memory模型来大幅提升速度。中提到最简单的把lucene2.2的jar文件换成lucene2.3的jar文件就可以在某些测试中提速500%。Lucene2.3的changlog见http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_0/CHANGES.tx ...
by andyao 2008-01-27 浏览 (2019) 回复 (7) 关键字: lucene
Lucene应用的一点体会
Lucene应用(我用的是Lucene2.1.0,有些观点有可能也不太正确)
1.多线程索引,共享同一个IndexWriter对象
这种方式效率很慢,主要原因是因为:
java 代码
public void addDocument(Document doc, Analyzer analyzer)& ...
by ttitfly 2007-06-11 浏览 (3931) 回复 (5) 关键字: 多线程索引问题, 单线程
Lucene2.1的新变化
1.9 到 2.0 的改动不是很多,主要是废弃了一些 API , 2.0 起了一个过渡的作用。 2.1 是在 2.0 基础上做了很多的改进,提升了性能,修复了一些 Bug 等。 Lucene2.1 在索引的格式上做了一些改进,所以旧版本的 Lucene 是无法访问 2.1 版的索引文件。但是 2.1 版本的可以读写旧版本的索引文件。保持向下的兼容性。这点需要我们在使用时注意。 下面简单的列出一些新 ...
by grantbb 2007-03-22 浏览 (3438) 回复 (7) 关键字:
相关博客
Advanced Text Indexing with Lucene
Published on ONJava.com (http://www.onjava.com/) http://www.onjava.com/pub/a/onjava/2003/03/05/lucene.html See this if you're having trouble printing ...
by guooo 2007-11-12 浏览 (12) 回复 (0) 关键字:
相关圈子讨论
求助:用RamDirectory做缓存时遇到的问题!
我在用lucene做索引的时候,用RamDirectory先缓存100条数据之后一起存入FSDirectory,为什么只能存入10条数据呢?
我用LukeAll观察也只有10条数据,这是为什么呢?
一下是具体代码:
public class IndexDocs extends IndexBase{
private final Log logger = LogFactory.getLog(I ...
by baidongli 2008-05-05 浏览 (313) 回复 (0)
对于lucene实现的全文检索如何测试写索引的效率问题.
lucene实现的全文检索如何测试写索引的效率?对于这种测试问题,其思路是什么?
by stta04 2008-08-25 浏览 (171) 回复 (1)
关于Informix数据库CheckPoint的问题。欢迎大家指教
我现在的数据库服务器,在每天早上数据处理的时候。每次做checkpoint的时间都太长了,有时候甚至达到300s的长度。请大家能给点建议。
服务器为一HP小型机,4CPU,8G内存。OS为Linux系统。数据库为Informix10下面贴出我的onconfig内容
#****************************************************************** ...
by billbai 2008-07-02 浏览 (311) 回复 (2)
模糊搜索
如题,比如我索引的文字有两个document 1:爱的敬意 2:爱的致意 如果我想输入 爱的敬意 两条Document都能搜到,应该怎么做呢
by zhjt_88@163.com 2008-07-07 浏览 (187) 回复 (2)
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (373) 回复 (2)
相关新闻
Lucene2.3.2发布了
最新的Lucene2.3.2发布了,主要修改了一些创建和修改索引时候的Bug。
======================= Release 2.3.2 2008-05-05 =======================
Bug fixes
1. LUCENE-1191: On hitting OutOfMemoryError in any index-modifying
...
by grantbb 2008-05-09 浏览 (675) 回复 (0) 关键字:
Sun公司加快JDK的开发—JDK6u6以及JDK6u10Beta发布!
JDK6u6的内部版本号是1.6.0_06-b02,这次发布主要是修正了一些Bug。原文如下:
网址:http://java.sun.com/javase/6/webnotes/ReleaseNotes.html
Java SE 6u10Beta的发布则与众不同
官方发文写到:千万不要被它不起眼的名字(即Java SE 6u10Beta,JDK6更新10Beta版本)所愚弄,它是一个 ...
by jyw 2008-04-18 浏览 (1703) 回复 (1) 关键字: jdk
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

