《Lucene 索引文件结构分析》的相关内容
相关讨论
深入 Lucene 索引机制
Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。
在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住的是 ...
by oudoud 2008-07-03 浏览 (206) 回复 (2) 关键字:
lucene in action笔记之一索引
执行最简单索引过程需要的几个类:IndexWriter、Directory、Analyzer、Document、Field。简单例子如下所示:public static int index(File indexDir, File dataDir)
throws IOException {
if (!dataDir.exists() || !dataDir.isDirecto ...
by hank 2008-03-10 浏览 (989) 回复 (3) 关键字: lucene
T级数据下 lucene 性能 还好吗?
本人无能,1T数据下lucene的索引程序就做了8天。。还在继续。
无奈只好请教各位,有谁在1T数据下做过lucene索引程序,8天正常吗?
有点语无伦次了,说一下具体情况吧
------------------------------------------------------------------------------
服务器 ...
by aihua 2008-06-03 浏览 (10504) 回复 (41) 关键字: lucene
用Lucene做搜索碰到的问题,供大家思考讨论
1.更加实时的数据更新架构设计
我们的网站主要是视频节目的搜索,内容也都是来自用户。
我们提供的功能在搜索结果中,我们会显示播放次数等数据,这些数据的特点是更新非常频繁,
有什么好的方式能够让这种数据更加实时的更新。
还有就是内容都是来自用户,用户无时无刻都在上传节目,而且他们希望能够尽快从搜索中搜索到他们的节目。
问题也是设计怎么样的架构来更实时的索引。
2.索引数据量大的问题
虽然 ...
by grantbb 2007-05-24 浏览 (6906) 回复 (21) 关键字: lucene
相关博客
深入 Lucene 索引机制
Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。
在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住的是 ...
by ruvuoai 2008-07-14 浏览 (53) 回复 (0) 关键字: lucene学习儿童时期
[zz]深入lucene索引机制
developerWorks 中国 > Java technology | Open source >
深入 Lucene 索引机制 ...
by imjl 2007-02-21 浏览 (2916) 回复 (1) 关键字: lucene index
深入 Lucene 索引机制
Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。
在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住 ...
by wind_bell 2007-04-24 浏览 (383) 回复 (0) 关键字:
深入 Lucene 索引机制
Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。
在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucen ...
by captain 2006-08-01 浏览 (228) 回复 (0) 关键字:
[转]深入 Lucene 索引机制
Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。
在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文 ...
by longdick 2008-03-07 浏览 (87) 回复 (0) 关键字: java全文检索
相关圈子讨论
google search
这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文 本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000 ‘000个网页。我们可以从 http://google.stanford.edu/ 下载。
设 计搜索引擎 ...
by dogstar 2008-05-29 浏览 (581) 回复 (0)
google背后的分布式架构
Google背后的分布式计算架构策略
Google是与众不同的。它的独特不仅仅表现于革新的思维和充满创意的应用 (比如那个大堂里的地球模型),更在于其有别常规的IT策略……
加利福尼亚州山景城(Mountain View)Google公司(Google,下称Google)总部有一个43号大楼,该建筑的中央大屏幕上显示着一个与Google地球(Google Earth)相仿的世界地图,一个转动 ...
by dogstar 2008-05-29 浏览 (2052) 回复 (0)
Lucene的一种分布式检索方案的研究报告
这几天实现了个Lucene分布式检索的模块,采用的分布式方案是将数据分块,分别生成N个索引文件,放到N个节点上运行。检索时,对每一个节点发出查询请求,将N个节点返回的结果归并,然后生成一个新的结果。如果没看明白,可以看看我的帖子 http://www.javaeye.com/topic/212046 ,这个方案同帖子中的思想是一致的。
用这样的方案,遇到的问 ...
by chester60 2008-07-10 浏览 (598) 回复 (7)
T级数据下 lucene 性能 还好吗?
本人无能,1T数据下lucene的索引程序就做了8天。。还在继续。
无奈只好请教各位,有谁在1T数据下做过lucene索引程序,8天正常吗?
有点语无伦次了,说一下具体情况吧
------------------------------------------------------------------------------
服务器 win2003
cpu 8个,内存 8g 硬盘 ...
by aihua 2008-06-03 浏览 (569) 回复 (7)
大家用的LUCENE是什么版本? 哪个版本性能比较稳定?
还请各位告知.
我用的是LUCENE2.0, 但是JAVAEYE上一个朋友做的"庖丁解牛"中文分词组件不能在这个版本上使用, 我要升级.
我最怕的是更新索引时把索引损坏. 不知道各位有没有这样的经历? 说来听听.
对于LUCENE索引达到千万级时,索引更新效率和查找效率大幅度下降, 各位有什么样的优化策略呢? 特别是索引更新比较频繁时, 系统设计是个大麻烦.
还请有经验的朋友进来说说.
by shuyanbo 2007-11-15 浏览 (665) 回复 (2)
相关新闻
为什么说Lucene不好
引言
在Lingway公司,我们使用了Lucene至进今已有好几年时间。对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。
在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并 ...
by robertlyc 2008-03-22 浏览 (4541) 回复 (13) 关键字: lucene

