《Lucene搜索优化技巧 - 索引篇》的相关内容
相关讨论
lucene in action笔记之一索引
执行最简单索引过程需要的几个类:IndexWriter、Directory、Analyzer、Document、Field。简单例子如下所示:public static int index(File indexDir, File dataDir)
throws IOException {
if (!dataDir.exists() || !dataDir.isDirecto ...
by hank 2008-03-10 浏览 (989) 回复 (3) 关键字: lucene
初次使用lucene2.0的心得和疑问
这几天一直在看有关lucene的资料,在网上查了下,发现好多文章都是重复的,也有将的不错的文章,但大多例子都是基于lucene1.4.3的。本人刚接触lucene,在此一点小小的心得和疑问。请看下面:
lucene的基本特性可以参考:
初识lucene
Lucene基本使用介绍
网上大家对中文分词插件IK_CAnalyzer的评价不错,目前IK_CAnalyzer的最新版本是1.4,是在lucen ...
by stephen722 2007-07-11 浏览 (2407) 回复 (7) 关键字:
Lucene-2.0学习文档(1)
[原创]Lucene-2.0学习文档
作者:Javafish(likunkun)
Email:javafish@sunxin.org
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。
其功能非常的强大,api也很简单。总得来说用Lucene来进行建立
和搜索和操作数据库是差不多的(有点像),Document可以看作是
数据库的一行记 ...
by likunkun 2006-12-21 浏览 (13379) 回复 (14) 关键字: lucene
T级数据下 lucene 性能 还好吗?
本人无能,1T数据下lucene的索引程序就做了8天。。还在继续。
无奈只好请教各位,有谁在1T数据下做过lucene索引程序,8天正常吗?
有点语无伦次了,说一下具体情况吧
------------------------------------------------------------------------------
服务器 ...
by aihua 2008-06-03 浏览 (10504) 回复 (41) 关键字: lucene
lucene造成磁盘空间不足的问题
我用lucene做了一个Search Engine
程序运行也很正常,但如果连续运行几个月,有时会出现磁盘空间不足的情况
检查发现,index目录占用了数10G空间。
我的lucene程序里有delete超时的index的
后来我写了一个删除程序,用来delete无用的index
public boolean shrink(String path, String time) {
int ...
by fool_leave 2007-08-01 浏览 (5191) 回复 (27) 关键字: lucene
相关博客
Lucene 基础指南
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
* Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。
* Field:Document中的一个字段,相当于数据库中的Col ...
by wind_bell 2007-09-21 浏览 (288) 回复 (0) 关键字:
Lucene 基础指南
Lucene 基础指南
作者:lighter, 江南白衣
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须 ...
by fly.net.cn 2007-05-07 浏览 (465) 回复 (0) 关键字:
Lucene 基础指南
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。
Field:Document中的一个字段,相当于数据库中的Column ...
by yinhj 2007-11-10 浏览 (233) 回复 (0) 关键字:
【转】Lucene使用与优化
我认为这篇文章作为入门,对Lucene的总结比较好:
1 lucene简介
1.1 什么是lucene
Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。
1.2 lucene能做什么
要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底, ...
by grantbb 2008-04-17 浏览 (1295) 回复 (0) 关键字:
相关圈子讨论
T级数据下 lucene 性能 还好吗?
本人无能,1T数据下lucene的索引程序就做了8天。。还在继续。
无奈只好请教各位,有谁在1T数据下做过lucene索引程序,8天正常吗?
有点语无伦次了,说一下具体情况吧
------------------------------------------------------------------------------
服务器 win2003
cpu 8个,内存 8g 硬盘 ...
by aihua 2008-06-03 浏览 (569) 回复 (7)
有关lucene 索引pdf格式文档的问题
环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2
//索引文档LuceneInActionCH.pdf
File indexDir = new File("C:\\index"); // 索引文件存放路径
File dataDir = new File("C:\\file"); // 文件所存路径
Analyzer analyzer ...
by xxwang1984 2008-07-11 浏览 (492) 回复 (13)
一个lucene的问题,请帮忙
由于工作需要,要用lucene进行开发,本人写了一个方法对lucene的index进行定时追加.该程序在main方法运行,没有任何问题.我用spring提供的定时器写了一个应用,定时运行该程序.问题出现了,发现每次运行完该程序时候,系统性能就会变得很差,甚至会出现OUT MEM.程序大概如下:
try
{
writer = new IndexWriter("f:\\index",new IK_ ...
by sahero 2008-08-26 浏览 (162) 回复 (6)
lucene建立索引的错误,各位帮忙看看
前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看
//开始建立索引
int j = 0;
while (j < 10) {
gs.setStartResul ...
by jaie 2008-04-06 浏览 (372) 回复 (4)
多线程建立索引要如何设计?
多线程建立索引要如何设计?
请各位给我些意见。
要注意到哪些问题?
我要在线程里为txt文件或者数据库的某个表的数据建立索引,建立过索引的文件我想在下一次建立时这个文件就不要再重新建立,然后再合并了。而是只为新的文件建索引,然后跟旧的segment合并。
by harryKuo 2007-10-08 浏览 (807) 回复 (8)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle
基于JavaScript的代码自动生成工具
JavaScript Based Code Generator - codegen 工具主页http://sourceforge.net/projects/jbcgen/目的快速生成程序代码, 比如Struts, Spring, Jdbc/Hibernate所有前后台的代码.简单介绍本工具生成代码的思想是读取数据库中表的结构, 使用JavaScript作为脚本语言编写模板, 生成各种代码或者文件, ...
by jejwe 2008-03-06 浏览 (3651) 回复 (2) 关键字:

