Lucene搜索优化技巧 - 索引篇》的相关内容

lucene in action笔记之一索引

执行最简单索引过程需要的几个类:IndexWriter、Directory、Analyzer、Document、Field。简单例子如下所示:public static int index(File indexDir, File dataDir) throws IOException { if (!dataDir.exists() || !dataDir.isDirecto ...
by hank 2008-03-10 浏览 (989) 回复 (3) 关键字: lucene

初次使用lucene2.0的心得和疑问

这几天一直在看有关lucene的资料,在网上查了下,发现好多文章都是重复的,也有将的不错的文章,但大多例子都是基于lucene1.4.3的。本人刚接触lucene,在此一点小小的心得和疑问。请看下面: lucene的基本特性可以参考: 初识lucene Lucene基本使用介绍 网上大家对中文分词插件IK_CAnalyzer的评价不错,目前IK_CAnalyzer的最新版本是1.4,是在lucen ...
by stephen722 2007-07-11 浏览 (2407) 回复 (7) 关键字:

Lucene-2.0学习文档(1)

  [原创]Lucene-2.0学习文档 作者:Javafish(likunkun) Email:javafish@sunxin.org Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记 ...
by likunkun 2006-12-21 浏览 (13379) 回复 (14) 关键字: lucene

T级数据下 lucene 性能 还好吗?

本人无能,1T数据下lucene的索引程序就做了8天。。还在继续。    无奈只好请教各位,有谁在1T数据下做过lucene索引程序,8天正常吗?   有点语无伦次了,说一下具体情况吧 ------------------------------------------------------------------------------   服务器 ...
by aihua 2008-06-03 浏览 (10504) 回复 (41) 关键字: lucene

lucene造成磁盘空间不足的问题

我用lucene做了一个Search Engine 程序运行也很正常,但如果连续运行几个月,有时会出现磁盘空间不足的情况 检查发现,index目录占用了数10G空间。 我的lucene程序里有delete超时的index的 后来我写了一个删除程序,用来delete无用的index public boolean shrink(String path, String time) { int ...
by fool_leave 2007-08-01 浏览 (5191) 回复 (27) 关键字: lucene

Lucene 基础指南

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 * Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 * Field:Document中的一个字段,相当于数据库中的Col ...
by wind_bell 2007-09-21 浏览 (288) 回复 (0) 关键字:

Lucene 基础指南

Lucene 基础指南 作者:lighter, 江南白衣     Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须 ...
by fly.net.cn 2007-05-07 浏览 (465) 回复 (0) 关键字:

Lucene入门

Lucene 基础指南 作者:lighter, 江南白衣     Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须 ...
by yizhang88 2007-07-05 浏览 (293) 回复 (0) 关键字:

Lucene 基础指南

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 Field:Document中的一个字段,相当于数据库中的Column ...
by yinhj 2007-11-10 浏览 (233) 回复 (0) 关键字:

【转】Lucene使用与优化

我认为这篇文章作为入门,对Lucene的总结比较好: 1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底, ...
by grantbb 2008-04-17 浏览 (1295) 回复 (0) 关键字:

T级数据下 lucene 性能 还好吗?

本人无能,1T数据下lucene的索引程序就做了8天。。还在继续。 无奈只好请教各位,有谁在1T数据下做过lucene索引程序,8天正常吗? 有点语无伦次了,说一下具体情况吧 ------------------------------------------------------------------------------ 服务器 win2003 cpu 8个,内存 8g 硬盘 ...
by aihua 2008-06-03 浏览 (569) 回复 (7)

有关lucene 索引pdf格式文档的问题

环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2 //索引文档LuceneInActionCH.pdf File indexDir = new File("C:\\index"); // 索引文件存放路径 File dataDir = new File("C:\\file"); // 文件所存路径 Analyzer analyzer ...
by xxwang1984 2008-07-11 浏览 (492) 回复 (13)

一个lucene的问题,请帮忙

由于工作需要,要用lucene进行开发,本人写了一个方法对lucene的index进行定时追加.该程序在main方法运行,没有任何问题.我用spring提供的定时器写了一个应用,定时运行该程序.问题出现了,发现每次运行完该程序时候,系统性能就会变得很差,甚至会出现OUT MEM.程序大概如下: try { writer = new IndexWriter("f:\\index",new IK_ ...
by sahero 2008-08-26 浏览 (162) 回复 (6)

lucene建立索引的错误,各位帮忙看看

前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看 //开始建立索引  int j = 0; while (j < 10) { gs.setStartResul ...
by jaie 2008-04-06 浏览 (372) 回复 (4)

多线程建立索引要如何设计?

多线程建立索引要如何设计? 请各位给我些意见。 要注意到哪些问题? 我要在线程里为txt文件或者数据库的某个表的数据建立索引,建立过索引的文件我想在下一次建立时这个文件就不要再重新建立,然后再合并了。而是只为新的文件建索引,然后跟旧的segment合并。
by harryKuo 2007-10-08 浏览 (807) 回复 (8)

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)    以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

基于JavaScript的代码自动生成工具

JavaScript Based Code Generator - codegen 工具主页http://sourceforge.net/projects/jbcgen/目的快速生成程序代码, 比如Struts, Spring, Jdbc/Hibernate所有前后台的代码.简单介绍本工具生成代码的思想是读取数据库中表的结构, 使用JavaScript作为脚本语言编写模板, 生成各种代码或者文件, ...
by jejwe 2008-03-06 浏览 (3651) 回复 (2) 关键字:

相关问答

赞助商链接