Lucene:基于Java的全文检索引擎简介》的相关内容

搜索篇:lucene简单实例<二>

写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦. Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。 IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (13927) 回复 (15) 关键字: lucene

Lucene-2.0学习文档(1)

  [原创]Lucene-2.0学习文档 作者:Javafish(likunkun) Email:javafish@sunxin.org Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记 ...
by likunkun 2006-12-21 浏览 (13379) 回复 (14) 关键字: lucene

Lucene入门

  1.Lucene与数据库全文检索比较 Lucene 是 Apache Jakarta 的一个子项目,是一个全文检索的搜索引擎库.在接触Lucene之前,我了解不少数据库都实现了全文检索功能。所以我觉得很奇怪:为什么不用数据库提供的供全文检索功能呢?我找了不少资料,车东的一篇文章《Lucene:基于Java的全文检索引擎简介》阐述的比较详细。这里摘录了其中的一段文字: 由于数据库索 ...
by mfcai 2007-10-13 浏览 (673) 回复 (0) 关键字:

搜索篇:lucene的简单实例<一>

说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别. 其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来... 1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三 ...
by lighter 2006-12-19 浏览 (15387) 回复 (29) 关键字: lucene

初次使用lucene2.0的心得和疑问

这几天一直在看有关lucene的资料,在网上查了下,发现好多文章都是重复的,也有将的不错的文章,但大多例子都是基于lucene1.4.3的。本人刚接触lucene,在此一点小小的心得和疑问。请看下面: lucene的基本特性可以参考: 初识lucene Lucene基本使用介绍 网上大家对中文分词插件IK_CAnalyzer的评价不错,目前IK_CAnalyzer的最新版本是1.4,是在lucen ...
by stephen722 2007-07-11 浏览 (2407) 回复 (7) 关键字:

基于Java的全文索引引擎Lucene简介

基于Java的全文索引引擎Lucene简介 关键字:   基于Java的全文索引引擎Lucene简介     转载 作者: 车东 Email: chedongATbigfoot.com/chedongATchedon ...
by alex8946 2007-01-29 浏览 (454) 回复 (0) 关键字:

转载:Lucene:基于Java的全文检索引擎简介

在次声明:转载 Lucene:基于Java的全文检索引擎简介 作者:车东 发表于:2002-08-06 18:08 最后更新于:2007-04-12 11:04 版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明。 http://www.chedong.com/tech/lucene.html Lucene是一个基于Java的全文索引 ...
by ljm3256748 2007-05-14 浏览 (422) 回复 (0) 关键字: Lucene

基于Java的全文索引引擎Lucene简介

转载 作者: 车东 Email: chedongATbigfoot.com/chedongATchedong.com 内容摘要: Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比 ...
by zhao 2007-01-08 浏览 (502) 回复 (0) 关键字: 基于Java的全文索引引擎Lucene简介

Lucene:基于Java的全文检索引擎简介

作者:车东 发表于:2002-08-06 18:08 最后更新于:2007-04-12 11:04 版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明。 http://www.chedong.com/tech/lucene.html Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作 ...
by lihaiyan 2007-09-27 浏览 (181) 回复 (0) 关键字:

LUCENE简介[转]

关键词:Lucene java full-text search engine Chinese word segment 内容摘要: Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词 ...
by sdxt911 2007-01-25 浏览 (396) 回复 (0) 关键字:

google search

这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文 本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000 ‘000个网页。我们可以从 http://google.stanford.edu/ 下载。 设 计搜索引擎 ...
by dogstar 2008-05-29 浏览 (581) 回复 (0)

大家用的LUCENE是什么版本? 哪个版本性能比较稳定?

还请各位告知. 我用的是LUCENE2.0, 但是JAVAEYE上一个朋友做的"庖丁解牛"中文分词组件不能在这个版本上使用, 我要升级. 我最怕的是更新索引时把索引损坏. 不知道各位有没有这样的经历? 说来听听. 对于LUCENE索引达到千万级时,索引更新效率和查找效率大幅度下降, 各位有什么样的优化策略呢? 特别是索引更新比较频繁时, 系统设计是个大麻烦. 还请有经验的朋友进来说说.
by shuyanbo 2007-11-15 浏览 (665) 回复 (2)

【求助】怎么设置hits数量的上限?或者怎么在返回结果时使JVM不崩溃。

因为我们搜索的数据量很大(大概在1个T左右),我担心返回result时会超出JVM内存上限。
by gerbility 2008-05-13 浏览 (413) 回复 (5)

使用MMAnalyzer 搜索出现一些问题

最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没, package ch2.lucenedemo.test; import ja ...
by zhanjianhua 2008-07-11 浏览 (373) 回复 (2)

关于lucene的分词和查询

我想问下,如果我把一个中文字符传在索引的时候进行了分词,查询的时候也使用同一个分词器. 如何让查询按照最大匹配度去进行? 比如索引里的字符传是"问题说明越详细",分词分成了"问题","说明","越","详细". 我用"如果问题说明越详细,回答也会越准确!"去查询,希望能查询到这个结果,需要怎么做? 刚接触lucene,还很不熟悉.
by shadowlin 2008-05-26 浏览 (1262) 回复 (18)

为什么说Lucene不好

引言 在Lingway公司,我们使用了Lucene至进今已有好几年时间。对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。   在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并 ...
by robertlyc 2008-03-22 浏览 (4541) 回复 (13) 关键字: lucene

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)    以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

Coreseek 全文检索工具 - 国内开源项目介绍(三)

项目名称: Coreseek 发起时间: 2007年7月 网站:http://www.coreseek.com 项目介绍: 为应用提供全文检索功能,目前的版本(2.x 3.x)基于Sphinx 0.9.8,支持使用Python定义数据源,支持中文分词。 为您的应用实施全文检索,您可以: * 帮助用户找到您业务中,目前通过全网搜索找不到的80%的信息; * 可以保证自己信息的私密性,这在公司组织中 ...
by Quake Wang 2008-09-08 浏览 (1671) 回复 (1) 关键字:

相关问答

赞助商链接