《lucene的多种搜索》的相关内容
相关讨论
关于BooleanQuery的问题
java 代码
/**
*
*/
package com.futurebnc.demo.search.test;
import org.apache.luce ...
by crazy.j 2007-11-10 浏览 (605) 回复 (1) 关键字: lucene
Lucene-2.0学习文档(4)
接http://www.javaeye.com/topic/39876
下面是搜索的例子:
[code]
public void SearchSort1() throws IOException, ParseException
{
IndexSearcher indexSearcher = new In ...
by likunkun 2006-12-21 浏览 (7287) 回复 (3) 关键字: lucene
Lucene-2.0学习文档(2)
接http://www.javaeye.com/post/190334
IndexWriter(File path, Analyzer a, boolean create)
IndexWriter(String path, Analyzer a, boolean create)
可见构造它需要一个索引文件目录,一个分析器(一般用标准的这个),最后一个参数是标识是否清空索引目录
它有一些设置 ...
by likunkun 2006-12-21 浏览 (4689) 回复 (2) 关键字: lucene
Lucene-2.0学习文档(3)
接http://www.javaeye.com/post/190335
到现在我们已经可以用lucene建立索引了
下面介绍一下几个功能来完善一下:
1.索引格式
其实索引目录有两种格式,一种是除配置文件外,每一个Document独立成为一个文件(这种搜索起来会影响速度)。另一种是全部的Document成一个文件,这样属于复合模式就快了。
2.索引文件可放的位置:
索引可以存放在两个地 ...
by likunkun 2006-12-21 浏览 (6388) 回复 (0) 关键字: lucene
搜索篇:lucene简单实例<二>
写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦.
Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索
来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。
IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (13927) 回复 (15) 关键字: lucene
相关博客
Lucene查询对象浅析(一)
Lucene作为一个开源的搜索工具包,它为开发人员提供了丰富的查询方法,总结如下:
第一种:TermQuery.TermQuery是Lucene里面最基本的一种原子查询。开发人员可以通过它来检索索引中含有指定词条的Document。代码如下:
public static void main(String[] args) throws IOException {
cre ...
by 狂放不羁 2008-08-13 浏览 (209) 回复 (0) 关键字: lucene query
lucene常用搜索排序摘录
一,查询
一个关键字,对一个字段进行查询
QueryParser qp = new QueryParser("content",analyzer);
query = qp.parse(keyword);
Hits hits = searcher.search(query);
模糊查询
Term term = n ...
by Clayz 2008-09-16 浏览 (31) 回复 (0) 关键字:
全文检索lucene学习笔记(四)
关于Lucene七个查询的使用
1.TermQuery:
package com.lucene.search;
import java.io.File;
import java.io.IOException;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene ...
by oudoud 2008-07-05 浏览 (202) 回复 (0) 关键字:
Lucene使用项向量进行模糊查询
TermVector是Lucene 1.4新增的 它提供一种向量机制来进行模糊查询,TermVector保存Token.getPositionIncrement() 和Token.startOffset() 以及Token.endOffset() 信息. Field.TermVector.NO:不保存term vectorsField.TermVector.YES:保存term vect ...
by Callan 2008-01-14 浏览 (774) 回复 (0) 关键字: lucene, 项向量, termvector, with_positions, with_offsets, with_positions_offsets, termfreqvector
Lucene使用项向量进行模糊查询
TermVector是Lucene 1.4新增的 它提供一种向量机制来进行模糊查询,TermVector保存Token.getPositionIncrement() 和Token.startOffset() 以及Token.endOffset() 信息.
Field.TermVector.NO:不保存term vectorsField.TermVector.YES:保存term ...
by conkeyn 2008-08-15 浏览 (36) 回复 (0) 关键字:
相关圈子讨论
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (373) 回复 (2)
模糊搜索
如题,比如我索引的文字有两个document 1:爱的敬意 2:爱的致意 如果我想输入 爱的敬意 两条Document都能搜到,应该怎么做呢
by zhjt_88@163.com 2008-07-07 浏览 (187) 回复 (2)
报告庖丁2.01停用词的Bug
x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。
package textss;
import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.pao ...
by guoyi 2007-09-12 浏览 (871) 回复 (2)
为何同样的代码,却不同的结果。。。
这个问题我已经被困1个星期了,真是欲哭无泪。。。
我用的是lucene2.3.2。里面有个demo,我准备仿照它将其改造成struts架构的,没想到噩梦开始。。。
我分别写了2个类,一个类是用main方法生成索引文件。另一个类则是查询生成的索引文件。写了个main方法测试了下生成索引文件的类,通过。下面就开始搭建成struts下的了。action写好了,配置好 ...
by jsnjlc 2008-08-05 浏览 (226) 回复 (3)
lucene建立索引的错误,各位帮忙看看
前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看
//开始建立索引
int j = 0;
while (j < 10) {
gs.setStartResul ...
by jaie 2008-04-06 浏览 (372) 回复 (4)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

