《搜索篇:lucene简单实例<二>》的相关内容
相关讨论
搜索篇:lucene的简单实例<一>
说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别.
其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来...
1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三 ...
by lighter 2006-12-19 浏览 (15035) 回复 (29) 关键字: lucene
关于BooleanQuery的问题
java 代码
/**
*
*/
package com.futurebnc.demo.search.test;
import org.apache.luce ...
by crazy.j 2007-11-10 浏览 (558) 回复 (1) 关键字: lucene
Lucene-2.0学习文档(2)
接http://www.javaeye.com/post/190334
IndexWriter(File path, Analyzer a, boolean create)
IndexWriter(String path, Analyzer a, boolean create)
可见构造它需要一个索引文件目录,一个分析器(一般用标准的这个),最后一个参数是标识是否清空索引目录
它有一些设置 ...
by likunkun 2006-12-21 浏览 (4579) 回复 (2) 关键字: lucene
Lucene-2.0学习文档(3)
接http://www.javaeye.com/post/190335
到现在我们已经可以用lucene建立索引了
下面介绍一下几个功能来完善一下:
1.索引格式
其实索引目录有两种格式,一种是除配置文件外,每一个Document独立成为一个文件(这种搜索起来会影响速度)。另一种是全部的Document成一个文件,这样属于复合模式就快了。
2.索引文件可放的位置:
索引可以存放在两个地 ...
by likunkun 2006-12-21 浏览 (6247) 回复 (0) 关键字: lucene
相关博客
搜索篇:lucene简单实例(转)
引自:http://tech.it168.com/j/e/2006-12-24/200612242354435.shtml
【IT168技术文档】
Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索
来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已 ...
by VerRan 2007-07-18 浏览 (451) 回复 (0) 关键字:
初识Apache lucene
In Lucene 2.3.2 of core API documention,you should be see following description:
To use Lucene, an application should:
1. Create Documents by adding Fields;
...
by jay88489 2008-08-27 浏览 (12) 回复 (0) 关键字: 开源搜索引擎, lucene
Lucene 基础指南
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。
Field:Document中的一个字段,相当于数据库中的Column ...
by yinhj 2007-11-10 浏览 (222) 回复 (0) 关键字:
Lucene 基础指南
Lucene 基础指南
作者:lighter, 江南白衣
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须 ...
by fly.net.cn 2007-05-07 浏览 (461) 回复 (0) 关键字:
相关圈子讨论
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (315) 回复 (2)
报告庖丁2.01停用词的Bug
x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。
package textss;
import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.pao ...
by guoyi 2007-09-12 浏览 (803) 回复 (2)
为何同样的代码,却不同的结果。。。
这个问题我已经被困1个星期了,真是欲哭无泪。。。
我用的是lucene2.3.2。里面有个demo,我准备仿照它将其改造成struts架构的,没想到噩梦开始。。。
我分别写了2个类,一个类是用main方法生成索引文件。另一个类则是查询生成的索引文件。写了个main方法测试了下生成索引文件的类,通过。下面就开始搭建成struts下的了。action写好了,配置好了,运行——D:\opt\lu ...
by jsnjlc 2008-08-05 浏览 (169) 回复 (3)
有关lucene 索引pdf格式文档的问题
环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2
//索引文档LuceneInActionCH.pdf
File indexDir = new File("C:\\index"); // 索引文件存放路径
File dataDir = new File("C:\\file"); // 文件所存路径
Analyzer analyzer ...
by xxwang1984 2008-07-11 浏览 (351) 回复 (13)
模糊搜索
如题,比如我索引的文字有两个document 1:爱的敬意 2:爱的致意 如果我想输入 爱的敬意 两条Document都能搜到,应该怎么做呢
by zhjt_88@163.com 2008-07-07 浏览 (165) 回复 (2)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1617) 回复 (7) 关键字: spindle
为什么说Lucene不好
引言
在Lingway公司,我们使用了Lucene至进今已有好几年时间。对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。
在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并 ...
by robertlyc 2008-03-22 浏览 (4371) 回复 (13) 关键字: lucene

