基于lucene的对数据库&文件夹检索(ss2,appfuse,jdon,nutch杂烩)》的相关内容

搜索篇:lucene简单实例<二>

写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦. Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。 IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (13387) 回复 (15) 关键字: lucene

搜索篇:lucene的简单实例<一>

说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别. 其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来... 1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三 ...
by lighter 2006-12-19 浏览 (14995) 回复 (29) 关键字: lucene

使用Lucene2.3构建搜索引擎

Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。Lucene的作者:Lucene的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在 Excite担任高级系统架构设计师,目前从事于一些INTERNET ...
by 晨星★~雨泪 2008-04-03 浏览 (747) 回复 (0) 关键字: lucene

基于Java的全文索引引擎Lucene简介

基于Java的全文索引引擎Lucene简介 关键字:   基于Java的全文索引引擎Lucene简介     转载 作者: 车东 Email: chedongATbigfoot.com/chedongATchedon ...
by alex8946 2007-01-29 浏览 (438) 回复 (0) 关键字:

实战 Lucene

文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。 Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。 ...
by lihaiyan 2007-09-27 浏览 (176) 回复 (0) 关键字:

实战lucene

文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。 Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 ...
by liheqian_0083 2007-11-09 浏览 (147) 回复 (0) 关键字:

基于Java的全文索引引擎Lucene简介

转载 作者: 车东 Email: chedongATbigfoot.com/chedongATchedong.com 内容摘要: Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比 ...
by zhao 2007-01-08 浏览 (482) 回复 (0) 关键字: 基于Java的全文索引引擎Lucene简介

使用MMAnalyzer 搜索出现一些问题

最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没, package ch2.lucenedemo.test; import ja ...
by zhanjianhua 2008-07-11 浏览 (303) 回复 (2)

为何同样的代码,却不同的结果。。。

这个问题我已经被困1个星期了,真是欲哭无泪。。。 我用的是lucene2.3.2。里面有个demo,我准备仿照它将其改造成struts架构的,没想到噩梦开始。。。 我分别写了2个类,一个类是用main方法生成索引文件。另一个类则是查询生成的索引文件。写了个main方法测试了下生成索引文件的类,通过。下面就开始搭建成struts下的了。action写好了,配置好了,运行——D:\opt\lu ...
by jsnjlc 2008-08-05 浏览 (163) 回复 (3)

请问,如何实现这样从查询!谢谢!

刚用LUCENE,我有两个实体,BOOK 和 TYPE BOOK:bookid,bookname,typeid Type: typeid,typename 我的索引是这样的 <bookid:153><bookname:book3><typename:b> <bookid:123><bookname:book2><typename:a> <booki ...
by snake_liu 2008-07-28 浏览 (177) 回复 (6)

报告庖丁2.01停用词的Bug

x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。 package textss; import net.paoding.analysis.analyzer.PaodingAnalyzer; import net.pao ...
by guoyi 2007-09-12 浏览 (791) 回复 (2)

为什么我用庖丁分词查不出结果?

建索引时我用疱丁分的词.成功了.用luke看确实分词了. 但搜索时.却结果不太正确 比如我搜"电"单个字.明明索引中有"电视","电视台".但结果却是0 或者搜"金融".含有"金融界"的内容却不出来.这是为什么.下面 是代码: String str = "电";//内容的关键字 String FIELD_NAME = "title"; File indexDir = new File("g:\ ...
by xrb2008 2008-04-24 浏览 (427) 回复 (2)

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com) 以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1589) 回复 (7) 关键字: spindle

为什么说Lucene不好

引言 在Lingway公司,我们使用了Lucene至进今已有好几年时间。对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。   在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并 ...
by robertlyc 2008-03-22 浏览 (4350) 回复 (13) 关键字: lucene

Lucene 2.3 发布,Hadoop成为Apache顶级项目

Apache Lucene可以说是Java社区全文检索引擎的事实标准,无人不晓,Lucene社区是相当活跃的,几乎每年都有两个版本发布,21号Lucene正式发布2.3版本,官方网站虽然还没有提供下载,但镜像网站已有下载。 Lucene下载地址:http://www.eng.lsu.edu/mirrors/apache/lucene/java/ Hadoop原本由Lucene的子项目Nutc ...
by rainsf 2008-01-24 浏览 (2426) 回复 (11) 关键字: lucene, hadoop

相关问答

赞助商链接