《基于lucene的对数据库&文件夹检索(ss2,appfuse,jdon,nutch杂烩)》的相关内容
相关讨论
搜索篇:lucene简单实例<二>
写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦.
Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索
来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。
IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (13387) 回复 (15) 关键字: lucene
搜索篇:lucene的简单实例<一>
说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别.
其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来...
1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三 ...
by lighter 2006-12-19 浏览 (14995) 回复 (29) 关键字: lucene
相关博客
使用Lucene2.3构建搜索引擎
Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。Lucene的作者:Lucene的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在 Excite担任高级系统架构设计师,目前从事于一些INTERNET ...
by 晨星★~雨泪 2008-04-03 浏览 (747) 回复 (0) 关键字: lucene
基于Java的全文索引引擎Lucene简介
基于Java的全文索引引擎Lucene简介
关键字: 基于Java的全文索引引擎Lucene简介
转载
作者: 车东 Email: chedongATbigfoot.com/chedongATchedon ...
by alex8946 2007-01-29 浏览 (438) 回复 (0) 关键字:
实战lucene
文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。
Lucene 简介
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 ...
by liheqian_0083 2007-11-09 浏览 (147) 回复 (0) 关键字:
基于Java的全文索引引擎Lucene简介
转载
作者: 车东 Email: chedongATbigfoot.com/chedongATchedong.com
内容摘要:
Lucene是一个基于Java的全文索引工具包。
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史
全文检索的实现:Luene全文索引和数据库索引的比较
中文切分词机制简介:基于词库和自动切分词算法的比 ...
by zhao 2007-01-08 浏览 (482) 回复 (0) 关键字: 基于Java的全文索引引擎Lucene简介
相关圈子讨论
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (303) 回复 (2)
为何同样的代码,却不同的结果。。。
这个问题我已经被困1个星期了,真是欲哭无泪。。。
我用的是lucene2.3.2。里面有个demo,我准备仿照它将其改造成struts架构的,没想到噩梦开始。。。
我分别写了2个类,一个类是用main方法生成索引文件。另一个类则是查询生成的索引文件。写了个main方法测试了下生成索引文件的类,通过。下面就开始搭建成struts下的了。action写好了,配置好了,运行——D:\opt\lu ...
by jsnjlc 2008-08-05 浏览 (163) 回复 (3)
请问,如何实现这样从查询!谢谢!
刚用LUCENE,我有两个实体,BOOK 和 TYPE
BOOK:bookid,bookname,typeid
Type: typeid,typename
我的索引是这样的
<bookid:153><bookname:book3><typename:b>
<bookid:123><bookname:book2><typename:a>
<booki ...
by snake_liu 2008-07-28 浏览 (177) 回复 (6)
报告庖丁2.01停用词的Bug
x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。
package textss;
import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.pao ...
by guoyi 2007-09-12 浏览 (791) 回复 (2)
为什么我用庖丁分词查不出结果?
建索引时我用疱丁分的词.成功了.用luke看确实分词了. 但搜索时.却结果不太正确 比如我搜"电"单个字.明明索引中有"电视","电视台".但结果却是0 或者搜"金融".含有"金融界"的内容却不出来.这是为什么.下面 是代码:
String str = "电";//内容的关键字 String FIELD_NAME = "title"; File indexDir = new File("g:\ ...
by xrb2008 2008-04-24 浏览 (427) 回复 (2)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1589) 回复 (7) 关键字: spindle
为什么说Lucene不好
引言
在Lingway公司,我们使用了Lucene至进今已有好几年时间。对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。
在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并 ...
by robertlyc 2008-03-22 浏览 (4350) 回复 (13) 关键字: lucene
Lucene 2.3 发布,Hadoop成为Apache顶级项目
Apache Lucene可以说是Java社区全文检索引擎的事实标准,无人不晓,Lucene社区是相当活跃的,几乎每年都有两个版本发布,21号Lucene正式发布2.3版本,官方网站虽然还没有提供下载,但镜像网站已有下载。
Lucene下载地址:http://www.eng.lsu.edu/mirrors/apache/lucene/java/
Hadoop原本由Lucene的子项目Nutc ...
by rainsf 2008-01-24 浏览 (2426) 回复 (11) 关键字: lucene, hadoop

