搜索篇:lucene的简单实例<一>》的相关内容

搜索篇:lucene简单实例<二>

写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦. Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。 IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (12921) 回复 (15) 关键字: lucene

lucene为什么查不出结果

在data文件夹下有4个文件,a.txt,b.txt,c.txt,d.txt.每个文件的内容就是它的文件名,比如a.txt内容就是a. idx文件夹就是索引存放的文件夹 lucene的索引: public class Indexer { public static void main(String[] args) throws Exception { Indexer indexer = ...
by 42087743 2008-08-04 浏览 (263) 回复 (5) 关键字: lucene

Lucene-2.0学习文档(1)

  [原创]Lucene-2.0学习文档 作者:Javafish(likunkun) Email:javafish@sunxin.org Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记 ...
by likunkun 2006-12-21 浏览 (12961) 回复 (14) 关键字: lucene

Lucene 入门与实战

引用本文转载自:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1004B 关于作者 周登朋,软件工程师,上海交通大学研究生,对 Java 技术以及信息检索技术很感兴趣。您可以通过 zhoudengpeng@yahoo.com.cn 与他联系。 本文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利 ...
by weidewei 2008-04-15 浏览 (427) 回复 (1) 关键字: 入门 实战 lucene

Lucene全文检索样例(解决大文本建索引)

建索引:package com.pccw; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReade ...
by damies 2008-01-31 浏览 (297) 回复 (0) 关键字: lucene

Lucene 基础指南

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 Field:Document中的一个字段,相当于数据库中的Column ...
by yinhj 2007-11-10 浏览 (211) 回复 (0) 关键字:

Lucene 基础指南

Lucene 基础指南 作者:lighter, 江南白衣     Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须 ...
by fly.net.cn 2007-05-07 浏览 (456) 回复 (0) 关键字:

Lucene入门

Lucene 基础指南 作者:lighter, 江南白衣     Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须 ...
by yizhang88 2007-07-05 浏览 (283) 回复 (0) 关键字:

Lucene 基础指南

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 * Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 * Field:Document中的一个字段,相当于数据库中的Col ...
by wind_bell 2007-09-21 浏览 (261) 回复 (0) 关键字:

使用MMAnalyzer 搜索出现一些问题

最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没, package ch2.lucenedemo.test; import ja ...
by zhanjianhua 2008-07-11 浏览 (243) 回复 (2)

报告庖丁2.01停用词的Bug

x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。 package textss; import net.paoding.analysis.analyzer.PaodingAnalyzer; import net.pao ...
by guoyi 2007-09-12 浏览 (745) 回复 (2)

为何同样的代码,却不同的结果。。。

这个问题我已经被困1个星期了,真是欲哭无泪。。。 我用的是lucene2.3.2。里面有个demo,我准备仿照它将其改造成struts架构的,没想到噩梦开始。。。 我分别写了2个类,一个类是用main方法生成索引文件。另一个类则是查询生成的索引文件。写了个main方法测试了下生成索引文件的类,通过。下面就开始搭建成struts下的了。action写好了,配置好了,运行——D:\opt\lu ...
by jsnjlc 2008-08-05 浏览 (120) 回复 (3)

为什么我用庖丁分词查不出结果?

建索引时我用疱丁分的词.成功了.用luke看确实分词了. 但搜索时.却结果不太正确 比如我搜"电"单个字.明明索引中有"电视","电视台".但结果却是0 或者搜"金融".含有"金融界"的内容却不出来.这是为什么.下面 是代码: String str = "电";//内容的关键字 String FIELD_NAME = "title"; File indexDir = new File("g:\ ...
by xrb2008 2008-04-24 浏览 (407) 回复 (2)

关于中文搜索时使用*通配符不起作用的问题

本人想实现一个智能提示功能,索引文件已经建立,查询时,发现一个问题,查英文时使用通配符*或者?是可以的,查查中文时加?查不到,加*查得到,但不符合规则是模糊查询,不加也是模糊查询。 package com.aladdin.alagis.suggest; /*** * @deprecated 2008-4-23 * @author chenjianxiang * @depre ...
by cjx186 2008-04-24 浏览 (297) 回复 (1)

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com) 以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1454) 回复 (7) 关键字: spindle

推荐知识库条目

Comming soon