《搜索篇:lucene的简单实例<一>》的相关内容
相关讨论
搜索篇:lucene简单实例<二>
写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦.
Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索
来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。
IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (12921) 回复 (15) 关键字: lucene
lucene为什么查不出结果
在data文件夹下有4个文件,a.txt,b.txt,c.txt,d.txt.每个文件的内容就是它的文件名,比如a.txt内容就是a.
idx文件夹就是索引存放的文件夹
lucene的索引:
public class Indexer {
public static void main(String[] args) throws Exception {
Indexer indexer = ...
by 42087743 2008-08-04 浏览 (263) 回复 (5) 关键字: lucene
Lucene-2.0学习文档(1)
[原创]Lucene-2.0学习文档
作者:Javafish(likunkun)
Email:javafish@sunxin.org
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。
其功能非常的强大,api也很简单。总得来说用Lucene来进行建立
和搜索和操作数据库是差不多的(有点像),Document可以看作是
数据库的一行记 ...
by likunkun 2006-12-21 浏览 (12961) 回复 (14) 关键字: lucene
Lucene 入门与实战
引用本文转载自:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1004B
关于作者
周登朋,软件工程师,上海交通大学研究生,对 Java 技术以及信息检索技术很感兴趣。您可以通过 zhoudengpeng@yahoo.com.cn 与他联系。
本文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利 ...
by weidewei 2008-04-15 浏览 (427) 回复 (1) 关键字: 入门 实战 lucene
相关博客
Lucene全文检索样例(解决大文本建索引)
建索引:package com.pccw;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReade ...
by damies 2008-01-31 浏览 (297) 回复 (0) 关键字: lucene
Lucene 基础指南
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。
Field:Document中的一个字段,相当于数据库中的Column ...
by yinhj 2007-11-10 浏览 (211) 回复 (0) 关键字:
Lucene 基础指南
Lucene 基础指南
作者:lighter, 江南白衣
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须 ...
by fly.net.cn 2007-05-07 浏览 (456) 回复 (0) 关键字:
Lucene 基础指南
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。
1. 建立索引时最重要的几个术语
* Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。
* Field:Document中的一个字段,相当于数据库中的Col ...
by wind_bell 2007-09-21 浏览 (261) 回复 (0) 关键字:
相关圈子讨论
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (243) 回复 (2)
报告庖丁2.01停用词的Bug
x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。
package textss;
import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.pao ...
by guoyi 2007-09-12 浏览 (745) 回复 (2)
为何同样的代码,却不同的结果。。。
这个问题我已经被困1个星期了,真是欲哭无泪。。。
我用的是lucene2.3.2。里面有个demo,我准备仿照它将其改造成struts架构的,没想到噩梦开始。。。
我分别写了2个类,一个类是用main方法生成索引文件。另一个类则是查询生成的索引文件。写了个main方法测试了下生成索引文件的类,通过。下面就开始搭建成struts下的了。action写好了,配置好了,运行——D:\opt\lu ...
by jsnjlc 2008-08-05 浏览 (120) 回复 (3)
为什么我用庖丁分词查不出结果?
建索引时我用疱丁分的词.成功了.用luke看确实分词了. 但搜索时.却结果不太正确 比如我搜"电"单个字.明明索引中有"电视","电视台".但结果却是0 或者搜"金融".含有"金融界"的内容却不出来.这是为什么.下面 是代码:
String str = "电";//内容的关键字 String FIELD_NAME = "title"; File indexDir = new File("g:\ ...
by xrb2008 2008-04-24 浏览 (407) 回复 (2)
关于中文搜索时使用*通配符不起作用的问题
本人想实现一个智能提示功能,索引文件已经建立,查询时,发现一个问题,查英文时使用通配符*或者?是可以的,查查中文时加?查不到,加*查得到,但不符合规则是模糊查询,不加也是模糊查询。
package com.aladdin.alagis.suggest;
/***
* @deprecated 2008-4-23
* @author chenjianxiang
* @depre ...
by cjx186 2008-04-24 浏览 (297) 回复 (1)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1454) 回复 (7) 关键字: spindle
推荐知识库条目
Comming soon

