Lucene(Lucence)建立索引(字段)》的相关内容

搜索篇:lucene简单实例<二>

写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦. Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。 IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (12364) 回复 (15) 关键字: lucene

搜索篇:lucene的简单实例<一>

说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别. 其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来... 1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三 ...
by lighter 2006-12-19 浏览 (14111) 回复 (29) 关键字: lucene

Lucene无法单个字母查询

当我在使用我已经建立好的Luence索引开始查询的时候,发现这个问题: 1.如果我输入的查询条件是汉字或多个字母的组合,则可以模糊匹配出索引里的记录集 2.如果我输入单个字母的话,无论怎么样一条记录都出不来. 不知道大家是怎么解决这个问题的? 代码如下: java 代码 public Hits query(String str)&nbs ...
by kyo100900 2007-10-26 浏览 (511) 回复 (5) 关键字: luence

初次使用lucene2.0的心得和疑问

这几天一直在看有关lucene的资料,在网上查了下,发现好多文章都是重复的,也有将的不错的文章,但大多例子都是基于lucene1.4.3的。本人刚接触lucene,在此一点小小的心得和疑问。请看下面: lucene的基本特性可以参考: 初识lucene Lucene基本使用介绍 网上大家对中文分词插件IK_CAnalyzer的评价不错,目前IK_CAnalyzer的最新版本是1.4,是在lucen ...
by stephen722 2007-07-11 浏览 (2239) 回复 (7) 关键字:

转载:关于 lucene2.0 的创建、检索和删除功能的完整实现

Stored Indexed ...
by ljm3256748 2007-05-14 浏览 (339) 回复 (0) 关键字: lucene

lucene-2.0.0的基本应用

首先肯定是建立索引了啊  public void creatIndex() {  File indexDir = new File(getPathIndex());  try { List<Article> listArticle = getArticleDao().search(null, null,null, null, null, null, ...
by lihaiyan 2007-09-27 浏览 (187) 回复 (0) 关键字:

lucene-2.0的基本应用

首先肯定是建立索引了啊  public void creatIndex() {  File indexDir = new File(getPathIndex());  try { List listArticle = getArticleDao().search(null, null,null, null, null, null, null, null, ne ...
by liheqian_0083 2007-11-09 浏览 (237) 回复 (0) 关键字:

关于lucene2.0的创建、检索和删除功能的完整实现

转载: http://blog.csdn.net/xiaodaoxiaodao/archive/2006/09/10/1203959.aspx 关于lucene2.0的创建、检索和删除功能的完整实现   最近要做一个站内的全文检索功能,主要是针对clob字段的,于是去网上找了点lucene的资料,现在新版本的是2.0.0,网上的例子多是1.4.3的,有些方法已经废弃 ...
by ttitfly 2007-06-28 浏览 (465) 回复 (0) 关键字: lucene2.0

Lucene入门

Lucene2.0快速入门 一、Lucene介绍 Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。 Luc ...
by saai 2008-02-28 浏览 (139) 回复 (1) 关键字: 心得

报告庖丁2.01停用词的Bug

x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。 package textss; import net.paoding.analysis.analyzer.PaodingAnalyzer; import net.pao ...
by guoyi 2007-09-12 浏览 (682) 回复 (2)

使用MMAnalyzer 搜索出现一些问题

最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没, package ch2.lucenedemo.test; import ja ...
by zhanjianhua 2008-07-11 浏览 (156) 回复 (2)

lucene建立索引的错误,各位帮忙看看

前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看 //开始建立索引  int j = 0; while (j < 10) { gs.setStartResul ...
by jaie 2008-04-06 浏览 (278) 回复 (4)

有关lucene 索引pdf格式文档的问题

环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2 //索引文档LuceneInActionCH.pdf File indexDir = new File("C:\\index"); // 索引文件存放路径 File dataDir = new File("C:\\file"); // 文件所存路径 Analyzer analyzer ...
by xxwang1984 2008-07-11 浏览 (120) 回复 (8)

问题麻烦看下

我用JE的分词 分词还是可以分出来的,但是到了查询的时候老是报Exception in thread "main" java.lang.OutOfMemoryError: Java heap space错误,我的JVM已经设置的很大了啊 麻烦给点提示是哪里错了谢谢 以下查询代码 public void JE_Index(String Word, String Index, String Key) ...
by jiqiumin 2008-04-17 浏览 (202) 回复 (0)

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com) 以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1225) 回复 (6) 关键字: spindle

基于JavaScript的代码自动生成工具

JavaScript Based Code Generator - codegen 工具主页http://sourceforge.net/projects/jbcgen/目的快速生成程序代码, 比如Struts, Spring, Jdbc/Hibernate所有前后台的代码.简单介绍本工具生成代码的思想是读取数据库中表的结构, 使用JavaScript作为脚本语言编写模板, 生成各种代码或者文件, ...
by jejwe 2008-03-06 浏览 (2457) 回复 (2) 关键字:

推荐知识库条目

Comming soon