《使用Lucene2.3构建搜索引擎》的相关内容
相关讨论
搜索篇:lucene的简单实例<一>
说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别.
其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来...
1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三 ...
by lighter 2006-12-19 浏览 (14631) 回复 (29) 关键字: lucene
关于Lucene入门时碰到的问题
lucene版本:lucene-2.2.0-src.zip
Ant版本:apache-ant-1.7.0-bin.zip
JDK版本:jdk1.5.0_12
使用ANT war-demo 编译生成的两个JAR文件:lucene-core-2.2.0.jar和lucene-demos-2.2.0.jar也加到了CLASSPATH
写了一个建立索引的类如下:
import java.io.Fi ...
by wolftou 2007-12-15 浏览 (396) 回复 (3) 关键字: lucene
搜索篇:lucene简单实例<二>
写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦.
Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索
来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。
IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加 ...
by lighter 2006-12-20 浏览 (12921) 回复 (15) 关键字: lucene
lucene为什么查不出结果
在data文件夹下有4个文件,a.txt,b.txt,c.txt,d.txt.每个文件的内容就是它的文件名,比如a.txt内容就是a.
idx文件夹就是索引存放的文件夹
lucene的索引:
public class Indexer {
public static void main(String[] args) throws Exception {
Indexer indexer = ...
by 42087743 2008-08-04 浏览 (263) 回复 (5) 关键字: lucene
Lucene 入门与实战
引用本文转载自:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1004B
关于作者
周登朋,软件工程师,上海交通大学研究生,对 Java 技术以及信息检索技术很感兴趣。您可以通过 zhoudengpeng@yahoo.com.cn 与他联系。
本文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利 ...
by weidewei 2008-04-15 浏览 (427) 回复 (1) 关键字: 入门 实战 lucene
相关博客
Lucene 小试牛刀 代码实现
一, 建立索引,根据索引进行搜索
package com.xbkj.business.demo.lucene;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.io.Reader;
import java.util.ArrayList;
import j ...
by oudoud 2008-07-10 浏览 (92) 回复 (0) 关键字:
Lucene practice
1.simply practice the lucene api for search document and data, post code first
lucene version :2.2.0
set up the index of files
java 代码
package com.aaron.lucene;
&n ...
by aaron_ch 2007-09-19 浏览 (208) 回复 (0) 关键字: search document analyzer field
简单的lucene实例
package TestLucene;
import java.io.File;
import java.io.FileReader;
import java.io.Reader;
import java.util.Date;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis. ...
by gznofeng 2008-05-23 浏览 (124) 回复 (0) 关键字:
第一个lucene的简单实例....
这两天第一次接触lucene...对这东西很感兴趣...于是下载了lucene-2.2.0-src.zip下来研究研究...
按照网上的例子敲了敲代码....
却一直出错提示"document.add(Field.Text(...)"行"找不到符号"
后来才明白原来网上的例子大都是lucene 1.4.3版本的...
新版本2.0已经抛弃了原来的一些方法...
于是看了看文档写了个简单的入门实例. ...
by wolftou 2007-12-16 浏览 (358) 回复 (0) 关键字: lucene
Lucene Highlighter
lucene最新版本为1.9,从apache svn中checkout 出来已经包括了Highlighter
测试一下:
package org.apache.lucene.search.highlight;import junit.framework.TestCase;import org.apache.lucene.analysis ...
by xxj 2006-02-09 浏览 (713) 回复 (0) 关键字: NULL
相关圈子讨论
有关lucene 索引pdf格式文档的问题
环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2
//索引文档LuceneInActionCH.pdf
File indexDir = new File("C:\\index"); // 索引文件存放路径
File dataDir = new File("C:\\file"); // 文件所存路径
Analyzer analyzer ...
by xxwang1984 2008-07-11 浏览 (207) 回复 (8)
报告庖丁2.01停用词的Bug
x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。
package textss;
import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.pao ...
by guoyi 2007-09-12 浏览 (745) 回复 (2)
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (243) 回复 (2)
lucene建立索引的错误,各位帮忙看看
前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看
//开始建立索引
int j = 0;
while (j < 10) {
gs.setStartResul ...
by jaie 2008-04-06 浏览 (312) 回复 (4)
请教:field中,全字母或全数字可以检索,如果是两者都有就无法检索到
建立索引代码如下:
Analyzer analyzer = new PaodingAnalyzer();
writer = new IndexWriter(idxPath, analyzer);
....
doc.add(new Field("UserId", "这个从数据库得到的值",Field.Store.YES, Field.Index.UN_TOKENIZED));
doc.a ...
by outrace 2008-07-27 浏览 (100) 回复 (2)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1454) 回复 (7) 关键字: spindle
基于JavaScript的代码自动生成工具
JavaScript Based Code Generator - codegen 工具主页http://sourceforge.net/projects/jbcgen/目的快速生成程序代码, 比如Struts, Spring, Jdbc/Hibernate所有前后台的代码.简单介绍本工具生成代码的思想是读取数据库中表的结构, 使用JavaScript作为脚本语言编写模板, 生成各种代码或者文件, ...
by jejwe 2008-03-06 浏览 (2967) 回复 (2) 关键字:
推荐知识库条目
Comming soon

