《Lucene實戰開發手記(三)--- 創建索引細節方法》的相关内容
相关讨论
初次使用lucene2.0的心得和疑问
这几天一直在看有关lucene的资料,在网上查了下,发现好多文章都是重复的,也有将的不错的文章,但大多例子都是基于lucene1.4.3的。本人刚接触lucene,在此一点小小的心得和疑问。请看下面:
lucene的基本特性可以参考:
初识lucene
Lucene基本使用介绍
网上大家对中文分词插件IK_CAnalyzer的评价不错,目前IK_CAnalyzer的最新版本是1.4,是在lucen ...
by stephen722 2007-07-11 浏览 (2407) 回复 (7) 关键字:
Lucene-2.0学习文档(1)
[原创]Lucene-2.0学习文档
作者:Javafish(likunkun)
Email:javafish@sunxin.org
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。
其功能非常的强大,api也很简单。总得来说用Lucene来进行建立
和搜索和操作数据库是差不多的(有点像),Document可以看作是
数据库的一行记 ...
by likunkun 2006-12-21 浏览 (13379) 回复 (14) 关键字: lucene
关于BooleanQuery的问题
java 代码
/**
*
*/
package com.futurebnc.demo.search.test;
import org.apache.luce ...
by crazy.j 2007-11-10 浏览 (605) 回复 (1) 关键字: lucene
关于 lucene 内存溢出
package business.ywbdmanagement;
import hibernate.YhbdProblem;
import common.AppContext;
import java.io.File;
import java.io.IOException;
import java.util.List;
import org.apache.lucen ...
by manus 2007-08-14 浏览 (1063) 回复 (2) 关键字: lucene
关于Lucene 做全文搜索的问题,个站:http://mao52.com
最近正在做全文搜索。
问题是我新增索引后,旧的索引文件不能删除?
建索引代码如下:
Directory directory;
IndexWriter writer;
CWordAnalyzer analyzer=new ...
by mao_lu 2006-12-21 浏览 (1750) 回复 (3) 关键字: 全文搜索
相关博客
lucene-2.0.0的基本应用
首先肯定是建立索引了啊
public void creatIndex() {
File indexDir = new File(getPathIndex());
try {
List<Article> listArticle = getArticleDao().search(null, null,null, null, null, null, ...
by lihaiyan 2007-09-27 浏览 (215) 回复 (0) 关键字:
lucene-2.0的基本应用
首先肯定是建立索引了啊
public void creatIndex() {
File indexDir = new File(getPathIndex());
try {
List listArticle = getArticleDao().search(null, null,null, null, null, null, null, null, ne ...
by liheqian_0083 2007-11-09 浏览 (275) 回复 (0) 关键字:
lucene第一步---2.查询
package demo.first;
import java.io.*;
import java.util.Date;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucen ...
by llying 2008-09-09 浏览 (43) 回复 (1) 关键字:
lucene-建立索引的入门例子<一>
package org.sam.demo.lucene;
import java.io.IOException;
import java.sql.SQLException;
import java.util.List;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lu ...
by fys124974704 2008-09-16 浏览 (30) 回复 (0) 关键字:
相关圈子讨论
模糊搜索
如题,比如我索引的文字有两个document 1:爱的敬意 2:爱的致意 如果我想输入 爱的敬意 两条Document都能搜到,应该怎么做呢
by zhjt_88@163.com 2008-07-07 浏览 (194) 回复 (2)
有关lucene 索引pdf格式文档的问题
环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2
//索引文档LuceneInActionCH.pdf
File indexDir = new File("C:\\index"); // 索引文件存放路径
File dataDir = new File("C:\\file"); // 文件所存路径
Analyzer analyzer ...
by xxwang1984 2008-07-11 浏览 (527) 回复 (13)
报告庖丁2.01停用词的Bug
x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。
package textss;
import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.pao ...
by guoyi 2007-09-12 浏览 (871) 回复 (2)
请教:field中,全字母或全数字可以检索,如果是两者都有就无法检索到
建立索引代码如下:
Analyzer analyzer = new PaodingAnalyzer();
writer = new IndexWriter(idxPath, analyzer);
....
doc.add(new Field("UserId", "这个从数据库得到的值",Field.Store.YES, Field.Index.UN_TOKENIZED));
doc.a ...
by outrace 2008-07-27 浏览 (159) 回复 (2)
lucene建立索引的错误,各位帮忙看看
前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看
//开始建立索引
int j = 0;
while (j < 10) {
gs.setStartResul ...
by jaie 2008-04-06 浏览 (390) 回复 (4)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

