Lucene相关度排序的调整 》的相关内容

Lucene-2.0学习文档(4)

接http://www.javaeye.com/topic/39876 下面是搜索的例子: [code] public void SearchSort1() throws IOException, ParseException {         IndexSearcher indexSearcher = new In ...
by likunkun 2006-12-21 浏览 (7287) 回复 (3) 关键字: lucene

用lucene对时间索引后搜索的问题。

我的数据量比较大,故后台采用一个线程专用于索引的建立。目前索引库已经在700多M了,估计全部建立完成在1.5G左右。 每一个doc里包括了一个field(sendtime,时间字符串,yyyy-mm-dd hh:MM:ss格式) 在前台web进行搜索时。采用如下代码 /** * sendtime在date1与date2之间的数据 */ if (startTi ...
by yinhj 2007-07-31 浏览 (1837) 回复 (7) 关键字: lucene

Lucene相关度排序的调整

Lucene相关度排序的调整2007-06-28 15:40 Lucene的搜索结果默认按相关度排序,这个相关度排序是基于内部的Score和DocID,Score又基于关键词的内部评分和做索引时的boost。默认Score高的排前面,如果Score一样,再按索引顺序,先索引的排前面。那么有人问了,如果我要 ...
by jeafyezheng 2007-07-26 浏览 (134) 回复 (0) 关键字:

lucene默认排序修改--如何让先索引的排在后面(相似度一样时)

Lucene的搜索结果默认按相关度排序,这个相关度排序是基于内部的Score和DocID,Score又基于 关键词的内部评分和做索引时的boost。默认Score高的排前面,如果Score一样,再按索引顺序,先索引的排前面。那么如果我要先索引 的排后面怎么办呢?只要构造一个SortField[]就可以实现我们要的功能// 评分降序,评分一样时后索引的排前面    ne ...
by jeafyezheng 2007-03-29 浏览 (103) 回复 (0) 关键字:

lucene建立索引的错误,各位帮忙看看

前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看 //开始建立索引  int j = 0; while (j < 10) { gs.setStartResul ...
by jaie 2008-04-06 浏览 (372) 回复 (4)

报告庖丁2.01停用词的Bug

x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。 package textss; import net.paoding.analysis.analyzer.PaodingAnalyzer; import net.pao ...
by guoyi 2007-09-12 浏览 (871) 回复 (2)

问题麻烦看下

我用JE的分词 分词还是可以分出来的,但是到了查询的时候老是报Exception in thread "main" java.lang.OutOfMemoryError: Java heap space错误,我的JVM已经设置的很大了啊 麻烦给点提示是哪里错了谢谢 以下查询代码 public void JE_Index(String Word, String Index, String Key) ...
by jiqiumin 2008-04-17 浏览 (257) 回复 (0)

lucene搜索结果如何结合PR技术实现优化?

最近搭建了一个基于lucene的实验平台,但是用lucene默认搜索结果排序技术得到的排名是不尽如人意的。所以想结合PageRank技术来优化下网页的排名。如果每个网页的pr值都已经计算出来了,我不知道如何将它结合到lucene里面,是要修改lucene源代码,然后在打包成新的jar再来放到工程中去应用吗? 你们是如何对搜索结果进行优化的? 提供点建议给我吧,谢谢。
by chencang 2008-07-26 浏览 (362) 回复 (9)

使用MMAnalyzer 搜索出现一些问题

最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没, package ch2.lucenedemo.test; import ja ...
by zhanjianhua 2008-07-11 浏览 (373) 回复 (2)

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)    以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

相关问答

赞助商链接