JavaEye3.0开发手记之四 - ruby的全文检索》的相关内容

LUCENE(java分词工具)

转自:http://www.javaeye.com/blog/127968 简述: 在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多 在RoR方面,1、solr, acts_as_solr,2、sphinx,3、ferret
by yoyox 2007-10-09 浏览 (437) 回复 (0) 关键字: 分词

最近想找些关于全文检索的资料

这几天想找找跟全文检索相关的资料。看了Robbin几个人的文章发现都只是点到为止。提到了几种方法solr,sphinx ,ferret 。具体请看这里 robbin 的文章。其中讲到了全文检索中中文分词的一些难题。因为还是初学者,很多东西不是很了。找了些国外的资料发现很多国外的网站也开始从ferret转移到用sphinx。 以下是一些对ferret的一些评论: 引用In past projects ...
by genki 2008-02-18 浏览 (248) 回复 (0) 关键字: rails

教你使用solr搭建你的全文检索

教你使用solr搭建你的全文检索引用:http://bbs.zdnet.com.cn/archiver/tid-181555.html Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档:  实战Lucene,第 1 部分: 初识 Lucene:http://www.ibm.com/developerworks/cn/java ...
by nolan022 2008-01-12 浏览 (299) 回复 (0) 关键字:

使用libmmseg实现Ruby的中文分词功能

用Ruby on Rails开发web2.0网站的人都知道,ruby的全文检索功能不像Java支持的那样好,要提供中文的全文检索功能是一件很困难的事情,而偏偏全文检索是web2.0网站绕不过去的一道坎。虽然ruby也有类似lucene的全文检索软件ferret,但是ferret本身并没有提供中文分词功能,必须自己另行扩展中文分词功能。因此攻克ruby中文全文检索功能的瓶颈在于提供ruby的中文分词 ...
by robbin 2008-05-24 浏览 (1158) 回复 (7) 关键字: libmmseg

怎样搭建solr分布式索引平台?

用了半年的solr才能确实的感觉到lucene的优点。 正如robbin所说:“但是这个方案的缺点也是显而易见的,你的RoR应用所有的全文检索都要依赖后台再次向solr服务器发送web请求来获取结果,单个页面的执行速度肯定会受限于后台的跨http的web请求,这对于那些对全文检索功能依赖特别多的网站来说,恐怕很难接受”。 还有全文索引比较忌讳单个索引文件太大,如果太大,搜索的效率降低不说,做优化都 ...
by tovegar 2007-11-13 浏览 (231) 回复 (2) 关键字:

推荐ruby中文分词器 - RMMSeg

用RoR开发网站经常遇到的一个困扰就是Ruby缺乏良好的中文分词器,虽然ferret可以实现lucene的绝大部分功能,但是ferret自身并没有中文分词器,甚至连CJK两分分词器都没有,因此很多RoR网站不得不通过各种方式去访问lucene来解决分词问题,但RMMSeg项目发布以后,这一切已经成为历史。 RMMSeg是pluskid(浙江大学的学生)开发的ruby中文分词器,在2008年2月份 ...
by robbin 2008-03-05 浏览 (1877) 回复 (3) 关键字: rmmseg

Xapian - C++全文检索程序

Xapian是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而Xapian则填补了这个缺憾。 Xapian的api和检索原理和lucene在很多方面都很相似,但是也有一些地方存在不同,具体请看Xapian自己的文档:http://www.xapian.org/docs/ Xapi ...
by robbin 2008-05-27 浏览 (831) 回复 (4) 关键字: xapian

推荐知识库条目

Comming soon