《ferret啊,为你欢喜为你忧。》的相关内容
相关讨论
JavaEye3.0开发手记之四 - ruby的全文检索
在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多,但是在RoR方面,就没有那么幸运了,JavaEye网站要做全文检索,怎么来解决全文检索的问题呢?
在ruby平台上面,全文检索有三个途径:
1、solr, acts_as_solr
solr是apache开源组织的一个项目,完全基于lucene的最新版本,在lucene的上层提 ...
by robbin 2007-09-28 浏览 (10460) 回复 (17) 关键字:
使用libmmseg实现Ruby的中文分词功能
用Ruby on Rails开发web2.0网站的人都知道,ruby的全文检索功能不像Java支持的那样好,要提供中文的全文检索功能是一件很困难的事情,而偏偏全文检索是web2.0网站绕不过去的一道坎。虽然ruby也有类似lucene的全文检索软件ferret,但是ferret本身并没有提供中文分词功能,必须自己另行扩展中文分词功能。因此攻克ruby中文全文检索功能的瓶颈在于提供ruby的中文分词 ...
by robbin 2008-05-24 浏览 (2005) 回复 (9) 关键字: libmmseg
貌似rmmseg + ferret中文分词不是很好
用了一下ruby的中文分词rmmseg + ferret,发现rmmseg的中文分词并不是很好,比如:Hawkins开始了他第一部掌上电脑的设计构想。搜索“掌上电脑”并不能搜索到结果,但是如果把上面这一句改为:Hawkins开始了他第一部 掌上电脑 的设计构想。请注意“掌上电脑”两边的空格,这样的话,rmmseg就可以正确地分词了。
对英文的分词倒是很准确的(好像个个全文检索对英文分词都很强的吧 ...
by yangzhihuan 2008-10-05 浏览 (97) 回复 (2) 关键字:
JavaEye3.0开发手记之一 - 我的开发环境
JavaEye3.0的开发计划都喊了好久了,现在还刚刚开始,只完成了很少的一部分。为了3.0能够早日上线,我从这周开始把自己的大部分时间投入了编码工作。借这个机会,我准备边开发JavaEye3.0,边写写心得体会,与大家交流和分享使用RoR开发一个互联网web2.0网站的点点滴滴。
好了,开工!第一步就是搭建一个趁手的开发环境。我没有MacBook电脑,只有一台三年前买的IBM T40,跑Mac ...
by robbin 2007-08-16 浏览 (39710) 回复 (19) 关键字:
JavaEye3.0开发手记之三 - 狮身人面
Sphinx的含义是“狮身人面像”,是古埃及的金字塔建筑,传说Sphinx是有翼的狮身女怪,她常叫过路行人猜谜, 猜不出者即遭杀害。
但是我这里说的Sphinx是一个高性能的搜索引擎:
http://www.sphinxsearch.com/
Sphinx是一个俄国人开发的搜索引擎,它的主要特点是:
一、性能非常出色
150万条记录一两分钟就索引完毕,2-4GB以内的文本检索速度不到0.1 ...
by robbin 2007-09-10 浏览 (15114) 回复 (25) 关键字:
相关博客
ferret+acts_as_ferret+RMMSeg全文索引+中文分词的使用
首先,在ubuntu下要安装
atp-get install build-essential zlib1g-dev
ruby需要安装dev包
1、安装ferret
sudo gem install ferret
2、安装acts_as_ferret
可用gem
sudo gem install acts_as_ferret
或用plugins
svn://projec ...
by wtb 2008-04-22 浏览 (393) 回复 (2) 关键字:
每天一剂Rails良药之acts_as_ferret
Ferret是Ruby的文本搜索引擎,它基于Apache Lucene
安装Ferret非常简单:
gem install ferret
Ferret是一堆C代码的Ruby代码封装,Ferret是针对Ruby的而不是RoR的
而Acts As Ferret则是针对RoR的
我们有两种方式安装Acts As Ferret:
1,以gem方式安装
gem install acts_a ...
by hideto 2007-06-12 浏览 (2707) 回复 (6) 关键字: rails acts_as_ferret
JavaEye3.0开发手记之四 - ruby的全文检索
在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多,但是在RoR方面,就没有那么幸运了,JavaEye网站要做全文检索,怎么来解决全文检索的问题呢?
在ruby平台上面,全文检索有三个途径:
1、solr, acts_as_solr
solr是apache开源组织的一个项目,完全基于lucene的最新版本,在lucene的上层提 ...
by robbin 2007-09-28 浏览 (9834) 回复 (17) 关键字:
使用acts_as_ferret时碰到的问题
安装acts_as_ferret时,gem没有自动安装ferret 插件,调用时会报:no such file to load -- ferret 错误, 必须要安装ferret gem .
在windows中必须安装ferret的windows版本,如果安装非windows版本会报no such file to load -- ferret_ext 错误,这个错误是因为扩展部分的C代码没有被编译 ...
by easyfinger 2008-01-21 浏览 (374) 回复 (0) 关键字:
使用libmmseg实现Ruby的中文分词功能
用Ruby on Rails开发web2.0网站的人都知道,ruby的全文检索功能不像Java支持的那样好,要提供中文的全文检索功能是一件很困难的事情,而偏偏全文检索是web2.0网站绕不过去的一道坎。虽然ruby也有类似lucene的全文检索软件ferret,但是ferret本身并没有提供中文分词功能,必须自己另行扩展中文分词功能。因此攻克ruby中文全文检索功能的瓶颈在于提供ruby的中文分词 ...
by robbin 2008-05-24 浏览 (1844) 回复 (9) 关键字: libmmseg
相关圈子讨论
在Red Hat Linux 上安装 WebSphere Application Server
WebSphere Application Server 是一种可在 Linux 上运行的,功能强大的全功能 Java 应用服务器。本文介绍了安装 WebSphere 和 Red Hat Linux 上的支持软件的细节,这可以帮助您避免代价高昂的延误。
WebSphere Application Server 是一种可在 Linux 上运行的,功能强大的全功能 Java 应用服务器。本文介绍了安装 ...
by IBM文章编辑 2007-08-07 浏览 (2932) 回复 (0)
安装WebSphere WAS应用服务器
IBM WebSphere Application Server提供了从电子商务的构建、发布到管理的能力。其标准版提供了开放、标准的平台。本文介绍介绍如何在Windows NT 上安装与配置WebSphere应用服务器。
WebSphere Application Server包括Servlet运行引擎、高性能的数据库连接程序,提供预连接、会话和状态管理的应用服务,WebSphere还支持XML ...
by IBM文章编辑 2007-08-07 浏览 (2453) 回复 (0)
有没有人愿意加入 dotmars 的开发
Dotmars 意图采用 .Net Framework 的总体设计,把 C# 实现的 Mono .net 类库移植到D语言。Dotmars 的实现中立于 tango 和 phobos,可以与二者之一同时使用。总之 dotmars 是一个面向D的对 .Net Framework 的改良和精炼。
.Mars 目前实现的部分有:
dotmars.base.random 线程安全随机数发生器
dotma ...
by oldrev 2007-04-29 浏览 (3317) 回复 (43)
dxpcom v0.1 发布
由于windows上一直遇到DLL加载失败的问题,所以测试是在linux上进行的。
dxpcom v0.1下载地址
包括对xpidl的修改,增加了-m d选项,用来产生d接口。-m dwrap选项还在编写中,生成的代码现在还无法使用。
mozilla/xpcom/*.d大部分是用修改过的xpidl生成的,另有一些是使用htod工具转换的。
有空可以帮我测试一下,目前还不保证转换完全正确,但 ...
by qiezi 2007-04-16 浏览 (11093) 回复 (161)
相关新闻
推荐ruby中文分词器 - RMMSeg
用RoR开发网站经常遇到的一个困扰就是Ruby缺乏良好的中文分词器,虽然ferret可以实现lucene的绝大部分功能,但是ferret自身并没有中文分词器,甚至连CJK两分分词器都没有,因此很多RoR网站不得不通过各种方式去访问lucene来解决分词问题,但RMMSeg项目发布以后,这一切已经成为历史。
RMMSeg是pluskid(浙江大学的学生)开发的ruby中文分词器,在2008年2月份 ...
by robbin 2008-03-05 浏览 (2468) 回复 (3) 关键字: rmmseg
Xapian - C++全文检索程序
Xapian是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而Xapian则填补了这个缺憾。
Xapian的api和检索原理和lucene在很多方面都很相似,但是也有一些地方存在不同,具体请看Xapian自己的文档:http://www.xapian.org/docs/
Xapi ...
by robbin 2008-05-27 浏览 (1341) 回复 (5) 关键字: xapian
通过RoR ActiveRecord 进行全文检索(翻译)
我需要对我的文章进行全文检索,但是我不知道这些信息包含哪些关键字。你想知道答案吗。那就来吧,ferret 可以解答一切问题 ,我们继续说如果你不知道ferret 是什么的话请查看下面的连接 http://ferret.davebalmain.com/trac 如果你需要搜索关键字“Giant”,你需要创建一个索引ferret 在内存中(你需要安装ferret)所有 ...
by wuhua 2008-03-22 浏览 (509) 回复 (0) 关键字: activerecord

