ferret啊,为你欢喜为你忧。》的相关内容

JavaEye3.0开发手记之四 - ruby的全文检索

在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多,但是在RoR方面,就没有那么幸运了,JavaEye网站要做全文检索,怎么来解决全文检索的问题呢? 在ruby平台上面,全文检索有三个途径: 1、solr, acts_as_solr solr是apache开源组织的一个项目,完全基于lucene的最新版本,在lucene的上层提 ...
by robbin 2007-09-28 浏览 (10460) 回复 (17) 关键字:

使用libmmseg实现Ruby的中文分词功能

用Ruby on Rails开发web2.0网站的人都知道,ruby的全文检索功能不像Java支持的那样好,要提供中文的全文检索功能是一件很困难的事情,而偏偏全文检索是web2.0网站绕不过去的一道坎。虽然ruby也有类似lucene的全文检索软件ferret,但是ferret本身并没有提供中文分词功能,必须自己另行扩展中文分词功能。因此攻克ruby中文全文检索功能的瓶颈在于提供ruby的中文分词 ...
by robbin 2008-05-24 浏览 (2005) 回复 (9) 关键字: libmmseg

貌似rmmseg + ferret中文分词不是很好

用了一下ruby的中文分词rmmseg + ferret,发现rmmseg的中文分词并不是很好,比如:Hawkins开始了他第一部掌上电脑的设计构想。搜索“掌上电脑”并不能搜索到结果,但是如果把上面这一句改为:Hawkins开始了他第一部 掌上电脑 的设计构想。请注意“掌上电脑”两边的空格,这样的话,rmmseg就可以正确地分词了。 对英文的分词倒是很准确的(好像个个全文检索对英文分词都很强的吧 ...
by yangzhihuan 2008-10-05 浏览 (97) 回复 (2) 关键字:

JavaEye3.0开发手记之一 - 我的开发环境

JavaEye3.0的开发计划都喊了好久了,现在还刚刚开始,只完成了很少的一部分。为了3.0能够早日上线,我从这周开始把自己的大部分时间投入了编码工作。借这个机会,我准备边开发JavaEye3.0,边写写心得体会,与大家交流和分享使用RoR开发一个互联网web2.0网站的点点滴滴。 好了,开工!第一步就是搭建一个趁手的开发环境。我没有MacBook电脑,只有一台三年前买的IBM T40,跑Mac ...
by robbin 2007-08-16 浏览 (39710) 回复 (19) 关键字:

JavaEye3.0开发手记之三 - 狮身人面

Sphinx的含义是“狮身人面像”,是古埃及的金字塔建筑,传说Sphinx是有翼的狮身女怪,她常叫过路行人猜谜, 猜不出者即遭杀害。 但是我这里说的Sphinx是一个高性能的搜索引擎: http://www.sphinxsearch.com/ Sphinx是一个俄国人开发的搜索引擎,它的主要特点是: 一、性能非常出色 150万条记录一两分钟就索引完毕,2-4GB以内的文本检索速度不到0.1 ...
by robbin 2007-09-10 浏览 (15114) 回复 (25) 关键字:

ferret+acts_as_ferret+RMMSeg全文索引+中文分词的使用

首先,在ubuntu下要安装 atp-get install build-essential  zlib1g-dev ruby需要安装dev包 1、安装ferret sudo gem install ferret 2、安装acts_as_ferret 可用gem sudo gem install acts_as_ferret 或用plugins svn://projec ...
by wtb 2008-04-22 浏览 (393) 回复 (2) 关键字:

每天一剂Rails良药之acts_as_ferret

Ferret是Ruby的文本搜索引擎,它基于Apache Lucene 安装Ferret非常简单: gem install ferret Ferret是一堆C代码的Ruby代码封装,Ferret是针对Ruby的而不是RoR的 而Acts As Ferret则是针对RoR的 我们有两种方式安装Acts As Ferret: 1,以gem方式安装 gem install acts_a ...
by hideto 2007-06-12 浏览 (2707) 回复 (6) 关键字: rails acts_as_ferret

JavaEye3.0开发手记之四 - ruby的全文检索

在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多,但是在RoR方面,就没有那么幸运了,JavaEye网站要做全文检索,怎么来解决全文检索的问题呢? 在ruby平台上面,全文检索有三个途径: 1、solr, acts_as_solr solr是apache开源组织的一个项目,完全基于lucene的最新版本,在lucene的上层提 ...
by robbin 2007-09-28 浏览 (9834) 回复 (17) 关键字:

使用acts_as_ferret时碰到的问题

安装acts_as_ferret时,gem没有自动安装ferret 插件,调用时会报:no such file to load -- ferret 错误, 必须要安装ferret gem . 在windows中必须安装ferret的windows版本,如果安装非windows版本会报no such file to load -- ferret_ext 错误,这个错误是因为扩展部分的C代码没有被编译 ...
by easyfinger 2008-01-21 浏览 (374) 回复 (0) 关键字:

使用libmmseg实现Ruby的中文分词功能

用Ruby on Rails开发web2.0网站的人都知道,ruby的全文检索功能不像Java支持的那样好,要提供中文的全文检索功能是一件很困难的事情,而偏偏全文检索是web2.0网站绕不过去的一道坎。虽然ruby也有类似lucene的全文检索软件ferret,但是ferret本身并没有提供中文分词功能,必须自己另行扩展中文分词功能。因此攻克ruby中文全文检索功能的瓶颈在于提供ruby的中文分词 ...
by robbin 2008-05-24 浏览 (1844) 回复 (9) 关键字: libmmseg

在Red Hat Linux 上安装 WebSphere Application Server

WebSphere Application Server 是一种可在 Linux 上运行的,功能强大的全功能 Java 应用服务器。本文介绍了安装 WebSphere 和 Red Hat Linux 上的支持软件的细节,这可以帮助您避免代价高昂的延误。 WebSphere Application Server 是一种可在 Linux 上运行的,功能强大的全功能 Java 应用服务器。本文介绍了安装 ...
by IBM文章编辑 2007-08-07 浏览 (2932) 回复 (0)

安装WebSphere WAS应用服务器

IBM WebSphere Application Server提供了从电子商务的构建、发布到管理的能力。其标准版提供了开放、标准的平台。本文介绍介绍如何在Windows NT 上安装与配置WebSphere应用服务器。 WebSphere Application Server包括Servlet运行引擎、高性能的数据库连接程序,提供预连接、会话和状态管理的应用服务,WebSphere还支持XML ...
by IBM文章编辑 2007-08-07 浏览 (2453) 回复 (0)

有人上班也是用Ubuntu的么?

RT,我和小Sam上班都用
by Arbow 2006-11-06 浏览 (11770) 回复 (50)

有没有人愿意加入 dotmars 的开发

Dotmars 意图采用 .Net Framework 的总体设计,把 C# 实现的 Mono .net 类库移植到D语言。Dotmars 的实现中立于 tango 和 phobos,可以与二者之一同时使用。总之 dotmars 是一个面向D的对 .Net Framework 的改良和精炼。 .Mars 目前实现的部分有: dotmars.base.random 线程安全随机数发生器 dotma ...
by oldrev 2007-04-29 浏览 (3317) 回复 (43)

dxpcom v0.1 发布

由于windows上一直遇到DLL加载失败的问题,所以测试是在linux上进行的。 dxpcom v0.1下载地址 包括对xpidl的修改,增加了-m d选项,用来产生d接口。-m dwrap选项还在编写中,生成的代码现在还无法使用。 mozilla/xpcom/*.d大部分是用修改过的xpidl生成的,另有一些是使用htod工具转换的。 有空可以帮我测试一下,目前还不保证转换完全正确,但 ...
by qiezi 2007-04-16 浏览 (11093) 回复 (161)

推荐ruby中文分词器 - RMMSeg

用RoR开发网站经常遇到的一个困扰就是Ruby缺乏良好的中文分词器,虽然ferret可以实现lucene的绝大部分功能,但是ferret自身并没有中文分词器,甚至连CJK两分分词器都没有,因此很多RoR网站不得不通过各种方式去访问lucene来解决分词问题,但RMMSeg项目发布以后,这一切已经成为历史。 RMMSeg是pluskid(浙江大学的学生)开发的ruby中文分词器,在2008年2月份 ...
by robbin 2008-03-05 浏览 (2468) 回复 (3) 关键字: rmmseg

Xapian - C++全文检索程序

Xapian是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而Xapian则填补了这个缺憾。 Xapian的api和检索原理和lucene在很多方面都很相似,但是也有一些地方存在不同,具体请看Xapian自己的文档:http://www.xapian.org/docs/ Xapi ...
by robbin 2008-05-27 浏览 (1341) 回复 (5) 关键字: xapian

通过RoR ActiveRecord 进行全文检索(翻译)

我需要对我的文章进行全文检索,但是我不知道这些信息包含哪些关键字。你想知道答案吗。那就来吧,ferret 可以解答一切问题 ,我们继续说如果你不知道ferret 是什么的话请查看下面的连接 http://ferret.davebalmain.com/trac 如果你需要搜索关键字“Giant”,你需要创建一个索引ferret 在内存中(你需要安装ferret)所有 ...
by wuhua 2008-03-22 浏览 (509) 回复 (0) 关键字: activerecord

相关问答

赞助商链接