昨日网摘 [2006-12-25:anux @ del.icio.us]》的相关内容

使用libmmseg实现Ruby的中文分词功能

用Ruby on Rails开发web2.0网站的人都知道,ruby的全文检索功能不像Java支持的那样好,要提供中文的全文检索功能是一件很困难的事情,而偏偏全文检索是web2.0网站绕不过去的一道坎。虽然ruby也有类似lucene的全文检索软件ferret,但是ferret本身并没有提供中文分词功能,必须自己另行扩展中文分词功能。因此攻克ruby中文全文检索功能的瓶颈在于提供ruby的中文分词 ...
by robbin 2008-05-24 浏览 (1752) 回复 (8) 关键字: libmmseg

JavaEye3.0开发手记之四 - ruby的全文检索

在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多,但是在RoR方面,就没有那么幸运了,JavaEye网站要做全文检索,怎么来解决全文检索的问题呢? 在ruby平台上面,全文检索有三个途径: 1、solr, acts_as_solr solr是apache开源组织的一个项目,完全基于lucene的最新版本,在lucene的上层提 ...
by robbin 2007-09-28 浏览 (10141) 回复 (17) 关键字:

使用acts_as_ferret时碰到的问题

安装acts_as_ferret时,gem没有自动安装ferret 插件,调用时会报:no such file to load -- ferret 错误, 必须要安装ferret gem . 在windows中必须安装ferret的windows版本,如果安装非windows版本会报no such file to load -- ferret_ext 错误,这个错误是因为扩展部分的C代码没有被编译 ...
by easyfinger 2008-01-21 浏览 (374) 回复 (0) 关键字:

寻找Ruby实现的分词库

中文也能分更好 我查了查Ferret的API,但是好像没看到Analysis下那个类是分词用的,不是说Ferret是Lucene的实现么?
by Jin 2007-04-02 浏览 (830) 回复 (0) 关键字: 问题

《唐山警示录》转载

《唐山警示录》全文转载 时间:2006/07/29 出处:凯迪网络 http://club.cat898.com/newbbs/dispbbs.asp?boardID=1&ID=1207864&page=1
by Feiing 2008-05-18 浏览 (41) 回复 (4)

下一个最赚钱的行业?新经济观察:人类(尤其是女性)逐渐摆脱生育桎梏,女人暴富时代来临

女性育龄不再受到更年期的限制。一生的400多个卵子可以提前保存起来。 http://tech.sina.com.cn/d/2006-10-31/10261211880.shtml 美国越来越多单身女性冷冻卵子 http://www.sina.com.cn 2006年10月31日 10:26 人民网-人民日报海外版   据新华社华盛顿10月28日电 (记者张忠霞)美国研究人员对纽约市单身女 ...
by buaawhl 2006-12-01 浏览 (677) 回复 (7)

满怀革命热情强烈推荐小小强书一本

《怎样鉴别黄色歌曲》,人民音乐出版社,1982年 里面很多作者现在都已经“德高望重” 目录 一种精神腐蚀剂................................................伍雍谊 ——对我国三十、四十年代黄色歌曲的认识 怎样看待港台“流行歌曲”......................................周荫昌 关于“流行音乐”的对话...... ...
by mochow 2007-04-27 浏览 (437) 回复 (2)

一个电影诗人的访谈——塔可夫斯基访谈录 [转帖]

译者:xian 来源:GO!MOVIE电影论坛/江苏碟友会 一.关于《安德烈鲁布廖夫》   鲁布廖夫所遭受过的苦难并不是个什么特例,因为一个艺术家永远不可能在一个理想中的完美环境下存活,除非有某种苦难在纠缠着他的心灵,否则他将毫无灵感。艺术家存在因为世界的不完美,而一旦这个世界完美无缺,艺术将毫无价值。就像普通人不会成天寻觅完美和谐的意义,但他们会简单地试图保持这种生活状态。而艺术的产生却 ...
by mochow 2007-02-06 浏览 (278) 回复 (0)

推荐ruby中文分词器 - RMMSeg

用RoR开发网站经常遇到的一个困扰就是Ruby缺乏良好的中文分词器,虽然ferret可以实现lucene的绝大部分功能,但是ferret自身并没有中文分词器,甚至连CJK两分分词器都没有,因此很多RoR网站不得不通过各种方式去访问lucene来解决分词问题,但RMMSeg项目发布以后,这一切已经成为历史。 RMMSeg是pluskid(浙江大学的学生)开发的ruby中文分词器,在2008年2月份 ...
by robbin 2008-03-05 浏览 (2297) 回复 (3) 关键字: rmmseg

用Adobe AIR开发的Twitter客户端软件Spaz

Adobe公司的AIR是一种基于Flash技术的RIA技术(富客户端技术),虽然AIR现在还是beta2版本,但是无法阻止相当多前卫的开发人员使用AIR这一技术开发能够跨操作系统平台的互联网桌面应用。 Ed Finkler使用AIR开发了一个Twitter的客户端软件Spaz,能够通过下载到桌面自动部署,和Twitter网站实现交互,下载的地址: http://funkatron.com/in ...
by robbin 2007-10-21 浏览 (606) 回复 (0) 关键字: AIR

通过RoR ActiveRecord 进行全文检索(翻译)

我需要对我的文章进行全文检索,但是我不知道这些信息包含哪些关键字。你想知道答案吗。那就来吧,ferret 可以解答一切问题 ,我们继续说如果你不知道ferret 是什么的话请查看下面的连接 http://ferret.davebalmain.com/trac 如果你需要搜索关键字“Giant”,你需要创建一个索引ferret 在内存中(你需要安装ferret)所有 ...
by wuhua 2008-03-22 浏览 (487) 回复 (0) 关键字: activerecord

相关问答

赞助商链接