搜索引擎资料收集(转)》的相关内容

中文搜索引擎研究

1.为什么需要搜索引擎? 什么叫搜索引擎呢?Internet是一个巨大的信息资源宝库,几乎所有的Internet用户都希望宝库中的资源越来越丰富,使之应有尽有。每天都有新的主机被连接到Internet上,每天都有新的信息资源被增加到Internet中,使Internet中的信息以惊人的速度增长。然而Internet中的信息资源分散在无数台主机之中,如果用户想将所有主机中的信息都做一番详尽的考察,无 ...
by mfcai 2008-02-25 浏览 (1054) 回复 (1) 关键字:

Lucene中文分词“庖丁解牛”

 Lucene中文分词 “庖丁解牛”  附件 为本人设计编写的组件,中文分词“庖丁解牛”,具有相当好的使用价值。。。 高效率:我的赛扬PC 1 秒解析 >>> 20000汉字的词语  (实际测试结果数据,可达1秒10万+汉字。) 高可维护性:使用“庖丁”隐喻,形象明晰 ...
by Qieqie 2007-01-23 浏览 (52990) 回复 (69) 关键字: 设计模式, 中文分词, 庖丁解牛, 庖丁, lucene

搜索引擎资料收集(转)

搜索引擎学习资源收集 一、搜索引擎技术/动态资源 <一>、综合类 1、卢亮的搜索引擎研究 http://www.wespoke.com/ 卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验, ...
by weiwu83 2007-12-17 浏览 (213) 回复 (0) 关键字:

搜索引擎学习资源(作者:dongdonglang)

 搜索引擎学习资源收集作者:dongdonglang   http://www.dunsh.org/forums/thread-2716-1-2.html一、搜索引擎技术/动态资源<一>、综合类1、卢亮的搜索引擎研究    http://www.wespoke.com/卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索 ...
by shake863 2007-08-23 浏览 (85) 回复 (0) 关键字:

搜索引擎学习资源收集

http://www.zhihere.com/bbs/dispbbs.asp?boardid=8&id=630 一、搜索引擎技术/动态资源 <一>、综合类 1、卢亮的搜索引擎研究    [URL=http://www.wespoke.com/][/URL]http://www.wespoke.com/ 卢亮属于搜索引擎开发上的专家,以前 ...
by jeafyezheng 2006-09-29 浏览 (138) 回复 (0) 关键字:

搜索引擎学习资源收集

一、搜索引擎技术/动态资源 <一>、综合类 1、卢亮的搜索引擎研究    [URL=http://www.wespoke.com/][/URL]http://www.wespoke.com/ 卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"([URL=http://booso.com/][/URL]http: ...
by lmx800 2007-01-08 浏览 (755) 回复 (0) 关键字:

搜索引擎/网络蜘蛛程序源代码

国外开发的相关程序1、Nutch官方网站 http://www.nutch.org/中文站点 http://www.nutchchina.com/最新版本:Nutch 0.7.2 ReleasedNutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网的搜索引擎,也可以针对整个网络建立搜索引擎。自由(Free)而免费(Free)。2、Luce ...
by rcyl2003 2007-09-10 浏览 (128) 回复 (0) 关键字:

Wxd GDC 新版发布

WXD 下载地址 http://sourceforge.net/project/showfiles.php?group_id=133831&package_id=147503
by tomqyp 2007-08-22 浏览 (285) 回复 (0)

如何运行watij

Download Watij Click here to get the current release of Watij Unzip the watij_X_x.x.zip Note: You can also [Get the Latest Source] and build it yourself Setting up Place the jniw ...
by sole 2008-05-29 浏览 (360) 回复 (0)

google search

这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文 本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000 ‘000个网页。我们可以从 http://google.stanford.edu/ 下载。 设 计搜索引擎 ...
by dogstar 2008-05-29 浏览 (581) 回复 (0)

来,排队自报家门,统计下

我,习惯id:J.L, 现在居于上海, 工作:专职搜索。空余时间: lucene推广和宣传,搜索技术商业方案(不包括与现在公司竞争的企业)。2007年的方向: 深度挖掘数据(大规模搜索平台), 广度挖掘商机(商业顾问)。 2005年接触lucene,2006年正式接触lucene。 下面同学排好队哦。
by imjl 2007-06-21 浏览 (4962) 回复 (42)

菜鸟求助EC Side使用问题

在WebContent\WEB-INF\lib下面的filelist.txt文件中的jar包我需要上那去下载呢。 我下载的是ECSider的ecside_1[1].1_final_20070213版本。这是不是一个完整的工具呀。
by hyzhangjun 2008-04-03 浏览 (480) 回复 (2)

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)    以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

Taylor MDA 1.1.0 模型驱动工具发布

Taylor开发团队宣布Taylor MDA 1.1.0 发布。Taylor MDA是一个基于Eclipse的UML建模工具和代码生成工具。它根据公约和规定从UML模型中最大限度的自动生成代码。 点击观看基本功能操作video,在这个video中,一个简单的JPA entity 代码被自动生成,包括properties 和annotations代码。Taylor MDA不仅能够生成entity ...
by withyou 2008-02-27 浏览 (943) 回复 (2) 关键字:

相关问答

赞助商链接