《毕业设计6---web网页自动分类(开题报告)3.27》的相关内容
相关讨论
毕业设计5---web网页自动分类(carrot2初步研究)
最好的搜索引擎开发交流社区 http://www.zhuayu.net
也可以加入qq群: 38707929
找不到数据挖掘的版块, 而这个课题的建立是基于STUCTS的,所以发在这里也未尝不可^_^.
好久没写 ...
by fullfocus 2007-03-24 浏览 (7026) 回复 (13) 关键字: 自动分类 聚类 carrot2 vsm stc
毕业设计4---爬虫的研究
昨天研究的NUTCH, 是个完整的项目,虽然功能很强, 但据说自定义性并不是很出色(自己还没有时间去时间一下), 所以现在有必要研究一下单纯的Crawl, 这里有JSPIDER(java), LARBIN(c++, 好像一定要在LINUX环境下,不知道有没有WINDOWS版的), websphinx(java)。(另外carrot2 聚类搜索也挺有意思,LARBIN的相关 ...
by fullfocus 2007-03-03 浏览 (1523) 回复 (1) 关键字: 毕设 爬虫模块
相关博客
毕业设计5---web网页自动分类(carrot2初步研究)
最好的搜索引擎开发交流社区 http://www.zhuayu.net
也可以加入qq群: 38707929
找不到数据挖掘的版块, 而这个课题的建立是基于STUCTS的,所以发在这里也未尝不可^_^.
好久没写 ...
by fullfocus 2007-03-24 浏览 (5479) 回复 (13) 关键字: 自动分类 聚类 carrot2 vsm stc
毕业设计4---爬虫的研究
昨天研究的NUTCH, 是个完整的项目,虽然功能很强, 但据说自定义性并不是很出色(自己还没有时间去时间一下), 所以现在有必要研究一下单纯的Crawl, 这里有JSPIDER(java), LARBIN(c++, 好像一定要在LINUX环境下,不知道有没有WINDOWS版的), websphinx(java)。(另外carrot2 聚类搜索也挺有意思,LARBIN的相关 ...
by fullfocus 2007-03-03 浏览 (1293) 回复 (1) 关键字: 毕设 爬虫模块
Web 文本挖掘(TextMining)技术
Web 文本挖掘(TextMining)技术[日期:2007-01-04]来源: 作者:[字体:大 中 小] 文本挖掘的起源 文本数据库(web文档数据) 半结构化数据(semistructure data) 信息检索技术(information retrieval) Web文本挖掘的过程 Web文本挖掘的一般处理过程 特征的建立 特征集的缩减 学习与知识模 ...
by 晨星★~雨泪 2008-03-24 浏览 (224) 回复 (0) 关键字:
信息检索知识-SEOer必备知识
信息检索技术简介为了使读者对信息检索研究的进展有更深的了解,这里我们简单介绍一下信息检索技术的基本原理。信息检索系统流程大致如下图所示:总体上,系统可分为四个部分:1. 数据预处理,2.索引生成,3. 查询处理,4. 检索。下面我们分别对各个部分采用的技术加以介绍。1. 数据预处理 目前检索系统的主要数据来源是Web,格式包 ...
by wangdei 2008-05-19 浏览 (110) 回复 (0) 关键字:
相关圈子讨论
google search
这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文 本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000 ‘000个网页。我们可以从 http://google.stanford.edu/ 下载。
设 计搜索引擎 ...
by dogstar 2008-05-29 浏览 (443) 回复 (0)
google背后的分布式架构
Google背后的分布式计算架构策略
Google是与众不同的。它的独特不仅仅表现于革新的思维和充满创意的应用 (比如那个大堂里的地球模型),更在于其有别常规的IT策略……
加利福尼亚州山景城(Mountain View)Google公司(Google,下称Google)总部有一个43号大楼,该建筑的中央大屏幕上显示着一个与Google地球(Google Earth)相仿的世界地图,一个转动 ...
by dogstar 2008-05-29 浏览 (1658) 回复 (0)
相关新闻
32个SEO方法提高网站的流量
32个SEO方法提高网站的流量:
1. title的重要性:Title是整个html在搜索引擎搜索结果中返回的第一要素,是最为核心的关键字词,建议不超过100个字节。
2. 关键词在Meta Keywords中的使用应注意以下几点:(1) 确信使用的关键词出现在网页文本中;(2) 不要重复使用关键词;(3) 每个网页的关键词应该不一样;(4) 一个网页的关键词标签里应该包含3-5个最重要的关 ...
by ╱/罒呍唲 2008-08-13 浏览 (1372) 回复 (3) 关键字: 提高网站的流量 seo

