毕业设计6---web网页自动分类(开题报告)3.27》的相关内容

毕业设计5---web网页自动分类(carrot2初步研究)

最好的搜索引擎开发交流社区 http://www.zhuayu.net       也可以加入qq群:  38707929 找不到数据挖掘的版块, 而这个课题的建立是基于STUCTS的,所以发在这里也未尝不可^_^.         好久没写 ...
by fullfocus 2007-03-24 浏览 (7026) 回复 (13) 关键字: 自动分类 聚类 carrot2 vsm stc

毕业设计4---爬虫的研究

   昨天研究的NUTCH, 是个完整的项目,虽然功能很强, 但据说自定义性并不是很出色(自己还没有时间去时间一下), 所以现在有必要研究一下单纯的Crawl, 这里有JSPIDER(java), LARBIN(c++, 好像一定要在LINUX环境下,不知道有没有WINDOWS版的), websphinx(java)。(另外carrot2 聚类搜索也挺有意思,LARBIN的相关 ...
by fullfocus 2007-03-03 浏览 (1523) 回复 (1) 关键字: 毕设 爬虫模块

搜索概念

1 互联网搜索 其实搜索的这个核心就是分词与PageRank算法,择日和大家讨论具体的实现,依靠PR算法,sogou 3.0的搜索结果相当不错,如果融入人工智能、数据挖掘自然语言理解等最新信息技术成果的搜索引擎,将会给用户带来了一种方便、易用、灵活的检索方式,为用户提供的是详实、准确、直接的信息。 这部分讨论几种特色搜索,概念检索是以概念为核心,这种方式一改以关键词核心的搜索模式,借助概念词典 ...
by wind_bell 2007-05-17 浏览 (1395) 回复 (0) 关键字:

毕业设计5---web网页自动分类(carrot2初步研究)

最好的搜索引擎开发交流社区 http://www.zhuayu.net       也可以加入qq群:  38707929 找不到数据挖掘的版块, 而这个课题的建立是基于STUCTS的,所以发在这里也未尝不可^_^.         好久没写 ...
by fullfocus 2007-03-24 浏览 (5479) 回复 (13) 关键字: 自动分类 聚类 carrot2 vsm stc

毕业设计4---爬虫的研究

   昨天研究的NUTCH, 是个完整的项目,虽然功能很强, 但据说自定义性并不是很出色(自己还没有时间去时间一下), 所以现在有必要研究一下单纯的Crawl, 这里有JSPIDER(java), LARBIN(c++, 好像一定要在LINUX环境下,不知道有没有WINDOWS版的), websphinx(java)。(另外carrot2 聚类搜索也挺有意思,LARBIN的相关 ...
by fullfocus 2007-03-03 浏览 (1293) 回复 (1) 关键字: 毕设 爬虫模块

Web 文本挖掘(TextMining)技术

Web 文本挖掘(TextMining)技术[日期:2007-01-04]来源:  作者:[字体:大 中 小] 文本挖掘的起源  文本数据库(web文档数据)  半结构化数据(semistructure data)  信息检索技术(information retrieval)  Web文本挖掘的过程   Web文本挖掘的一般处理过程     特征的建立   特征集的缩减   学习与知识模 ...
by 晨星★~雨泪 2008-03-24 浏览 (224) 回复 (0) 关键字:

搜索概念

1 互联网搜索 其实搜索的这个核心就是分词与PageRank算法,择日和大家讨论具体的实现,依靠PR算法,sogou 3.0的搜索结果相当不错,如果融入人工智能、数据挖掘自然语言理解等最新信息技术成果的搜索引擎,将会给用户带来了一种方便、易用、灵活的检索方式,为用户提供的是详实、准确、直接的信息。 这部分讨论几种特色搜索,概念检索是以概念为核心,这种方式一改以关键词核心的搜索模式,借助概念词典 ...
by wind_bell 2007-05-17 浏览 (965) 回复 (0) 关键字:

信息检索知识-SEOer必备知识

信息检索技术简介为了使读者对信息检索研究的进展有更深的了解,这里我们简单介绍一下信息检索技术的基本原理。信息检索系统流程大致如下图所示:总体上,系统可分为四个部分:1. 数据预处理,2.索引生成,3. 查询处理,4. 检索。下面我们分别对各个部分采用的技术加以介绍。1. 数据预处理        目前检索系统的主要数据来源是Web,格式包 ...
by wangdei 2008-05-19 浏览 (110) 回复 (0) 关键字:

google search

这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文 本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000 ‘000个网页。我们可以从 http://google.stanford.edu/ 下载。 设 计搜索引擎 ...
by dogstar 2008-05-29 浏览 (443) 回复 (0)

google背后的分布式架构

Google背后的分布式计算架构策略 Google是与众不同的。它的独特不仅仅表现于革新的思维和充满创意的应用 (比如那个大堂里的地球模型),更在于其有别常规的IT策略……   加利福尼亚州山景城(Mountain View)Google公司(Google,下称Google)总部有一个43号大楼,该建筑的中央大屏幕上显示着一个与Google地球(Google Earth)相仿的世界地图,一个转动 ...
by dogstar 2008-05-29 浏览 (1658) 回复 (0)

推荐系统

/** *作者:张荣华 *日期:2008-3-9 **/ 先说一说问题,不知道大家有没有这样的经验,反正我是经常碰到。 举例1,某些网站每隔几天就发邮件给我,每次发的邮件内容都是一些我根本不感兴趣的东西,我不甚其扰,对其深恶痛绝。 举例2,添加具有某功能的一个msn机器人,每天都有几次突然蹦出一个窗口,推荐一堆我根本不想知道的内容,烦不烦啊, 我只好将你阻 ...
by ahuaxuan 2008-06-10 浏览 (162) 回复 (1)

看来下一步是需要用flex做一个应用系统的框架了

大家有什么好的建议和思路吗
by fourfire 2008-03-05 浏览 (4447) 回复 (21)

32个SEO方法提高网站的流量

32个SEO方法提高网站的流量: 1. title的重要性:Title是整个html在搜索引擎搜索结果中返回的第一要素,是最为核心的关键字词,建议不超过100个字节。 2. 关键词在Meta Keywords中的使用应注意以下几点:(1) 确信使用的关键词出现在网页文本中;(2) 不要重复使用关键词;(3) 每个网页的关键词应该不一样;(4) 一个网页的关键词标签里应该包含3-5个最重要的关 ...
by ╱/罒呍唲 2008-08-13 浏览 (1372) 回复 (3) 关键字: 提高网站的流量 seo

相关问答

赞助商链接