头文字D,Spider》的相关内容

贴一段代码,测试用D写爬虫的能力

import std.stdio; import std.string; import std.conv; import std.socket; import std.socketstream; import std.stream; import std.regexp; import std.thread; import std.c.time; char[][] g_qu ...
by fxsjy 2007-10-12 浏览 (427) 回复 (5)

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)    以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

SPProcPool 0.5 发布

SPProcPool 是一个 linux/unix 平台上的进程池服务器框架,使用 c++ 实现。 在 0.5 版中增加了一个类似 apache worker 的服务器模型。在之前 Leader/Follower 模型的基础上,在每个子进程中使用一个固定大小的线程池来为每个请求服务。这个模型的特点是能够支持较高的并发连接数。 项目主页: http://code.google.com/p/spp ...
by iunknown 2008-01-05 浏览 (435) 回复 (0) 关键字: 进程池 prefork

如何使用Python和Google找到数以千计的Email地址

如何使用Python和Google找到数以千计的Email地址 注:本文只是用来学习和探讨Python的技术实现,不推荐用做spam,否则后果自负。 下面就是实际代码,写的很精巧: #!/usr/bin/python import sys import re import string import httplib import urllib2 import re de ...
by QQbyte 2008-06-27 浏览 (651) 回复 (1) 关键字:

相关问答

赞助商链接