《头文字D,Spider》的相关内容
相关圈子讨论
贴一段代码,测试用D写爬虫的能力
import std.stdio;
import std.string;
import std.conv;
import std.socket;
import std.socketstream;
import std.stream;
import std.regexp;
import std.thread;
import std.c.time;
char[][] g_qu ...
by fxsjy 2007-10-12 浏览 (427) 回复 (5)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle
SPProcPool 0.5 发布
SPProcPool 是一个 linux/unix 平台上的进程池服务器框架,使用 c++ 实现。
在 0.5 版中增加了一个类似 apache worker 的服务器模型。在之前 Leader/Follower 模型的基础上,在每个子进程中使用一个固定大小的线程池来为每个请求服务。这个模型的特点是能够支持较高的并发连接数。
项目主页:
http://code.google.com/p/spp ...
by iunknown 2008-01-05 浏览 (435) 回复 (0) 关键字: 进程池 prefork
如何使用Python和Google找到数以千计的Email地址
如何使用Python和Google找到数以千计的Email地址
注:本文只是用来学习和探讨Python的技术实现,不推荐用做spam,否则后果自负。
下面就是实际代码,写的很精巧:
#!/usr/bin/python
import sys
import re
import string
import httplib
import urllib2
import re
de ...
by QQbyte 2008-06-27 浏览 (651) 回复 (1) 关键字:

