《搜索引擎Nutch源代码研究之一 网页抓取(2)》的相关内容
相关讨论
MSNP 实现
MSNP 是Windows/Live Messenger基于的协议, 实现消息通信。 建立于HTTP协议之上。
一下方法分别提供对其操作:
/// File: MsnSharp\Msn\MsnComm.cs
///
/// ------------------------------------------------------------
/// Copyright (c) 20 ...
by archmaster 2007-08-31 浏览 (2221) 回复 (12) 关键字:
JAVA发送HTTP请求,返回HTTP响应内容,实例及应用
JDK中提供了一些对无状态协议请求(HTTP)的支持,下面我就将我所写的一个小例子(组件)进行描述: 首先让我们先构建一个请求类(HttpRequester)。 该类封装了JAVA实现简单请求的代码,如下:import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
im ...
by yymmiinngg 2008-01-09 浏览 (1263) 回复 (3) 关键字:
命令行交互的一种Java实现
现在服务器远程控制一般都是web方式实现的,这种方式体现的最明显的是J2EE应用服务器;当然为了操作方便,有些服务器也提供GUI客户端,
不过笔者比较喜欢字符终端,我想有很多人同笔者一样,在这里,向大家介绍一个Java实现的命令行程序,这是笔者当时阅读OBE(一个Workflow Engine)
的源代码时的收获,把代码调整了一下,版权就不属于Adrian ...
by lxjchengcu 2007-06-05 浏览 (1318) 回复 (0) 关键字: java
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6,je ...
by brunoplum 2008-03-30 浏览 (1161) 回复 (7) 关键字:
相关博客
在j2me中载入propreties资源
public Properties load(String res) throws IOException
{
Properties prop = new Properties();
DataInputStream is = null;
try
{
is = new DataInpu ...
by pickerel 2008-01-14 浏览 (121) 回复 (0) 关键字: j2me
JAVA发送HTTP请求,返回HTTP响应内容,实例及应用
JDK中提供了一些对无状态协议请求(HTTP)的支持,下面我就将我所写的一个小例子(组件)进行描述: 首先让我们先构建一个请求类(HttpRequester)。 该类封装了JAVA实现简单请求的代码,如下:import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
im ...
by yymmiinngg 2008-01-09 浏览 (794) 回复 (3) 关键字:
相关圈子讨论
贴一段代码,测试用D写爬虫的能力
import std.stdio;
import std.string;
import std.conv;
import std.socket;
import std.socketstream;
import std.stream;
import std.regexp;
import std.thread;
import std.c.time;
char[][] g_qu ...
by fxsjy 2007-10-12 浏览 (354) 回复 (5)
骑士聚会(《程序员》的算法擂台)
在8×8的棋盘上分布着n个骑士,他们想约在某一个格中聚会。骑士每天可以像国际象棋中的马那样移动一次,可以从中间向8个方向移动,请你计算n个骑士的最早聚会地点和要走多少天,要求尽早聚会,且n个人走的总步数最少,先到聚会地点的骑士可以不再移动等待其他的骑士。
从键盘输入n(0<n<=64),然后一次输入n个其实的初始位置xi,yi(0<=xi,y<=7)。屏幕输出以空格分割的三 ...
by snowind9 2007-09-06 浏览 (973) 回复 (16)
请教学习JSF中的一点疑问
也是刚刚开始学习jsf,还有点不适应这种服务器大包大揽的方式。
有几个问题一直解决不了,网上也没搜出答案,看看那位仁兄能帮帮给解答一下,。
1.分页的问题,现在用的是扩展Datamodual的方式,感觉很不舒服,一个bean只能输出一组数据,不过问题不大,基本需要分页的才使用这种方式,只是不知道还有没有其他更好的方式了。
2.就是bean的带参数方法怎么调用,有的人说是加个commandlink传 ...
by 风之狐 2008-05-12 浏览 (915) 回复 (17)
一次对LCS的TDD过程
首先根据TDD原则,给出测试用例
package graph;
import junit.framework.TestCase;
/**
* @author B.Chen
*/
public class TestLCS extends TestCase {
public TestLCS(String name) {
super(name ...
by leon_a 2007-09-26 浏览 (383) 回复 (3)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1225) 回复 (6) 关键字: spindle
SPProcPool 0.5 发布
SPProcPool 是一个 linux/unix 平台上的进程池服务器框架,使用 c++ 实现。
在 0.5 版中增加了一个类似 apache worker 的服务器模型。在之前 Leader/Follower 模型的基础上,在每个子进程中使用一个固定大小的线程池来为每个请求服务。这个模型的特点是能够支持较高的并发连接数。
项目主页:
http://code.google.com/p/spp ...
by iunknown 2008-01-05 浏览 (357) 回复 (0) 关键字: 进程池 prefork
基于JavaScript的代码自动生成工具
JavaScript Based Code Generator - codegen 工具主页http://sourceforge.net/projects/jbcgen/目的快速生成程序代码, 比如Struts, Spring, Jdbc/Hibernate所有前后台的代码.简单介绍本工具生成代码的思想是读取数据库中表的结构, 使用JavaScript作为脚本语言编写模板, 生成各种代码或者文件, ...
by jejwe 2008-03-06 浏览 (2458) 回复 (2) 关键字:
推荐知识库条目
Comming soon

