解析html,还是jericho html parser 好用》的相关内容

我正在开发一个只要建了数据库就自动生成DAO,ACTIONFORM,JSP...

我正在开发一个只要建了数据库就自动生成DAO,ACTIONFORM,JSP的工具. 开始用Hibernate的扩展工具 hbm2java来修改,也很适用. 但是我嫌JAVA调试太烦,改为PHP了的,附XML解析部份的代码. <? $file = "data.xml"; $depth = array(); function startElement($parser, $name, ...
by dhj1 2003-10-19 浏览 (6168) 回复 (17) 关键字:

求助:如何利用java提取复杂html代码里的纯文本?

希望得到的效果类似dhtml里的 innerText 例如: 字符串 我说:<span onclick="if (a<2) alert('>'" style="border:1px solid #336699" >你好<b>哈哈</b>!!!&nbsp;我是小胖</span> 最后转换成  我说:你好哈哈!!! 我是小胖 主要要支持 ...
by fins 2007-01-03 浏览 (3381) 回复 (14) 关键字:

大家xml parser哪个用的最多的

Xerces Piccolo XML Parser XP Parser JDOM kXML NanoXML NekoPull XOM XStream JiBX: Binding XML to Java Code dom4j Phoenix XMLBeans
by sun_wind 2005-10-10 浏览 (3006) 回复 (7) 关键字:

HtmlParser初探--使用Nodefilter和Visitor进行网页分析

最近在做html页面转化成jsf页面的工作,尝试过使用正则表达式、dom4j等方法,都没有取得很好的结果。(html-->jsf会另写一篇文章进行讨论)现在在使用htmlparser对html进行解析,对于html页面的解析htmlparser是一个功能比较强大的工具(相关下载:http://sourceforge.net/projects/htmlparser/)。以下是经常使用的对页面解 ...
by yongtree 2007-10-23 浏览 (1536) 回复 (5) 关键字: htmlparser

字符串解析的问题

这几天碰到一个需求, 需要解析用户输入的字符串, 将其解析成对应的逻辑操作 举例来说, 用户输入: (A + (B * (-C))) 偶的程序将会把它解析成对应的逻辑操作: TEMP1 = NOT C TEMP2 = B AND TEMP1 RESULT = A OR TEMP2 问题在于, 这个表达式在业界有多种变型, 比如: {A + [B * (-C)]}  括号不同 (A ...
by Readonly 2004-09-27 浏览 (6475) 回复 (13) 关键字:

较劲儿

最近的工作 一直跟页面有关 主要是html和js 先是 google-images、google-news  全是js,全是innerHTML 接着是 腾讯迷你首页  变态的tab页 然后又是 讯雷资讯  也全是js,iframe一层一层又一层 。。。  我不得不非常较劲儿地啃着 .html后缀的文件   &nbs ...
by quiii 2008-05-22 浏览 (219) 回复 (1) 关键字:

很高兴桂林兄加入CommonTemplate的开发

桂林的blog: http://jasongreen.javaeye.com 桂林今天一天就完成了HTML属性语法外套的重构, 采用Jericho进行实现, 并抽取了策略接口, 真是佩服他的高效. 在下一版本(或下载每日构建版本)将可以使用有着高度容错能力的Jericho实现: <table ct:if="users != null && users.size > 0 ...
by javatar 2008-04-05 浏览 (801) 回复 (2) 关键字:

HttpClient+Jericho HTML Parser 实现网页的抓取

  Jericho HTML Parser是一个简单而功能强大的Java HTML解析器库,可以分析和处理HTML文档的一部分,包括一些通用的服务器端标签,同时也可以重新生成无法识别的或无效的HTML。它也提供了一个有用的HTML表单分析器。  下载地址:http://sourceforge.net/project/showfiles.php?group_id=101067&n ...
by oscar999 2007-05-17 浏览 (928) 回复 (0) 关键字:

HttpClient+Jericho HTML Parser 实现网页的抓取

Jericho HTML Parser是一个简单而功能强大的Java HTML解析器库,可以分析和处理HTML文档的一部分,包括一些通用的服务器端标签,同时也可以重新生成无法识别的或无效的HTML。它也提供了一个有用的HTML表单分析器。   下载地址:http://sourceforge.net/project/showfiles.php?group_id=101067   ...
by playfish 2007-12-22 浏览 (1575) 回复 (1) 关键字:

PDFBox中文乱码

在解析PDF文件时出现这么一个问题,有几个PDF文件全是中文内容的,有一些可以正常解析,解析出来也是正常的中文,可是有一些就不正常,解析出来的是乱码.哎,每次都被这些乱码搞得天昏地转的,文件编码实在是让人费解.的的代码如下(运用PDFBox): public static String parsePDF(InputStream is) throws PaserDocumentException { ...
by 晨星★~雨泪 2008-04-07 浏览 (1955) 回复 (12)

请问D能不能写 apache/php/等程序的module?

请问现在可以用D语言写这些module吗?应该怎么做? 另外有个疑问,因为D现成的库很少,只好去调用C的库。 那是不是 理论上所有的C写的程序库,都可以用D来调用? C++的库是不是就很难重用了? 谢谢!
by sofire 2007-08-03 浏览 (1044) 回复 (10)

从D新闻博客上看 tango的xml解析好像很快啊

http://planet.dprogramming.com/
by tomqyp 2008-03-13 浏览 (352) 回复 (4)

air 做一个浏览器,怎样知道页面加载的百分比或进度?

用html组件
by fourfire 2008-04-27 浏览 (395) 回复 (2)

求助:运行例子时候报hibernate解析出错。

运行官方指南第二个持久化例子的时候,报错。 很奇怪啊,这不是说初始化时hql解析出错吗?可是hql貌似没问题啊,何况是jpbm包内定义的?? 2007-10-29 14:04:11,218 - org.hibernate.hql.PARSER -0    [main] ERROR org.hibernate.hql.PARSER  - *** ERROR ...
by Augustan 2007-10-29 浏览 (997) 回复 (2)

Cobra: Java HTML 解析器

Cobra 简介: Cobra是一个HTML工具包。它包含一个纯Java HTML DOM 分析器和一个页面表现引擎。Cobra支持HTML4,Javascript 和CSS2。声明的新特征有: 实现了W3C HTML DOM Level 2接口。 能够解析某些浏览器所识别的 "street HTML"。 能够在headless模式中被使用。 当文档被解析时,对于Dom修改提供increment ...
by levis2000 2008-03-26 浏览 (1435) 回复 (1) 关键字: html parser

基于Spindle的增强HTTP Spider

构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源 代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正, 有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)    以下代码基于lucene-2.3.1,htmlp ...
by brunoplum 2008-04-01 浏览 (1823) 回复 (7) 关键字: spindle

Linux - Wine上运行MS Office 2007教程

三个月前,国外的Wine Review小组首次将Microsoft Office 2007通过Wine运行在Linux上.不过因为方法异常烦琐,作者没把方法公布出来.现在,随着Wine的不断进步,任何人都可以方便地将Microsoft Office 2007运行在Linux上了! 想在你的Linux上运行起Wine,先看看你的系统是不是具备以下条件: Wine 0.9.58。 Cross ...
by galaxystar 2008-04-01 浏览 (544) 回复 (2) 关键字: linux

相关问答

赞助商链接