|
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
|---|---|
| 作者 | 正文 |
|
最后更新时间:2007-11-28 关键字: mechanize
今天终于把blogspot上面的帖子全部搬到javaeye来了。自从把blogspot上面的帖子下载到本地服务器之后,一直想找个地方来安顿。选择了几个,不过很多网页是gbk格式的,转换的时候老是出现乱码,我试过的163的就这样,后来还是找utf8格式的。却发现csdn和blogjava都是要验证码登录,也作罢了。第一次迁移成功是在yahoo上,后来找到了javaeye更新的办法,衡量了一下,终究还是选择了javaeye做个窝。 这个过程主要用到了WWW::Mechanize。首先为了快点获取网页,我对javaeye登录和发博客的页面信息进行提取,保存到本地。其中登录页面很好提取,发布页面由于有个富文本编辑框,而且有个预览的功能,所以对页面进行了一些预处理。至于页面最后是怎样的,我就不明说了。 ruby 代码
其中有几点要注意:标题不能少于2个字,就这样有几次我还以为给封了,后来发现是标题太短造成的。另外,加了个耗时操作,因为怕提交太快给封了帐号。javaeye管理员看到我一天发了几百个博客,不要以为我是来搞破坏的哦,抱歉了。 不管怎么说,还算是搞定了。还有,我的blogspot是http://uptolife.blogspot.com 多谢rainchen ,改成了sleep(3) 声明:JavaEye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
|
|
| 返回顶楼 | |
|
最后更新时间:2007-11-27
mechanize很不错,稍微封装下就可以支持文件UPLOAD了,很方便。
|
|
| 返回顶楼 | |
|
最后更新时间:2007-11-27
是呀,还封装了hpricot。
不用自己管理cookie,省了不少精力。
本来是直接使用javaeye的页面来发布的,不知为什么,mechanize识别不了form的title和message。后来手动添加了field进去,还是没测试成功,只好把页面保存到本地来修改了。
|
|
| 返回顶楼 | |
|
最后更新时间:2007-11-27
mechanize确实很好用,还可以用来做爬虫,呵呵。
|
|
| 返回顶楼 | |
|
最后更新时间:2007-11-27
发现代码中居然有这个
for i in (1..10000000) i=i end 可以用sleep(3),效果更好 |
|
| 返回顶楼 | |
|
最后更新时间:2007-11-27
JavaEye3.0的博客我们会提供REST API,到时候本地发布博客文章,就用不着像你这样hack了。
|
|
| 返回顶楼 | |
|
最后更新时间:2007-11-28
老大,blog可以支持Google Ads.不阿
|
|
| 返回顶楼 | |
|
最后更新时间:2007-11-28
t0uch 写道 老大,blog可以支持Google Ads.不阿
两周后推出 |
|
| 返回顶楼 | |
|
最后更新时间:2007-11-28
还是这里人气旺
|
|
| 返回顶楼 | |
|
最后更新时间:2007-11-29
引用 liushao 11 小时前
还是这里人气旺 liuzhao兄? |
|
| 返回顶楼 | |










