主题 : jeecms 爬虫 2.0正式版 (附带整合 jeecms2012工程源码)
级别: 举人
UID: 977
积分:196 加为好友
威望: 1 精华: 0
主题:33 回复:64
注册时间:2009-10-14
在线时长:0
1#   发表于:2012-05-13 22:13:38  IP:171.154.*.*
jeecms 爬虫 2.0正式版 
这次新增了评论采集,采集界面也重新布局,数据库表,整合代码都独立了出来,可以与官方的采集共存,完全不用修改JEECMS的源代码(XML配置文件还是要改的哈,不然咋个整合进去啊!),另外,还整理了几个文档,采集参数设置说明,整合说明等,见附件。



我的小站:www.meishih.com就是基于此爬虫建立的,已经采集了上万条数据了。
有做网站的朋友 交换个链接吧:),这年头自己搞网站不容易,大家相互帮助哈:),先谢了!
小站网址:www.meishih.com
小站名称:美食汇 

终于可以下了,原来是BBS有些BUG啊,附件是上传成功了的,只是附件的还是用的图片标签展示,所以显示不了,还有修改的时候,标题变成原文内容,导致修改报错,还请官方看看,及时修复。

整合包

jeecms2012-crawler2.0整合工程源码


界面效果




路漫漫其修远兮,唔将上下而求索,www.javacoo.com
级别: 商业授权用户
UID: 11798
积分:192 加为好友
威望: 0 精华: 0
主题:13 回复:142
注册时间:2010-10-19
在线时长:0
2#   发表于:2012-05-14 00:13:18  IP:218.106.*.*
沙发~~~
级别: 解元
UID: 688
积分:209 加为好友
威望: 1 精华: 0
主题:18 回复:88
注册时间:2009-09-03
在线时长:0
3#   发表于:2012-05-14 07:05:02  IP:60.110.*.*
为什么没有链接啊。
级别: 举人
UID: 977
积分:196 加为好友
威望: 1 精华: 0
主题:33 回复:64
注册时间:2009-10-14
在线时长:0
4#   发表于:2012-05-16 10:10:19  IP:182.121.*.*
自己顶一个
路漫漫其修远兮,唔将上下而求索,www.javacoo.com
级别: 举人
UID: 977
积分:196 加为好友
威望: 1 精华: 0
主题:33 回复:64
注册时间:2009-10-14
在线时长:0
5#   发表于:2012-05-22 09:54:46  IP:182.82.*.*
额。。。
路漫漫其修远兮,唔将上下而求索,www.javacoo.com
级别: 童生
UID: 32871
积分:35 加为好友
威望: 0 精华: 0
主题:0 回复:34
注册时间:2012-04-24
在线时长:0
6#   发表于:2012-05-23 15:17:10  IP:113.14.*.*
我将爬虫整合后,发现‘采集地址’不能正常读取?你们的正常吗?这个采集地址对应的是那张表的什么字段?
级别: 童生
UID: 32871
积分:35 加为好友
威望: 0 精华: 0
主题:0 回复:34
注册时间:2012-04-24
在线时长:0
7#   发表于:2012-05-23 17:12:18  IP:113.14.*.*
解决了。把clob转成varchar2就可以了。
级别: 举人
UID: 977
积分:196 加为好友
威望: 1 精华: 0
主题:33 回复:64
注册时间:2009-10-14
在线时长:0
8#   发表于:2012-06-11 11:30:34  IP:125.78.*.*
...
路漫漫其修远兮,唔将上下而求索,www.javacoo.com
级别: 童生
UID: 34805
积分:14 加为好友
威望: 0 精华: 0
主题:0 回复:21
注册时间:2012-06-06
在线时长:0
9#   发表于:2012-06-13 08:54:03  IP:113.177.*.*
请问是否支持图文、视频采集呢?如果支持,该如何处理?
级别: 举人
UID: 34510
积分:110 加为好友
威望: 0 精华: 0
主题:0 回复:88
注册时间:2012-05-30
在线时长:0
10#   发表于:2012-06-13 09:34:00  IP:115.215.*.*
1 2 > >| 共2页