主题 : 如何采集动态地址的新闻网页
级别: 秀才
UID: 41683
积分:61 加为好友
威望: 0 精华: 0
主题:3 回复:27
注册时间:2012-12-06
在线时长:0
1#   发表于:2013-01-14 15:55:41  IP:124.52.*.*
最近用 jeecms 系统的自带采集器采集数据,发现在配置的过程中,静态的地址很容易配置成功,动态地址在获取的时候,解析出来的地址有问题,能不能指点下,这个问题怎么解决
a
级别: 状元
UID: 33380
积分:50625 加为好友
威望: 21 精华: 3
主题:88 回复:30687
注册时间:2012-05-07
在线时长:0
2#   发表于:2013-01-14 16:01:55  IP:59.152.*.*
您要采集的是什么新闻?
功成由勤,业精于勤。
级别: 秀才
UID: 41683
积分:61 加为好友
威望: 0 精华: 0
主题:3 回复:27
注册时间:2012-12-06
在线时长:0
3#   发表于:2013-01-14 16:29:10  IP:124.52.*.*
大学主页的校园新闻之类的
a
级别: 状元
UID: 33380
积分:50625 加为好友
威望: 21 精华: 3
主题:88 回复:30687
注册时间:2012-05-07
在线时长:0
4#   发表于:2013-01-14 16:32:34  IP:59.152.*.*
没个网站新闻动态参数都不一样的!这也不是每个网站都能采集,要有一对规律的才可以
功成由勤,业精于勤。
级别: 秀才
UID: 42808
积分:51 加为好友
威望: 0 精华: 0
主题:3 回复:30
注册时间:2013-01-07
在线时长:0
5#   发表于:2013-01-14 16:53:12  IP:1.130.*.*
我采集动态的就成功了,小改了下程序。
可以有空气中毒这一说了~
级别: 秀才
UID: 41683
积分:61 加为好友
威望: 0 精华: 0
主题:3 回复:27
注册时间:2012-12-06
在线时长:0
6#   发表于:2013-01-14 16:54:43  IP:124.52.*.*
怎么修改的,求指教
a
级别: 秀才
UID: 41683
积分:61 加为好友
威望: 0 精华: 0
主题:3 回复:27
注册时间:2012-12-06
在线时长:0
7#   发表于:2013-01-14 16:55:04  IP:124.52.*.*
回复第5楼:怎么修改的,求指教
a
级别: 状元
UID: 33380
积分:50625 加为好友
威望: 21 精华: 3
主题:88 回复:30687
注册时间:2012-05-07
在线时长:0
8#   发表于:2013-01-14 16:55:31  IP:59.152.*.*
回复第5楼:怎么修改的,求指教
com.jeecms.cms.service.AcquisitionSvcImpl类中getContentList方法里, 
String base = url.substring(0, url.indexOf("/", url.indexOf("//") + 2) ); 
改成 
String base = url.substring(0, url.indexOf("/", url.indexOf("//") + 2) + 1)试用相对路径采集。
功成由勤,业精于勤。
级别: 秀才
UID: 42808
积分:51 加为好友
威望: 0 精华: 0
主题:3 回复:30
注册时间:2013-01-07
在线时长:0
9#   发表于:2013-01-14 16:58:36  IP:1.130.*.*
这是因为主域名和动态地址在合并式中间少了个/符号才导致不成功的。
可以有空气中毒这一说了~
级别: 状元
UID: 33380
积分:50625 加为好友
威望: 21 精华: 3
主题:88 回复:30687
注册时间:2012-05-07
在线时长:0
10#   发表于:2013-01-14 16:59:40  IP:59.152.*.*
功成由勤,业精于勤。
1 2 > >| 共2页