采集功能采不上 - JEECMS官方论坛|开源java cms,jsp cms,jsp bbs

cherry_lawrence

级别: 白丁

UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0

1# 发表于:2011-08-02 15:42:40 IP:218.123.*.*

显示全部只看该作者

我按照教程的步骤进行的采集，但是信息都采不上。采集对所要采集的信息有什么硬性要求吗？是一般的新闻信息都能采集吗

使用道具
顶端

yin2035

级别: 总版主

UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05

2# 发表于:2011-08-02 15:46:12 IP:220.40.*.*

显示全部只看该作者

需要有那种列表一样的页面，分页有规律

路漫漫其修远兮，吾将上下而求索!

使用道具
顶端

cherry_lawrence

级别: 白丁

UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0

3# 发表于:2011-08-02 16:31:32 IP:218.123.*.*

显示全部只看该作者

感觉教程写的不是很明确。那个动态地址是怎么定义的，是必填的一项吗？

使用道具
顶端

cherry_lawrence

级别: 白丁

UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0

4# 发表于:2011-08-02 16:38:55 IP:218.123.*.*

显示全部只看该作者

而且示例中采集新浪新闻那个，动态的从第2页到第4页，但是真正采集上的没那么多吧。。。
究竟怎么回事呢

使用道具
顶端

yin2035

级别: 总版主

UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05

5# 发表于:2011-08-02 16:51:54 IP:220.40.*.*

显示全部只看该作者

有些网站分隔符不是_，具体还得看各个不同的网站是如何设置的，您可以试试不看着示例，写个采集新浪新闻。

路漫漫其修远兮，吾将上下而求索!

使用道具
顶端

cherry_lawrence

级别: 白丁

UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0

6# 发表于:2011-08-03 11:19:21 IP:218.123.*.*

显示全部只看该作者

采不上啊采不上啊采不上啊。。。
郁闷……

使用道具
顶端

yin2035

级别: 总版主

UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05

7# 发表于:2011-08-03 11:23:02 IP:115.175.*.*

显示全部只看该作者

看看对方网站是否有防采集，采集连接符，数据段是否一致等等

路漫漫其修远兮，吾将上下而求索!

使用道具
顶端

cherry_lawrence

级别: 白丁

UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0

8# 发表于:2011-08-03 13:09:57 IP:218.123.*.*

显示全部只看该作者

求看法……

使用道具
顶端

cherry_lawrence

级别: 白丁

UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0

9# 发表于:2011-08-03 15:57:27 IP:218.123.*.*

显示全部只看该作者

问个问题哈！那个采集当中内容地址这项是一个链接的首尾html语句，那这个链接如果不能打开的话，是不是采集不上的。比如说查看了源文件，链接格式是<a href='/Art/...(此处省略)'>，这样的是不是采集不上的

使用道具
顶端

yin2035

级别: 总版主

UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05

10# 发表于:2011-08-03 16:02:31 IP:115.175.*.*

显示全部只看该作者

链接肯定是得能打开的，系统肯定是要去查找你写的采集的网站的。

路漫漫其修远兮，吾将上下而求索!

使用道具
顶端