主题 : 采集功能采不上
级别: 白丁
UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0
1#   发表于:2011-08-02 15:42:40  IP:218.123.*.*
我按照教程的步骤进行的采集,但是信息都采不上。采集对所要采集的信息有什么硬性要求吗?是一般的新闻信息都能采集吗
级别: 总版主
UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05
2#   发表于:2011-08-02 15:46:12  IP:220.40.*.*
需要有那种列表一样的页面,分页有规律
路漫漫其修远兮,吾将上下而求索!
级别: 白丁
UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0
3#   发表于:2011-08-02 16:31:32  IP:218.123.*.*
感觉教程写的不是很明确。那个动态地址是怎么定义的,是必填的一项吗?
级别: 白丁
UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0
4#   发表于:2011-08-02 16:38:55  IP:218.123.*.*
而且示例中采集新浪新闻那个,动态的从第2页到第4页,但是真正采集上的没那么多吧。。。
究竟怎么回事呢
级别: 总版主
UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05
5#   发表于:2011-08-02 16:51:54  IP:220.40.*.*
有些网站分隔符不是_,具体还得看各个不同的网站是如何设置的,您可以试试不看着示例,写个采集新浪新闻。
路漫漫其修远兮,吾将上下而求索!
级别: 白丁
UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0
6#   发表于:2011-08-03 11:19:21  IP:218.123.*.*
采不上啊采不上啊采不上啊。。。
郁闷……
级别: 总版主
UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05
7#   发表于:2011-08-03 11:23:02  IP:115.175.*.*
看看对方网站是否有防采集,采集连接符,数据段是否一致等等
路漫漫其修远兮,吾将上下而求索!
级别: 白丁
UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0
8#   发表于:2011-08-03 13:09:57  IP:218.123.*.*
求看法……
级别: 白丁
UID: 22240
积分:84 加为好友
威望: 0 精华: 0
主题:7 回复:26
注册时间:2011-07-29
在线时长:0
9#   发表于:2011-08-03 15:57:27  IP:218.123.*.*
问个问题哈!那个采集当中内容地址这项是 一个链接的 首尾html语句,那这个链接如果不能打开的话,是不是采集不上的。比如说查看了源文件,链接格式是<a href='/Art/...(此处省略)'>,这样的是不是采集不上的
级别: 总版主
UID: 10736
积分:148478 加为好友
威望: 205 精华: 42
主题:287 回复:126198
注册时间:2010-09-08
在线时长:17.05
10#   发表于:2011-08-03 16:02:31  IP:115.175.*.*
链接肯定是得能打开的,系统肯定是要去查找你写的采集的网站的。
路漫漫其修远兮,吾将上下而求索!
1 2 > >| 共2页