主题 : 文*内容抓取配置
级别: 举人
UID: 85394
积分:149 加为好友
威望: 19 精华: 0
主题:24 回复:103
注册时间:2016-02-08
在线时长:0
1#   发表于:2016-12-28 14:28:58  IP:183.190.*.*
你好,我想问一下,这个抓取文章的配置,需要怎么配?

我现在需要抓取淘宝下面的内容:https://sf.taobao.com/item_list.htm?spm=a213w.7398504.filter.79.h5xwiP&city=%B9%E3%D6%DD&province=



我的配置如下:


现在一直报错,说这个配置异常,请问这种能够赚取吗?
级别: 版主
UID: 70293
积分:78391 加为好友
威望: 1 精华: 0
主题:7 回复:68397
注册时间:2014-12-03
在线时长:0
2#   发表于:2016-12-28 14:30:31  IP:115.234.*.*
这个截取不了
1
级别: 举人
UID: 85394
积分:149 加为好友
威望: 19 精华: 0
主题:24 回复:103
注册时间:2016-02-08
在线时长:0
3#   发表于:2016-12-28 14:31:01  IP:183.190.*.*
回复第2楼那要什么情况能够截取?
级别: 版主
UID: 70293
积分:78391 加为好友
威望: 1 精华: 0
主题:7 回复:68397
注册时间:2014-12-03
在线时长:0
4#   发表于:2016-12-28 14:31:55  IP:115.234.*.*
比较规则,没什么换行和空格的
1
级别: 举人
UID: 85394
积分:149 加为好友
威望: 19 精华: 0
主题:24 回复:103
注册时间:2016-02-08
在线时长:0
5#   发表于:2016-12-28 14:41:56  IP:183.190.*.*
回复第4楼 如果是下面这种格式,需要怎么配置,我需要读取标题和url



级别: 版主
UID: 70293
积分:78391 加为好友
威望: 1 精华: 0
主题:7 回复:68397
注册时间:2014-12-03
在线时长:0
6#   发表于:2016-12-28 14:42:51  IP:115.234.*.*
http://www.jeecms.com/jinlei/550.htm
可以看下采集教程
1
级别: 举人
UID: 85394
积分:149 加为好友
威望: 19 精华: 0
主题:24 回复:103
注册时间:2016-02-08
在线时长:0
7#   发表于:2016-12-28 16:54:21  IP:183.190.*.*
回复第6楼我按照了这个教程去配置,采集的时候一直说“未知错误”
级别: 版主
UID: 70293
积分:78391 加为好友
威望: 1 精华: 0
主题:7 回复:68397
注册时间:2014-12-03
在线时长:0
8#   发表于:2016-12-28 16:54:53  IP:115.234.*.*
tomcat里有报错信息吗
1
级别: 举人
UID: 85394
积分:149 加为好友
威望: 19 精华: 0
主题:24 回复:103
注册时间:2016-02-08
在线时长:0
9#   发表于:2016-12-28 16:56:21  IP:183.190.*.*
回复第8楼一直在报空指针


java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
java.lang.NullPointerException
级别: 版主
UID: 70293
积分:78391 加为好友
威望: 1 精华: 0
主题:7 回复:68397
注册时间:2014-12-03
在线时长:0
10#   发表于:2016-12-28 16:56:52  IP:115.234.*.*
你怎么配置的,截图看下
1
1 2 3 > >| 共3页