主题 : 关于采集的内容地址的开始HTML,和结束HTML
级别: 解元
UID: 91568
积分:364 加为好友
威望: 22 精华: 0
主题:60 回复:90
注册时间:2016-08-11
在线时长:0
1#   发表于:2016-09-30 15:05:53  IP:113.207.*.*
如下一条新闻

 <li><a href="./201609/t20160930_664486.html" title='市人大常委会党组学习中心组举行2016年第五次专题 暨“两学一做”第二专题学习会' target='_blank'>市人大常委会党组学习中心组举行2016年第五次专题 暨“两学一做”第二专...</a><span>[2016-09-30]</span></li>


那么,内容地址的开始HTML,和结束HTML分别是什么??
级别: 总版主
UID: 10736
积分:148385 加为好友
威望: 205 精华: 42
主题:287 回复:126144
注册时间:2010-09-08
在线时长:15.8
2#   发表于:2016-09-30 15:08:37  IP:117.115.*.*
你把内容详情页发出来看下才知道结束和开始的标签
路漫漫其修远兮,吾将上下而求索!
级别: 解元
UID: 91568
积分:364 加为好友
威望: 22 精华: 0
主题:60 回复:90
注册时间:2016-08-11
在线时长:0
3#   发表于:2016-09-30 15:35:58  IP:113.207.*.*
试了很多次都是采集失败,这是要采集的新闻地址http://rd.nanning.gov.cn/rdyw/index.html ,麻烦点一下可以看看

采集地址:
动态地址:
内容地址集: 开始和结束html
内容地址: 开始和结束html
标题:开始和结束html

分别是什么?
级别: 总版主
UID: 10736
积分:148385 加为好友
威望: 205 精华: 42
主题:287 回复:126144
注册时间:2010-09-08
在线时长:15.8
4#   发表于:2016-09-30 15:38:05  IP:117.115.*.*
好的,稍等下
路漫漫其修远兮,吾将上下而求索!
级别: 总版主
UID: 10736
积分:148385 加为好友
威望: 205 精华: 42
主题:287 回复:126144
注册时间:2010-09-08
在线时长:15.8
5#   发表于:2016-09-30 16:11:09  IP:117.115.*.*
你这么配置下
路漫漫其修远兮,吾将上下而求索!
级别: 解元
UID: 91568
积分:364 加为好友
威望: 22 精华: 0
主题:60 回复:90
注册时间:2016-08-11
在线时长:0
6#   发表于:2016-09-30 16:36:33  IP:113.207.*.*
不知道为啥,还是失败、
级别: 解元
UID: 91568
积分:364 加为好友
威望: 22 精华: 0
主题:60 回复:90
注册时间:2016-08-11
在线时长:0
7#   发表于:2016-09-30 16:37:20  IP:113.207.*.*
是不是采集地址还动态地址错了、
级别: 总版主
UID: 10736
积分:148385 加为好友
威望: 205 精华: 42
主题:287 回复:126144
注册时间:2010-09-08
在线时长:15.8
8#   发表于:2016-09-30 16:38:15  IP:117.115.*.*
提示什么了?
路漫漫其修远兮,吾将上下而求索!
级别: 解元
UID: 91568
积分:364 加为好友
威望: 22 精华: 0
主题:60 回复:90
注册时间:2016-08-11
在线时长:0
9#   发表于:2016-09-30 16:45:36  IP:113.207.*.*
org.apache.http.conn.HttpHostConnectException: Connection to http://rd.nanning.gov.cn201605 refused
at org.apache.http.impl.conn.DefaultClientConnectionOperator.openConnection(DefaultClientConnectionOperator.java:158)
at org.apache.http.impl.conn.AbstractPoolEntry.open(AbstractPoolEntry.java:149)
at org.apache.http.impl.conn.AbstractPooledConnAdapter.open(AbstractPooledConnAdapter.java:121)
at org.apache.http.impl.client.DefaultRequestDirector.tryConnect(DefaultRequestDirector.java:562)
at org.apache.http.impl.client.DefaultRequestDirector.execute(DefaultRequestDirector.java:415)
at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:820)
at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:941)
at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:919)
at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:910)
at com.jeecms.cms.service.AcquisitionSvcImpl$AcquisitionThread.saveContent(AcquisitionSvcImpl.java:232)
at com.jeecms.cms.service.AcquisitionSvcImpl$AcquisitionThread.run(AcquisitionSvcImpl.java:148)
Caused by: java.net.ConnectException: Connection timed out: connect
at java.net.TwoStacksPlainSocketImpl.socketConnect(Native Method)
at java.net.AbstractPlainSocketImpl.doConnect(Unknown Source)
at java.net.AbstractPlainSocketImpl.connectToAddress(Unknown Source)
at java.net.AbstractPlainSocketImpl.connect(Unknown Source)
at java.net.PlainSocketImpl.connect(Unknown Source)
at java.net.SocksSocketImpl.connect(Unknown Source)
at java.net.Socket.connect(Unknown Source)
at org.apache.http.conn.scheme.PlainSocketFactory.connectSocket(PlainSocketFactory.java:120)
at org.apache.http.impl.conn.DefaultClientConnectionOperator.openConnection(DefaultClientConnectionOperator.java:148)
... 10 more
级别: 总版主
UID: 10736
积分:148385 加为好友
威望: 205 精华: 42
主题:287 回复:126144
注册时间:2010-09-08
在线时长:15.8
10#   发表于:2016-09-30 16:50:00  IP:117.115.*.*
Caused by: java.net.ConnectException: Connection timed out: connect 这个是提示链接超时了,你是部署数据库出错了
路漫漫其修远兮,吾将上下而求索!
1 2 3 4 > >| 共4页