主题 : 采集要分析多久的 |
级别: 商业授权用户
![]() |
12# 发表于:2017-05-19 12:08:54 IP:116.203.*.*
回复第11楼
没效果,换了一个地址采集也不行,http://www.bbwotc.com/zxdt/index.jhtml 这个没有附件 ![]() |
||
---|---|---|---|
级别: 商业授权用户
![]() |
14# 发表于:2017-05-19 12:51:25 IP:116.203.*.*
回复第11楼
采集新浪的也不行,报错。采集地址是http://roll.news.sina.com.cn/news/gnxw/gdxw1/index.shtml; 分页地址是http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_[page].shtml ![]() ![]() |
||
---|---|---|---|
级别: 商业授权用户
![]() |
18# 发表于:2017-05-19 13:50:41 IP:116.203.*.*
回复第17楼
重启也没有什么用,先前升级V8都起不来。 查看TOMCAT报错如下,能否找专家帮看看 java.net.URISyntaxException: Illegal character in path at index 62: http://news. sina.com.cn/c/2017-05-19/doc-ifyfkkmc9703898.shtml" at java.net.URI$Parser.fail(URI.java:2848) at java.net.URI$Parser.checkChars(URI.java:3021) at java.net.URI$Parser.parseHierarchical(URI.java:3105) at java.net.URI$Parser.parse(URI.java:3053) at java.net.URI.<init>(URI.java:588) at com.jeecms.cms.service.AcquisitionSvcImpl$AcquisitionThread.saveConte nt(AcquisitionSvcImpl.java:241) at com.jeecms.cms.service.AcquisitionSvcImpl$AcquisitionThread.run(Acqui sitionSvcImpl.java:157) java.net.URISyntaxException: Illegal character in path at index 62: http://news. sina.com.cn/c/2017-05-19/doc-ifyfkqwe0254827.shtml" at java.net.URI$Parser.fail(URI.java:2848) at java.net.URI$Parser.checkChars(URI.java:3021) at java.net.URI$Parser.parseHierarchical(URI.java:3105) at java.net.URI$Parser.parse(URI.java:3053) at java.net.URI.<init>(URI.java:588) at com.jeecms.cms.service.AcquisitionSvcImpl$AcquisitionThread.saveConte nt(AcquisitionSvcImpl.java:241) at com.jeecms.cms.service.AcquisitionSvcImpl$AcquisitionThread.run(Acqui sitionSvcImpl.java:157) |
||
---|---|---|---|
级别: 版主
![]() |
19# 发表于:2017-05-19 13:52:00 IP:106.166.*.*
|
||
---|---|---|---|
级别: 商业授权用户
![]() |
20# 发表于:2017-05-19 13:55:24 IP:116.203.*.*
回复第19楼
晕菜, 我设置的是这个地址http://roll.news.sina.com.cn/news/gnxw/gdxw1/index.shtml 提示非法地址是采集时自动解析的。 |
||
---|---|---|---|