主题 : 3.0核心/数据采集
级别: 白丁
UID: 12001
积分:1 加为好友
威望: 0 精华: 0
主题:0 回复:1
注册时间:2010-10-26
在线时长:0
1#   发表于:2010-11-02 10:22:42  IP:59.43.*.*
现在这个功能在3.0上可以使用不?  

我新建了一个数据采集任务,访问的地址是我本机的网页,采集任务里的各项都是参照你们给的例子里的样子添加的, 但是我点<start>的时候弹出了个下载框, 你们说不影响使用,关了就行, 可是还是不好用,没有采集到数据....

如果这个功能好用的话,麻烦发个可以采集到数据的条件设置 截图也行啊,....万分感谢
级别: 白丁
UID: 12001
积分:1 加为好友
威望: 0 精华: 0
主题:0 回复:1
注册时间:2010-10-26
在线时长:0
2#   发表于:2010-11-02 11:09:30  IP:59.43.*.*
Hibernate: select authentica0_.authentication_id as authenti1_0_0_, authentica0_.uid as uid0_0_, authentica0_.username as username0_0_, authentica0_.email as email0_0_, authentica0_.login_time as login5_0_0_, authentica0_.login_ip as login6_0_0_, authentica0_.update_time as update7_0_0_ from jo_authentication authentica0_ where authentica0_.authentication_id=?
Hibernate: update jo_authentication set uid=?, username=?, email=?, login_time=?, login_ip=?, update_time=? where authentication_id=?
Hibernate: select usersites0_.user_id as user4_1_, usersites0_.usersite_id as usersite1_1_, usersites0_.usersite_id as usersite1_38_0_, usersites0_.check_step as check2_38_0_, usersites0_.is_all_channel as is3_38_0_, usersites0_.user_id as user4_38_0_, usersites0_.site_id as site5_38_0_ from jc_user_site usersites0_ where usersites0_.user_id=?
Hibernate: select cmsacquisi0_.acquisition_id as acquisit1_13_0_, cmsacquisi0_.name as name13_0_, cmsacquisi0_.start_time as start3_13_0_, cmsacquisi0_.end_time as end4_13_0_, cmsacquisi0_.status as status13_0_, cmsacquisi0_.curr_num as curr6_13_0_, cmsacquisi0_.plan_list as plan7_13_0_, cmsacquisi0_.dynamic_addr as dynamic8_13_0_, cmsacquisi0_.dynamic_start as dynamic9_13_0_, cmsacquisi0_.dynamic_end as dynamic10_13_0_, cmsacquisi0_.linkset_start as linkset11_13_0_, cmsacquisi0_.linkset_end as linkset12_13_0_, cmsacquisi0_.link_start as link13_13_0_, cmsacquisi0_.link_end as link14_13_0_, cmsacquisi0_.title_start as title15_13_0_, cmsacquisi0_.title_end as title16_13_0_, cmsacquisi0_.keywords_start as keywords17_13_0_, cmsacquisi0_.keywords_end as keywords18_13_0_, cmsacquisi0_.description_start as descrip19_13_0_, cmsacquisi0_.description_end as descrip20_13_0_, cmsacquisi0_.content_start as content21_13_0_, cmsacquisi0_.content_end as content22_13_0_, cmsacquisi0_.pagination_start as pagination23_13_0_, cmsacquisi0_.pagination_end as pagination24_13_0_, cmsacquisi0_.user_id as user25_13_0_, cmsacquisi0_.type_id as type26_13_0_, cmsacquisi0_.site_id as site27_13_0_, cmsacquisi0_.channel_id as channel28_13_0_ from jc_acquisition cmsacquisi0_ where cmsacquisi0_.acquisition_id=?
11:07:29.046 DEBUG com.jeecms.common.web.ProcessTimeFilter - process in 921 ms: /jeeadmin/jeecms/acquisition/o_start.do


-=====================================

这是点击<start>以后后台打印的部分.....  没什么错啊.就是采集不到数据呢?  麻烦给个设置规则或者截图让我看看也行啊
级别: 童生
UID: 10739
积分:3 加为好友
威望: 0 精华: 0
主题:0 回复:3
注册时间:2010-09-08
在线时长:0
3#   发表于:2010-11-02 11:33:34  IP:59.136.*.*
那个是设置问题,我们里面默认的采集新浪网就可以使用
级别: 白丁
UID: 12001
积分:1 加为好友
威望: 0 精华: 0
主题:0 回复:1
注册时间:2010-10-26
在线时长:0
4#   发表于:2010-11-02 13:49:36  IP:59.43.*.*
Hibernate: select authentica0_.authentication_id as authenti1_0_0_, authentica0_.uid as uid0_0_, authentica0_.username as username0_0_, authentica0_.email as email0_0_, authentica0_.login_time as login5_0_0_, authentica0_.login_ip as login6_0_0_, authentica0_.update_time as update7_0_0_ from jo_authentication authentica0_ where authentica0_.authentication_id=?
Hibernate: update jo_authentication set uid=?, username=?, email=?, login_time=?, login_ip=?, update_time=? where authentication_id=?
Hibernate: select usersites0_.user_id as user4_1_, usersites0_.usersite_id as usersite1_1_, usersites0_.usersite_id as usersite1_38_0_, usersites0_.check_step as check2_38_0_, usersites0_.is_all_channel as is3_38_0_, usersites0_.user_id as user4_38_0_, usersites0_.site_id as site5_38_0_ from jc_user_site usersites0_ where usersites0_.user_id=?
Hibernate: select cmsacquisi0_.acquisition_id as acquisit1_13_0_, cmsacquisi0_.name as name13_0_, cmsacquisi0_.start_time as start3_13_0_, cmsacquisi0_.end_time as end4_13_0_, cmsacquisi0_.status as status13_0_, cmsacquisi0_.curr_num as curr6_13_0_, cmsacquisi0_.plan_list as plan7_13_0_, cmsacquisi0_.dynamic_addr as dynamic8_13_0_, cmsacquisi0_.dynamic_start as dynamic9_13_0_, cmsacquisi0_.dynamic_end as dynamic10_13_0_, cmsacquisi0_.linkset_start as linkset11_13_0_, cmsacquisi0_.linkset_end as linkset12_13_0_, cmsacquisi0_.link_start as link13_13_0_, cmsacquisi0_.link_end as link14_13_0_, cmsacquisi0_.title_start as title15_13_0_, cmsacquisi0_.title_end as title16_13_0_, cmsacquisi0_.keywords_start as keywords17_13_0_, cmsacquisi0_.keywords_end as keywords18_13_0_, cmsacquisi0_.description_start as descrip19_13_0_, cmsacquisi0_.description_end as descrip20_13_0_, cmsacquisi0_.content_start as content21_13_0_, cmsacquisi0_.content_end as content22_13_0_, cmsacquisi0_.pagination_start as pagination23_13_0_, cmsacquisi0_.pagination_end as pagination24_13_0_, cmsacquisi0_.user_id as user25_13_0_, cmsacquisi0_.type_id as type26_13_0_, cmsacquisi0_.site_id as site27_13_0_, cmsacquisi0_.channel_id as channel28_13_0_ from jc_acquisition cmsacquisi0_ where cmsacquisi0_.acquisition_id=?
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.359 DEBUG com.jeecms.cms.service.impl.AcquisitionSvcImpl - content link: http://localhost:8080/jy/content.html
13:47:12.484 DEBUG com.jeecms.common.web.ProcessTimeFilter - process in 203 ms: /jeeadmin/jeecms/acquisition/o_start.do
==========================

我又重新做了个 现在后台打出的是这个 ,我看见已经到内容页面了, 但是他采集到的数据我上哪去查呢?
级别: 童生
UID: 10739
积分:3 加为好友
威望: 0 精华: 0
主题:0 回复:3
注册时间:2010-09-08
在线时长:0
5#   发表于:2010-11-02 14:37:01  IP:59.136.*.*
设置采集的时候不是需要设置采集数据存放位置吗?
级别: 白丁
UID: 12001
积分:1 加为好友
威望: 0 精华: 0
主题:0 回复:1
注册时间:2010-10-26
在线时长:0
6#   发表于:2010-11-02 14:58:05  IP:59.43.*.*
你是说入库信息吧.... 我设了 可是我按设置的位置 去 <内容>下的目录去找, 没找到采集的数据啊....   难道是没采集到?
还是我设置的时候又问题....         我看设置完的列表 <当前/总 页数>是0/1 状态是停止..  我采集的是自己做的测试页面,没有分页,   这个信息对么, 为什么没有结果
级别: 白丁
UID: 11263
积分:1 加为好友
威望: 0 精华: 0
主题:0 回复:1
注册时间:2010-09-26
在线时长:0
7#   发表于:2010-11-02 18:16:47  IP:112.159.*.*
那个国内新闻第二次就不能采集了,采集不到了
国际新闻今天还能采集到
级别: 童生
UID: 10739
积分:3 加为好友
威望: 0 精华: 0
主题:0 回复:3
注册时间:2010-09-08
在线时长:0
8#   发表于:2010-11-03 08:46:09  IP:59.133.*.*
怎么会呢,我这里都能采集的,是不是采集路径写错了?
1 共1页