当前位置:
文档之家› 八爪鱼采集器新手入门必备的知识点(7.0版)
八爪鱼采集器新手入门必备的知识点(7.0版)
论坛
•免费版用户可以去论坛/提问,上面也会有专属客服回答问题的,论坛响 应时间一天以内。
八爪鱼采集原理
原理:
Ⅰ:模拟人的思维去浏览网页 Ⅱ:通过设计工作流程完成自动化数据采集 八爪鱼采集器是一款模拟人的思维去访问网页 文档的互联网数据采集器。通过设计工作流程,可以 实现采集的程序自动化,以达到快速的对网页数据进 行收集整合,完成用户数据采集的目的。
八爪鱼的规则配置流程模拟人的思维模式,贴合用户的操作习惯,任何人通过官网教程的学习都可以在30分钟内轻 松掌握全网数据采集的本领。
帮助渠道
八爪鱼官网
教程
•登陆,点击帮助和教程,里面包含了所有的使用教程。建议从新手入门1-7开 始,学会新手教程1-7就可采集互联网上80%的网站
客服系统
•登陆在用户中心-售后咨询或者客户端上的“联系客服”按钮向专属客服反应 问题,上班时间客服在线响应时间为5分钟以内。下班时间可以提交工单,客服上班之后会进行 回复。此服务为一对一服务。
QQ群
•私有云用户可以联系购买时的商务,商务会帮你直接建一个组分配专属客服解答问题 •专业版或旗舰用户可以直接添加VIP群,在群内咨询问题。每个VIP群都有专属客服,客服看到都 会回复大家。专业版群客服响应时间4个小时内,旗舰版群客服响应时间两个小时内 •旗舰版QQ群 1群:130849246 2群:286777906 3群:196097783 限旗舰版用户 •专业版QQ群 1群:475423041 2群:385161018 3群:135071723 限专业版用户
结语: 实践出真知,八爪鱼让数据触手可及
实战演练
一、打开网页:
打开网页,一般指我们所要采集数据的网站,正如平时我们浏 览该网站的数据信息时需要输入URL一样
二、循环翻页:
循环翻页,指一般我们需要快速收集整合时,是需要做到翻页 循环的,循环翻页的本质是一个单个元素的循环
三、提取数据:
正式的采集步骤
四、点击元素:
The End
谢谢大家
培训反馈/jpLnLy0
界面简介
-八爪鱼界面功能介绍
界面简介
-智能模式介绍
界面简介
-app简易模式介绍
界面简介
-网页简易模式介绍
界面简介
-向导模式介绍
界面简介
-高级模式介绍
流程步骤
一、输入网址: 此处用于输入要采集网页URL 二、设计工作流程: 此处用于设计任务规则的自动化流程步骤,例如:你要让任 务规则打开哪一个网页,做哪些步骤等都在设计工作流程中完成,设计 工作流程是一个任务规则的核心步骤 三、任务启动选择: 如果规则编写正确,此处你就可以启动一个任务规则进行单 机采集或云采集了,并且可以设置定时计划
循环本身是不会有任何执行操作的,如果要实现循环翻页,则 需要一个点击元素来和循环产生联动
Ajax加载与新标签页
即通过在后台与服务器进行少量数据交换,意味 着可以在不重新加载整个网页的情况下,对网页的某 部分进行更新。 最简单的方式是看在八爪鱼浏览器里点击的时候 有没有转,, 如果是像这样就不是ajax,这种标志 就是ajax,需要设置ajax即可,如果不设置采集时出现 的现象就会一直等待在这里不提取数据,感觉采集速 度会很慢,设置了之后会加快速度。 一般真正ajax的情况下是一定不会开新标签的, 如果勾选了新标签就需要取消掉。
八爪鱼 让数据触手可及
深圳视界信息技术有限公司 2017年08月
目录
1. 2. 3. 4. 5. 6. 产品介绍 学习渠道 八爪鱼采集原理 界面简介 实战演练 误区-ajax与新标签介绍
产品介绍
八爪鱼,深圳视界信息技术有限公司(国家高新企业)旗下产品,强大且易用的互联网数据采集平台。
八爪鱼可简单快速地将网页数据转化为结构化数据,存储于EXCEL或数据库等多种形式,并且提供基于云计算的大数据云采 集解决方案,实现精准、高效、大规模的数据采集。其智能模式可实现输入网址全自动化导出数据,是国内首个大数据一键 采集平台。
网页数 据
八爪鱼采集 器
数据 库
EXCE L
AP I
其 他
产品介绍
高级模式
简单规则设置,灵活应对 各种复杂网页结构
强大的功能+简便的操作,我们提供三 种操作模式,满足不同用户的个性化应 用需求。
向导模式
内置向导流程,点击执行 轻松解决采集难题 智能模式 智能识别算法,一键即可 提取结构化数据 简易模式 内置采集模板,输入参数 即可提取模板数据
流程步骤
流程设计步骤:
在八爪鱼采集器中,一共有11个流程设计操作,其中分为常用步骤和进阶步骤,划分为
以下:
常用步骤:
常用步骤本身是应用较多的流程设计操作,通常来说,要实现一个网页的数据快速整理 与采集,这些步骤是必不可少的,基本步骤如下: 1)打开网页 2)点击元素 3)循环 4)提取数据
进阶步骤:
进阶步骤,是指除基本步骤外,我们需要通过下列操作来辅助完成我们的数据采集,进 阶步骤如下: 1)输入文字 3)切换下拉选项 5)移动鼠标到元素上 7)结束流程 2)识别验证码 4)判断条件 6)结束循环
实战演练
新浪财经 /q/go.php/vIR_RatingNewest/i ndex.phtml?p=1 58同城 /waiyu/30390652277055x.shtml?adtype=1&entinf o=30390652277055_0&adact=3&psid=16757968519683719719 1772083&iuType=q_1&ClickID=2&PGTID=0d303871-0000-4c8d427b-904ef31bbe7d