后羿采集器官方安装版分属于离线浏览,officeba免费提供后羿采集器官方安装版下载,更多后羿采集器官方安装版就在officeba。
后羿采集器是原Google技术性精英团队倾情打造出的一款网页页面数据收集pc软件,数据可视化选中,一键收集网页页面数据信息,全服务平台,Win/Mac/Linux都能用,后羿采集器收集和导出来免费,无限制安心用,可后台程序,速率即时显示信息。
1、数据可视化自定收集步骤
全线问答式正确引导、数据可视化实际操作、自定收集步骤。
自动保存和仿真模拟网页页面实际操作次序。
高级设置考虑大量收集要求。
2、选中提取网页页面数据信息
鼠标单击挑选要抓取的网页页面、实际操作简易。
可挑选提取文字、连接、特性、html标识等。
3、运作批量采集数据信息
pc软件依照收集步骤和提取标准全自动批量采集。
迅速平稳,即时显示信息收集速率和全过程。
可转换pc软件后台程序,打搅前台工作。
4、导出来和公布收集的数据信息
收集的数据信息全自动报表化,随意配备字段名。
适用数据信息导出来到Excel等本地文件。
和一键公布到CMS网址/数据库查询/微信公众平台等新闻媒体。
自定收集网页搜索結果数据信息的方式
一、建立收集每日任务
1、起动后羿采集器,进到主界面,挑选自定收集并点一下建立每日任务按键建立 “自定收集每日任务”;
2、键入网页搜索的URL,包含三种方法。
手动式键入:在文本框中立即键入URL,好几个URL时需要自动换行切分。
点一下文本文件中载入方法:客户挑选一个储放URL的文档,文档中能够有好几个URL详细地址,详细地址需要自动换行切分。
大批量加上方法:根据加上并调节详细地址主要参数转化成好几个有规律性的详细地址。
二、自定收集步骤
1、点一下建立后全自动开启第一个URL从而进到自定设定网页页面,默认设置早已建立了刚开始、打开网站、完毕的步骤块。底端模版区用以拖动到画板中转化成新的步骤块;点击打开网页页面中的特性按键,可改动开启的网站地址;
2、加上输入文字步骤块:在底端模版区中拖动输入文字块到打开网站块后边周边,当出現黑影地区的情况下能够松掉电脑鼠标,这时会全自动联接,加上进行;
3、转化成详细流程表:模仿上边加上输入文字步骤块的拖动步骤加上新块;
关键因素块设定详细介绍
定时执行等候用以等候前边打开网站进行。
点一下文本框Xpath特性按键,在特性莱单中点击图标开展选中网页页面中的文本框,点一下键入文本属性按键,在莱单中键入要检索的文字。
用以设定点一下刚开始检索按键,点一下原素的xpath特性按键,在莱单中点一下选中标志,随后点击网页中的百度一下按键就可以。
用以设定循环系统载入下一目录页。在循环系统块內部的循环系统标准块中设定详尽标准,这里点一下实际操作按键,挑选单独原素,随后在特性莱单中点一下原素的xpath特性按键,跟上面一样开展选中网页页面中的下一页按键。循环系统频次特性按键可默认设置为0,即不限定点一下下一页的频次。
用以设定循环系统提取目录页中的数据信息。在循环系统块內部的循环系统标准块中设定详尽标准,这里点一下实际操作按键,挑选不固定不动原素目录,随后在特性莱单中点一下原素的xpath特性按键,随后在网页页面中持续选中2次提取第一块和第二块原素。循环系统频次特性按键可默认设置为0,即不限定目录中扣除字段名的总数。
用以实行点一下下一页按键实际操作,点一下原素xpath特性按键,挑选应用当今循环系统中原素的xpath选择项。
同样用以设定网页页面载入等待的时间。
用以设定在目录页提取的字段名标准,点一下特性按键中应用循环系统中的原素按键,挑选应用循环系统中的原素选择项。点一下原素模版特性按键在字段名报表中点一下交互开展加上删除字段,加上字段名应用选中实际操作,即点一下减号后电脑鼠标挪动到网页元素上点一下挑选。
4、点一下刚开始收集,起动收集。
三、数据收集及导出来
1、收集每日任务运作中;
2、收集进行后,挑选“导出数据”能够把数据信息都导出来到本地文件;
3、挑选“导出来方法”,将收集好的数据信息导出来,这儿能够挑选excel做为导出来为文件格式;
4、采集数据导出来后如下图。
同类最新
相关文章