爬山虎采集器

爬山虎采集器

爬山虎采集器

昵称:爬山虎采集器语言:中文

大小:56.5MB年份:2020

标签:

游戏介绍

  爬山虎采集器是一款十分简单好用的信息采集软件。它的功能非常强大,它支持99%的网站数据采集的高效网页信息采集。爬山虎采集器能生成Excel表格,api数据库文件等内容,帮助你管理网站数据信息,如果您需要对某个指定网页数据进行采集,使用这款软件即可。有需要的朋友欢迎下载使用。

爬山虎采集器

  【软件特色】

  一键提取数据

  简单易学,通过可视化界面,鼠标点击即可抓取数据

  快速高效

  内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据

  适用各种网站

  能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站

  【功能介绍】

  向导模式

  简单易用,轻松通过鼠标点击自动生成

  脚本定时运行

  可按照计划定时运行,无需人工

  独创高速内核

  自研的浏览器内核,速度飞快,远超对手

  智能识别

  对于网页中的列表、表单结构(多选框下拉列表等)能够智能识别

  广告屏蔽

  定制的广告屏蔽模块,兼容AdblockPlus语法,可添加自定义规则

  多种数据导出

  支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等

  【使用方法】

  第一步:输入采集网址

  打开软件,新建任务,输入需要采集的网站地址。

  第二步:智能分析,全程自动化提取数据

  进入到第二步后,爬山虎采集器全自动智能分析网页,并且从中提取出列表数据。

  第三步:导出数据到表格、数据库、网站等

  运行任务,将采集到的数据导出为Csv、Excel以及各种数据库,支持api导出。

  【常见问题】

  问:如何过滤列表中的前N个数据?

  1.有时我们需要对采集到的列表进行过滤,比如过滤掉第一组数据(在采集表格时,过滤掉表格列名)

  2.点击列表模式菜单中的,设置列表xpath

  问:如何抓包获取Cookie,并且手动设置?

  1.首先,使用谷歌浏览器打开要采集的网站,并且登陆。

  2.然后按下 F12,会出现开发者工具,选择 Network

  3.然后按下F5,刷新下页面, 选择其中一个请求。

  4.复制完成后,在爬山虎采集器中,编辑任务,进入第三步,指定HTTP Header。

  【更新日志】

  修复某些网址中#数据不加载问题

  优化XPath生成

  优化输入命令


猜你喜欢
机场人生3D 魂器学院ios版 旺牛棋牌 像素地牢 对马岛之鬼 榴莲,草莓,芭乐,黄瓜app 百老汇娱乐棋牌手机app下载 v1.0.2 天妃棋牌 风云棋牌 铅笔快跑 纪元棋牌游戏二维码下载 v1.1 亿图图示2021版 小情书官网版 v1.9.4 山海本纪 新城小新 暴走精灵 Dota电竞 易上网 榴莲,草莓,芭乐,黄瓜视频 金虎国际棋牌安卓版 金迪棋牌游戏 金玉满堂棋牌 牛盟棋牌游戏 好男人视频观看免费完整版 我上学又迟到‪了 迅雷影音PC版 爱聊 荣华娱乐棋牌官网版 天堂WWW种子中文版 零蛋韩剧网app

健康游戏忠告

电脑版手机版