后羿采集器是一款功能强大的网页抓取软件,通过本软件,你可以将网页上的内容独立保存,让您在浏览完网站的时候可以将别人的内容复制到自己的素材文件夹上,对于分享网络资源,复制网页内容等方面都是非常方便的;后羿采集器操作比较灵活,可以实现单个网页抓取,也可以选择多个HTML页面抓取,还可以手动选择字段,让您更快锁定抓取的内容,同时该软件提供了图片过滤、广告过滤等功能,可以屏蔽您不需要抓取的内容!
软件功能
1、可视化自定义采集流程:全程问答式引导、可视化操作、自定义采集流程、自动记录和模拟网页操作顺序、高级设置满足更多采集需求
2、点选抽取网页数据:鼠标点击选择要爬取的网页内容、操作简单、可选择抽取文本、链接、属性、html标签等
3、运行批量采集数据:软件按照采集流程和抽取规则自动批量采集、快速稳定,实时显示采集速度和过程、可切换软件后台运行,不打扰前台工作
4、功能强大,箭速迭代:智能识别网页数据,导出数据方式多样,软件定期更新升级,不断添加新功能
软件特色
1、可视化自定义采集流程
全程问答式引导、可视化操作、自定义采集流程
自动记录和模拟网页操作顺序
高级设置满足更多采集需求
2、点选抽取网页数据
鼠标点击选择要爬取的网页内容、操作简单
可选择抽取文本、链接、属性、html标签等
3、运行批量采集数据
软件按照采集流程和抽取规则自动批量采集
快速稳定,实时显示采集速度和过程
可切换软件后台运行,不打扰前台工作
4、导出和发布采集的数据
采集的数据自动表格化,自由配置字段
支持数据导出到Excel等本地文件
和一键发布到CMS网站/数据库/微信公众号等媒体
安装方法
1、下载软件,这里点击houyicaiji-Setup-2.0.3.exe启动就可以了,提示您协议内容,点击接受
2、设置软件的安装地址,可以选择为C:Program Files (x86)后羿采集houyicaiji
3、提示安装进度,请稍后
4、后羿采集器已经成功,勾选运行点击完成
使用方法
1、在桌面上找到您已经安装的“后羿采集器”找到以后点击启动
2、在这里输入软件的登录账号就可以了,点击旁边的注册功能可以申请账号
3、提示软件的项目建立方式,这里可以点击创建一个新的抓取项目
4、可以将一个网页的地址复制到这里,也可以选择从文本上读取多个地址
5、复制地址以后点击创建任务就可以了
6、如图所示,软件自动打开网页,这里有三个选择类型,可以选择列表页、可以选择内容页,点击下一步
7、在上方的浏览区域选择您需要抓取的网页字段,鼠标点击字段即可
8、提示保存,找到抓取的内容以后点击下方蓝色的保存按钮
9、本次采集已完成,点击导出数据,将网页的数据输出保存
10、提示保存的方式,可以选择Excel,可以选择CSV,也可以选择HTML
11、这里就是保存的界面, 小编选择的是保存文HTML,自动以网页的名字保存
12、提示保存完毕,可以选择打开抓取的内容查看,点击打开文件夹
13、后羿采集器抓取的内容就在下方了,这里显示抓取的HTML文件内容
∨ 展开