分类

网络分类单机分类应用分类

火车采集器

火车采集器

v10.27 官方版

大小:53.2 MB更新:2025/02/15

类别:电脑应用系统:Android

立即下载

  火车采集器功能丰富,可以在软件界面自由配置采集任务,让软件可以快速下载自己需要的网页数据,例如可以在软件采集新闻资源,输入新闻网页地址到软件,设置数据抓取的方式,配置适合的规则,这样就可以快速采集各种网页资源到电脑使用,软件已经提供了很多采集规则,可以在案例界面双击任意规则直接启动,从而根据案例规则快速配置新的采集计划,让用户可以采集网页图像,采集文本内容,下载网页中分享的其他资源,需要的朋友就下载吧。

火车采集器

软件功能

  1、火车采集器可以帮助用户快速采集网页资源,可以在软件配置符合网页内容的采集规则

  2、支持任务创建功能,可以在软件设置任务分组,可以设置子任务

  3、支持网址添加,在软件设置多个采集的网址,批量采集数据资源

  4、支持自动获取地址链接,支持手动设置获取内容网址的规则

  5、数据提取方式:前后截取、正则提取、正文提取、XPath提取、JSON提取、CSS提取

  6、循环设置功能,可以循环识别网页内容,从而提取多种内容

  7、支持内容分页数量设置,支持每次最大采集数量设置

  8、支持内容过滤功能:内容替换/排除、Html标签过滤、字符截取、纯正则替换

  9、支持提取第一张图片、智能提取时间、智能提取邮箱、智能提取手机号码、智能提取电话号码

软件特色

  1、火车采集器可以让用户在电脑配置多种采集规则,方便提取网页资源

  2、自己需要的网页数据都可以使用这款软件批量下载使用

  3、可以在软件保存全部采集规则,以后可以一键运行采集任务

  4、支持自动摘要、自动分词、自动分类

  5、支持HTTP请求、字符编码转换、同义词替换、空内容缺省值、内容加前后缀

  6、支持随机插入、运行C#代码、批量内容替换、统计标签字符串长度

  7、支持自动提交软件运行产生的Bug日志,支持在任务列表树中显示任务回收站

  8、支持开启云端规则同步上传,云端获取规则同时获取对应的分组信息

  9、支持本机规则库备份规则,名称不同时直接覆盖,支持其他规则库的同名规则,直接覆盖本机规则

使用方法

  1、将火车采集器直接安装到电脑,点击下一步

火车采集器

  2、账号登录,可以点击免费注册打开官方网站申请新的账号

火车采集器

  3、如图所示,这里是软件的任务列表查看界面,可以打开测试的任务

火车采集器

  4、新建任务规则,在软件输入采集的地址,设置数据获取方式

火车采集器

  5、内容采集规则设置界面,支持从源码中获取数据、生成固定格式的数据、已有标签组合

火车采集器

  6、内容发布规则界面,可以在软件选择发布模块:5ucms 1.2、74cms3.0文章、Akcms 3.9.5、ArtCms 2008v5.1

火车采集器

  7、其他设置内容:该项内的设置任务运行时,可以在任务运行管理窗口内动态修改,实时生效。

火车采集器

  8、http设置界面:网页编码、Cookie、UserAgent、Referer、AutoRedirect、Keep-Alive

火车采集器

  9、文件图片下载:

  普通文件

  所有文件保存根目录

  文件链接地址前缀

  文件下载模式

  同时文件下载数

  单文件下载分块数

  下载地址保存为文件

火车采集器

  10、FTP文件上传功能,可以在软件登录服务器,设置文件是上传跟目录

火车采集器

更新日志

  v10.27

  1.表名加单引号或方括号导致文章编号获取不到自增ID。

  2.优化升级计划任务类库BUG。

  v10.26

  1.新增:文件上传支持华为云上传

  2.新增:保存为本地TXT文件时,支持自定义扩展名,比如.ini,.py等等

  3.新增:HTML标签过滤排除支持自定义过滤标签

  4.新增:http请求头列表支持剪切板批量粘贴导入头信息设置

  5.新增:POST分页设置支持日期参数[yyyyMMdd]

  6.优化:火车采集器默认UA更新

  7.优化:数据编辑SQL操作界面可随着编辑界面伸缩放大

  8.修复:下载图片探测地址问题修复

  9.修复:html标签过滤时部分标签不起效问题修复

  10.修复:标签提取结果生僻字、繁体字不能查看问题修复

  11.修复:数据获取中调用多个标签作为截取字符不起效问题的修复

  12.修复:数据转换mysql编码设置无效问题修复

  v10.25

  1.增加:标签文件下载支持添加图片水印。

  2.增加:数据处理中的HTTP请求可以调用请求头信息。

  3.增加:下载增加是否设置Referer为空配置。

  4.增加:批量网址支持文本导入。

  5.增加:水印文字可以调用标签。

  6.增加:获取cookie超时时间。

  7.修复:标签提取结果和下载文件名不一致。

  8.修复:图片地址识别错误导致下载失败。

  9.修复:列表页标签提取结果有空格时不显示。

  10.修复:正则提取时组合结果重复。

  11.修复:数据转换mysql支持修改编码。

  12.优化:远程管理采集数据接口优化。

  13.优化:插件.NET Framework升级到4.6。

  14.优化:网址库支持手动填写与选择。

精品推荐
同类相关
同类推荐
说两句网友评论
    我要跟贴
    取消
    • 每周排行
    • 最热排行
    电脑软件排行榜

    点击查看更多

    点击查看更多

    实时热词
    电脑浏览器鲁大师驱动软件