分类

网络分类单机分类应用分类

EditorTools3(ET采集器)

EditorTools3(ET采集器)

v3.6.15 官方版

大小:24.1 MB更新:2025/01/16

类别:电脑应用系统:Android

立即下载

  EditorTools3提供资源采集功能,可以通过这款软件远程采集其他网站的资源,软件已经提供教程内容,新用户可以直接打开相关的教程链接,从而查看如何配置采集规则,可以在软件选择Blo类采集,可以选择论坛类采集,可以选择问答类采集,可以选择小说类采集,可以选择新闻类采集,配置对应的采集规则就可以一键开始采集,自动下载采集到的数据保存到电脑,您也可以在软件创建多个采集方案,可以设定每种方案定时运行的时间,让EditorTools3可以自动采集数据。

EditorTools3(ET采集器)

软件功能

  1、EditorTools3支持方案设置功能,可以在软件新建采集方案

  2、可以在软件选择对CMS类型的网站采集数据,可以对博客采集数据

  3、可以在软件设置采集规则、中间规则、发布规则

  4、可以设置采集间隔时间,可以设置方案执行的次数

  5、支持成功发布后自动删除本地下载文件,文件下载上传失败时强制发布文章

  6、支持采集发布失败时自动删除本地下载文件,图片下载失败时删除图片代码

  7、支持定时采集设置,可以在软件设置当前采集方案定时执行的时间日期

  8、支持日志功能,可以在软件生成采集日志,可以显示警告日志、错误日志

  9、数据整理:过滤HTML、标题整理、正文整理、摘要整理、来源整理

  10、数据项:标题、日期、缩略图、文章来源、正文、自动摘要、关键词

  11、模拟发布:本功能以用户登录方式,使用网站本身的发布程序发布文章,适用于大部分网站程序

软件特色

  支持网站登录采集

  免接口模拟登录发布

  支持网页压缩,跳转采集

  支持HTTP/HTTPS/SOCKET代理

  内容分页采集

  数据项独立下载文件

  采集记录管理

  多模式检查信息重复

  中文简繁转换

  随机插入关键词

  UBB代码自动转换

  迅雷、快车、旋风链接自动解析

  反网络劫持

  随机账号发布

  自定义User-Agent,模仿蜘蛛采集

  网页及地址编码自动识别

  自动生成列表分页网址

  列表页附加参数获取功能

  html标签清除

  无限级分组任务管理

  中文英文互译

  中文日文互译

  支持发布回复、问答

  图片水印

  命令行启动程序

  支持提取JSON信息

使用方法

  1、将EditorTools3软件启动,可以在软件底部区域查看视频案例内容

EditorTools3(ET采集器)

  2、基本设置:启用自动更新、忽略规则首尾空白字符、访问网络超时时间、访问网络重试次数、访问网页失败:

EditorTools3(ET采集器)

  3、标识选项界面如图所示,电信劫持HTTP特征码、访问标识-UserAgent、支持语言(Accept-Language)

EditorTools3(ET采集器)

  4、代理设置:代理地址列表:(支持HTTP、HTTPS、SOCKET4、SOCKET4代理)

EditorTools3(ET采集器)

  5、显示格式设置界面,可以在左侧区域设置字体

EditorTools3(ET采集器)

  6、规则设置界面:网址启用HTTP编码、启用页面压缩、启用POST请求优先模式、使用SSL安全链接、采集页包含HTTP头信息

EditorTools3(ET采集器)

  7、列表设置界面:列表网址、列表区域规则、列表分析规则

EditorTools3(ET采集器)

  8、可以点击购买授权按钮打开官方网站购买注册码,可以查看软件的帮助内容

EditorTools3(ET采集器)

官方教程

  如何采集回复

  在采集文章时,我们常常需要采集如回复、评论以及类似格式的信息,比如论坛帖子的回复、新闻的评论。

  它们的特点是,在同一个页面上呈现多条相同格式的内容。

  采集回复,分为两种情况,一种是直接使用 【正文】数据项采集,另一种是新建数据项采集。

  一、直接使用正文数据项采集

  这种方式,适合于正文(即主题)与回复的代码格式相同,例如绝大部分论坛。

  通常我们只需要勾选 正文的选项【匹配多条】即可。

  1、图一是discuz!x论坛的一种用【正文】数据项同时采集主题和回复的设置。

EditorTools3(ET采集器)

  2、图二是另一种discuz!x论坛的用【正文】数据项同时采集主题和回复的设置。

EditorTools3(ET采集器)

  3、图三是百度贴吧用【正文】数据项同时采集主题和回复的设置。

EditorTools3(ET采集器)

  下图是测试结果,可以看到采集的由ET分隔符分隔的多条回复信息,在实际发布回复时,会自动去掉ET分隔符。

EditorTools3(ET采集器)

  4、发布的设置

  如果有使用独立的回复接口网址,那么在发布配置中开启,【回复关联参数名】留空,回复信息将逐一向【回复接口】提交,完成回复的添加;

  如果没有开启独立的回复,那么回复信息将和正文一起提交给【发布接口】。

EditorTools3(ET采集器)

  需要注意的是,要同时采集回复,那么【正文】数据项的【数据项采集规则】必须兼容正文和回复的格式。

  由于回复通常有多页,所以以上图示勾选了【有分页】选项,并设置了【数据分页】(数据分页的设置请见相关文章。)

  二、使用独立数据项采集回复

  这种方式适合 正文与回复代码格式不同的情况,比如新闻的评论。

  1、在采集配置中新建回复数据项,做好相关设置,能正确采集到回帖内容。

EditorTools3(ET采集器)

  2、在发布配置-发布项中新建一个参数,用于从采集规则中的回复数据项获取采集结果。

EditorTools3(ET采集器)

  3、在发布配置-基本设置中,设置回复关联参数,为第2步新建的参数名。

EditorTools3(ET采集器)

  设置完成。

  用户可根据采集目标的情况,选择适合的方式采集回复信息。

更新日志

  EditorTools 3.6.15

  发布时间:2024-10-17

  更新内容:

  1、修正:3.6.14版中方案-文件选择使用“使用下载文件原名”时,保存的文件名错误的问题。

  EditorTools 3.6.14

  发布时间:2024-8-23

  更新内容:

  1、新增:列表设置支持设置下级网址的HTTP Header参数。

  2、修正:采集页 httphead与 referer模式冲突。

  3、修正:解决3.6.12版和3.6.13版中的发布内容失效错误。

精品推荐
同类相关
同类推荐
说两句网友评论
    我要跟贴
    取消
    • 每周排行
    • 最热排行
    电脑软件排行榜

    点击查看更多

    点击查看更多

    实时热词
    电脑浏览器鲁大师驱动软件