IMGspider插件说明文档

插件安装

可以通过两种方式安装WordPress图片采集爬取插件-IMGspider,包括FTP客户端人工上传插件文件安装,或者WordPress仪表盘上传插件压缩包文件安装。

通过WordPress仪表盘安装

  1. 进入您的WordPress仪表盘,选择“插件”-“安装插件”;
  2. 如果您已经下载了“IMGspider”压缩包,则选择“上传插件”安装即可;或者你可以搜索“IMGspider”找到插件,点击“现在安装”。
  3. 安装完毕后,启用IMGspider。

提示:如果你在上传插件的过程中遇到这样的错误: “The link you followed has expired”,这可能是由于你的服务器设置了最大上传文件大小限制。你可以通过配置php.ini文件来提高上传文件大小限制,如果你对这一块不了解,请尝试搜索相关知识或者找服务器技术支持(懂服务器配置的朋友)帮忙。

或者你也可以选择FTP客户端上传安装插件,如下:

通过FTP客户端安装插件

  1. 下载插件.zip压缩文件到本地,并解压。
  2. 使用FTP客户端登入你的服务器,并进入到网站安装目录下的wp-content/plugins插件文件夹,然后将解压好的插件文件夹拖拽到该目录上传。
  3. 登入你的WordPress仪表盘,进入“插件”-“已安装的插件”,然后已安装插件的列表找到“IMGspider”,启用插件。

插件设置

1. 常规设置

常规设置包含了基础设置、代理设置、图片选项、过滤规则等。

下面我们先来看一下基础设置的选项,首先你可以设置自动或者手动采集(1),其中自动采集,仅当贴入外链图片至编辑器时以默认采集模式执行;手动采集则需要手动点击保存站外图片时执行。注:如果发布的文章量不多,推荐选择手动采集。

默认采集模式(2)提供服务器采集、代理采集和浏览器采集三个选项:其中代理采集必须设置代理服务器才可用(后面会说到);服务器采集即使用你的WordPress服务器进行采集,可能会耗服务器资源,即采集的效率要视乎WordPress服务器的硬件和服务器性能;浏览器采集需依赖我们提供的Chrome扩展程序,即你需要在你的Chrome浏览器安装才可以使用该采集模式,该模式最大的优点,效率更高且可采集微信公众号等加密图片。

默认采集第一张图片为特色图片(3),即勾选此选项后,会将采集文章的第一张图片设置为文章特色图片。

imgSpider常规设置1

代理设置,即如果你拥有可用于图片采集的代理服务器,则可以设置服务器名称、IP地址、端口、用户名和密码,然后在采集的时候选择代理采集。这个选项提供给用代理服务器搭建能力的站长使用。

使用代理服务器采集有一定的优势,比如海外代理服务器,对海外网站的图片采集有一定的优势,反之,国内网站的图片采集应该使用国内代理服务器。

注:其实用浏览器采集模式,只要你的Chrome浏览器能够打开网站并加载图片,采集基本没太大的问题。

imgSpider图片采集代理服务器

接下来,图片选项,允许你对采集图片进行设置。包括尺寸规格,文件名规则,标题及替代文本,对齐方式。

  • 尺寸规则-不超过指定宽度,即若采集图片的宽度像素超出设置值,将压缩为指定值宽度。如要保留原尺寸图片,使用默认值即可。
  • 文件名规则-自定义文件名可以使用一个或者多个命名规则参数。比如可以设置为%filename%%date%。
  • 标题及替代文本-可以保留来源数据的图片标题及ALT替代文本,又或者使用文件名或文章标题作为图片标题和ALT替代文本。
  • 对齐方式-这个很好理解,就是图片的对齐方式,后续将增加全幅和宽幅对齐方式。

注:关于图片标题和ALT替代文本,你可以安装Smart SEO Tool插件设置图片优化来改写标题或者ALT替代文本。如果希望效果更佳,建议手写图片标题和ALT替代文本

imgSpider图片选项设置

过滤规则,可以实现指定顺序过滤采集图片,过滤特定尺寸的图片,及按格式、域名过滤图片采集。特别要说的是,务必记得将第三方存储的图片URL的域名添加至排除图像域名。

imgSpider图片采集过滤规则

2. 全局扫描

全局扫描主要是为了方便站长对历史文章或者页面的图片进行扫描,以解决外链图片问题。

该功能可以支持按不同类型的Post及页面、文章ID区间、文章状态、分类目录、例外地址等条件,按ID降序或者顺序,对全站图片链接进行扫描采集。

注:建议设置一定的条件进行全局扫描,否则可能因为外链图片过多导致服务器奔溃。

imgSpider全局扫描

3. 采集助手

采集助手(仅Pro版本可用),即我们针对WordPress图片采集开发的Chrome扩展程序,使用该扩展程序可以有效地解决图片采集占用服务器资源,加密图片无法采集等问题。

要使用Chrome扩展程序进行图片采集,请按照以下步骤操作:

Step 1-下载安装文件

进入插件设置界面,选择采集助手,下载压缩包插件,然后存放到(例如:D盘)解压。

Step 2-打开浏览器扩展程序安装页面

复制chrome://extensions,并粘贴到地址栏,按回车键进入扩展中心页面。在扩展中心打开右上角的【开发者模式】按钮

IMGspider插件说明文档插图5

Step 3-安装插件

点击左上角“加载已解压的扩展程序”,在文件夹弹框窗口中选中刚解压的文件存放位置。点击确定即可。

IMGspider插件说明文档插图6

图片采集

经典编辑器下采集图片

新建一篇文章并贴入你需要转载的附带图片的文章。点击“保存站外图片”按钮,进入图片采集界面:

选择采集模式(1),服务器采集、代理采集或者浏览器采集。这个在前面的设置已经有详细的说明,在这里就不展开重复了。

然后点击底部的开始采集按钮(2)即可。注:由于网络原因,可能会存在部分链接采集失败的情况,遇到这种情况重新采集即可;或者保存文章,再次执行采集。

经典编辑器图片采集

古腾堡编辑器下采集图片

古腾堡编辑器的采集与传统编辑器的采集大同小异,但采集的入口不一样。

进入你需要采集图片的文章或者页面的区块编辑器,点击右上角的设置图标(1),选择“文章”标签(2),然后选择采集模式(3):

古腾堡编辑器图片采集

然后会进入采集的窗口,点击底部的“开始采集”即可采集文章或者页面内的外链图片。

古腾堡编辑器图片采集2

更新记录

V2.0.1 2020.10.08
  • 新增常规设置-采集模式默认选项;
  • 新增图片采集助手版本检测功能;
  • 优化全局扫描,增加外链图片数量提示功能;
  • 优化文章编辑采集模式交互体验;
  • 其他已知问题优化及样式优化。
V2.0.0 2020.10.01
  • 新增图片采集助手Chrome扩展;
  • 新增微信、头条等加密图片采集支持;
  • 新增文章图片采集关联WordPress媒体库;
  • 新增插件+扩展图片采集模式;
  • 全新插件设置界面UI;
  • 优化全局扫描图片采集功能;
  • 移除闪电博代理服务器支持。
V1.2.1 2020.05.15
  • 新增批量采集可选采集方式;
  • 优化插件设置界面菜单展示样式;
  • 优化批量采集按钮展示方式,未选择采集地址时不可操作;
  • 优化批量采集地址列表,采集地址过多时以查看更多的方式展示;
  • 优化批量采集状态,方便用户了解当前进度;
  • 优化批量采集性能;
  • 优化批量采集图片采集成功地址展示形式。
V1.2.0 2020.04.07
  • 新增特色图片设置功能;
  • 新增定义代理服务器,支持使用本地服务器及代理服务器采集图片;
  • 新增指定顺序图片过滤规则;
  • 新增特定尺寸图像过滤规则;
  • 新增图像格式过滤规则;
  • 新增图像域名排除规则;
  • 新增相同地址图片去重规则,防止采集相同图片;
  • 新增已发布文章全局扫描功能,批量采集已发布文章外链图片;
  • 取消插件启用关闭设置,采用WordPress插件禁用机制;
  • 修复插件一些已知bug。
V1.1.2 2020.03.25
  • 优化图片采集规则,解决部分网站限制WP采集图片403 Forbidden报错问题
V1.1.1 2020.01.11
  • 优化代理服务器模式采集图片规则
  • 解决部分CDN图片无法采集问题
V1.1.0 2020.01.09
  • 新增图片采集模式,支持手动或者自动采集;
  • 代理服务器支持加密代理服务器配置
  • 新增采集图片选项设置,支持设置采集图片尺寸规格/文件名规则/标题及代替文本/对齐方式等。
V1.0.1 2019.12.11
  • 修正WordPress v5.3兼容性问题
V1.0.0 2019.05.17
  • 新增JPEG, JPG, PNG&GIF等常见图片格式支持
  • 新增图片爬取默认代理服务器功能
  • 新增图片爬取自定义代理服务器配置功能
  • 新增图片队列下载功能