IMGspider – WordPress图片采集抓取插件

  • 最新版本 1.2.1
  • 最新更新 2020.05.15
  • PHP版本要求 5.2+
  • WP版本要求 5.0+
  • 授权类型 开源
价格免费

热度: 11.4k+

IMGspider – WordPress图片采集抓取插件
1. 免费插件
该插件100%免费使用,任何WordPress博客都可以安装使用。
2. 轻量设计
100+KB超轻量代码,不会对网站造成负荷,保证系统稳定。
3. 代理加速
支持使用默认代理服务器或者自主代理服务器实现图片抓取加速。

插件概述

IMGspider(图片蜘蛛)是一款用于WordPress文章图片抓取的WordPress插件,支持JPG, JPEG, PNG, GIF, BMP, TIF等常见图片爬取下载,实现一键抓取文章内容所有引用图片到本地服务器。

该插件能够帮助WordPress站长在转载其他网站的文章时,快速将转载的文章内容中的站外图片抓取到本地服务器,而无需手动下载逐一上传,大大提升了站长的工作效率,并且IMGspider图片采集插件支持自动和手动采集两种模式,且支持代理服务器采集。

全新的版本更是加入了采集图片选项、过滤规则及全局扫描等设置选项,进一步丰富图片采集功能。

1.基础设置。

  • 支持自动或者手动采集模式:自动采集模式,即保存或者发布文章时,采集插件会执行自动采集外链图片任务;手动采集模式,即需要在编辑文章时,手动执行外链图片采集任务。
  • 支持设置采集第一张图片为特色图片,该功能目的在于方便使用需要设置特色图片的网站主题的站长,站长可以根据实际需求选择启用或者关闭该功能选项。
  • 代理服务器,IMGspider默认提供了一个图片采集代理服务器,站长也可以自行增加配置代理服务器,并可以设置一个默认的采集图片代理服务器。

2.图片选项。

IMGspider图片蜘蛛插件支持自定义一些采集图片参数选项,包括:

  • 尺寸规则-支持定义采集图片的最终宽度,可选择原尺寸采集又或者定义一个最大宽度;
  • 文件名规则-支持选择系统命名、保留原文件名及自定义命名规则;
  • 标题及替代文本-允许站长替换采集图片的原title和ALT值;
  • 对齐方式-站长可以根据主题风格来定义采集回来的图片的对齐方式。

3.过滤规则。

插件提供多种过滤规则,以便过滤一些特定的外链图片,包括:

  • 支持过滤特定顺序的图片;
  • 支持过滤特定尺寸图像,尤其是一些小图像;
  • 支持过滤特定格式图像;
  • 支持过滤特定域名图像,防止采集插件将CDN或者图库图片也采集到本地;
  • 支持图片采集去重规则,即相同外链图片地址仅采集一次,并自动替换为同一本地图片URL地址。

 4.全局扫描。

该功能的主要目的是方便部分站长对已发布文章的外链图片进行全局检测,实现一键采集已发布文章、页面及媒体的外链图片。

插件安装

方式1:在线安装(推荐)

1. 进入WordPress仪表盘,点击“插件-安装插件”:
2. 关键词搜索“IMGspider”,找搜索结果中找到“IMGspider”插件,点击“现在安装”;
3. 安装完毕后,启用”IMGspider”插件.
4. 通过“设置”->“IMGspider” 进入插件设置界面进行插件参数设置.

方式2:上传安装

FTP上传安装
1. 解压插件压缩包imgspider.zip,将解压获得文件夹上传至wordpress安装目录下的 `/wp-content/plugins/`目录.
2. 访问WordPress仪表盘,进入“插件”-“已安装插件”,在插件列表中找到“IMGspider”,点击“启用”.
3. 通过“设置”->“IMGspider” 进入插件设置界面.

仪表盘上传安装
1. 进入WordPress仪表盘,点击“插件-安装插件”;
2. 点击界面左上方的“上传按钮”,选择本地提前下载好的插件压缩包imgspider.zip,点击“现在安装”;
3. 安装完毕后,启用”IMGspider”插件;
4. 通过“设置”->”IMGspider”进入插件设置界面.

FAQ

= 采用自动采集模式,发布文章后依然使用的是外链图片? =

当使用自动采集模式时,文章在保存发布时如果采集图片失败,会使用原图片地址。基于这种情况,我们有以下建议:

  1. 改为手动采集模式,确保每张图片采集成功;
  2. 使用自动采集模式,应该定时采用全局扫描来排查已发布文章是否存在外链图片,如果有,则批量采集;
  3. 自动采集模式下,根据采集图片服务器地理位置,来判断是否设置默认代理服务器。

= 采集模式为自动模式,使用的是代理服务器还是本地服务器? =

如果未设置默认代理服务器,则用本地服务器;如果设置了默认代理服务器,则使用默认代理采集。

= 全局扫描的批量采集使用的采集服务器是哪个? =

全局扫描批量采集的服务器选择跟随自动采集模式,参考上一个FAQ。

= 为什么使用闪电博代理采集图片失败了? =

闪电博代理作为共享的代理服务器,如果当前使用的用户较多,可能会导致采集图片延时而失败;闪电博代理服务器也不适宜采集国内服务器图片。因此,当采集图片失败时,建议切换采集模式进行重复尝试。

= 为什么要配置自定义代理服务器? =

如果站点需要抓取大量的海外网站图片时,且默认代理无法满足需求,建议使用自主搭建的代理服务器,图片加速效果会更佳。毕竟插件提供的默认代理服务器,可能由于使用的站长过多,加速效果不明显。

插件截图

IMGspider – WordPress图片采集抓取插件插图

(1)插件基本设置界面截图.

IMGspider – WordPress图片采集抓取插件插图(1)
(2)插件采集图片选项设置界面截图.

IMGspider – WordPress图片采集抓取插件插图(2)
(3)采集图片过滤规则设置界面截图.

IMGspider – WordPress图片采集抓取插件插图(3)
(4)已发布文章外链图片全局扫描界面截图.

IMGspider – WordPress图片采集抓取插件插图(4)
(5)文章编辑器采集图片窗口截图.

IMGspider – WordPress图片采集抓取插件插图(5)
(6)文章编辑器图片抓取成功界面截图.

更新记录

V1.2.1 2020.05.15
  • 新增批量采集可选采集方式;
  • 优化插件设置界面菜单展示样式;
  • 优化批量采集按钮展示方式,未选择采集地址时不可操作;
  • 优化批量采集地址列表,采集地址过多时以查看更多的方式展示;
  • 优化批量采集状态,方便用户了解当前进度;
  • 优化批量采集性能;
  • 优化批量采集图片采集成功地址展示形式。
V1.2.0 2020.04.07
  • 新增特色图片设置功能;
  • 新增定义代理服务器,支持使用本地服务器及代理服务器采集图片;
  • 新增指定顺序图片过滤规则;
  • 新增特定尺寸图像过滤规则;
  • 新增图像格式过滤规则;
  • 新增图像域名排除规则;
  • 新增相同地址图片去重规则,防止采集相同图片;
  • 新增已发布文章全局扫描功能,批量采集已发布文章外链图片;
  • 取消插件启用关闭设置,采用WordPress插件禁用机制;
  • 修复插件一些已知bug。
V1.1.2 2020.03.25
  • 优化图片采集规则,解决部分网站限制WP采集图片403 Forbidden报错问题
V1.1.1 2020.01.11
  • 优化代理服务器模式采集图片规则
  • 解决部分CDN图片无法采集问题
V1.1.0 2020.01.09
  • 新增图片采集模式,支持手动或者自动采集;
  • 代理服务器支持加密代理服务器配置
  • 新增采集图片选项设置,支持设置采集图片尺寸规格/文件名规则/标题及代替文本/对齐方式等。
V1.0.1 2019.12.11
  • 修正WordPress v5.3兼容性问题
V1.0.0 2019.05.17
  • 新增JPEG, JPG, PNG&GIF等常见图片格式支持
  • 新增图片爬取默认代理服务器功能
  • 新增图片爬取自定义代理服务器配置功能
  • 新增图片队列下载功能

评论交流

戟战清风进行回复 取消回复

评论列表(51)

  • 你好

    2020.9.16 11:09

    希望可以增加水印功能,感谢!

    回复
  • 王俊广

    2020.9.14 18:09

    王俊广 2020.4.23 15:04
    你好,新增特色图片设置功能,采集模式设置为自动时,下面的‘默认采集第一张图片为特色图片’打勾,结果没问题;然而把√取消后,却还自动设置特色图像,这是个bug,希望改进。

    都说了这个bug这么长时间了,还是置之不理?

    回复
    • WBOLT_COM

      2020.9.15 09:09

      NO,正在研究新的采集方式。没有新的版本,自然有些不紧急的bug或者体验问题,不会特地去升级一个版本的。

  • 木鱼网络

    2020.9.11 23:09

    新建文章没有:“保存站外图片”按钮呢

    回复
    • WBOLT_COM

      2020.9.12 10:09

      不支持古腾堡编辑器。

  • gdisanmao

    2020.9.6 18:09

    webp的图片下载自动保存为jpg后文章不显示图片

    回复
  • Liberation

    2020.8.15 00:08

    保存图片可以自动存到阿里云OSS吗

    回复
    • WBOLT_COM

      2020.8.15 10:08

      我们暂不支持oss,不知道其他的存储插件。但我们未来大部分产品会陆续接入oss的支持。

  • ✎ℳ`ゞAoguღ子沐

    2020.7.24 05:07

    功能很强大,就是不知道为什么,我的图片老是重复。采集也会变成两个

    回复
  • 啊啊啊啊

    2020.7.7 09:07

    全局扫描出了几千篇,不能全选(。。。),分页一次只能加载10篇,要点击那个“查看更多”几百次才能加载完?

    回复
  • 香港服务器cylm6.com

    2020.6.24 17:06

    代理咋设置

    回复
    • wbolt

      2020.6.24 21:06

      我们不提供搭建代理服务器的方法,你可以查找第三方教程学习的.

  • 缺资源网

    2020.5.31 08:05

    功能很强大,已经推荐好几个朋友使用了,希望可以增加水印功能,感谢!

    回复
  • LYM~喵‭

    2020.5.25 14:05

    更新之后反而下载不了图片了。。后来看了发现是提取图片链接出现bug了emmmm。。想先下载回旧版本的。。。

    回复
  • 欢迎²⁰²²

    2020.5.18 18:05

    扫描采集下载的地方有问题
    解析出的图片地址不对,下载失败

    回复
闪电博沟通群

扫码加入QQ交流群 695891297