Wikipedia crawler

Wikipedia crawler蜘蛛/爬虫属于链接检测类型，由Wikimedia Foundation Inc开发运行。您可以继续阅读下方信息，以深入了解Wikipedia crawler基本信息，用户代理和访问控制等。

基本信息

Wikipedia crawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫，可能存在信息不明的情况。

蜘蛛/爬虫名称: Wikipedia crawler

类型: 链接检测

开发商: Wikimedia Foundation Inc

当前状态: 活动

用户代理

关于Wikipedia crawler蜘蛛或者爬虫的用户代理字符串，IP地址和服务器，所在地等信息如下表格所示：

用户代理字符串: IABot/2.0 (+https://meta.wikimedia.org/wiki/InternetArchiveBot/FAQ_for_sysadmins) (Checking if link from Wikipedia is broken and needs removal)

首次出现: 2019-09-21 07:32:50

最后出现: 2024-12-10 05:45:33

遵循robots.txt: 未知

来源

IP地址(3)	服务器名称	所属国家
185.15.56.22	instance-cyberbot-exec-iabot-01.cyberbot.wmflabs.org	US
185.15.56.29	instance-cyberbot-exec-iabot-02.cyberbot.wmflabs.org	NL
185.15.56.1	nat.cloudgw.eqiad1.wikimediacloud.org	US

用户代理字符串: IABot: Checking if link from Wikipedia is broken and needs removal - See https://meta.wikimedia.org/wiki/InternetArchiveBot/FAQ_for_sysadmins

首次出现: 2019-04-19 05:00:12

最后出现: 2019-09-09 08:13:37

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
185.15.56.22	instance-cyberbot-exec-iabot-01.cyberbot.wmflabs.org	US

用户代理字符串: COIBotParser/2.0

首次出现: 2019-08-09 09:08:31

最后出现: 2019-08-09 09:08:31

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
185.15.56.1	nat.openstack.eqiad1.wikimediacloud.org	NL

用户代理字符串: German Wikipedia Broken Weblinks Bot; contact: gifti@tools.wmflabs.org

首次出现: 2015-02-21 09:58:19

最后出现: 2017-02-14 08:13:11

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
208.80.155.255	internal-server-nat.wmflabs.org	US

访问控制

了解如何控制Wikipedia crawler访问权限，避免Wikipedia crawler抓取行为不当。

是否拦截Wikipedia crawler？

通常不需要。链接检测类爬虫的爬取行为一般也不是自发性的，仅当认为提交网站链接检测请求，这些爬虫才会对网站的链接进行抓取和检测。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Wikipedia crawler 或限制其访问权限。我们建议安装 Spider Analyser 插件，以检查它是否真正遵循这些规则。

# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: Wikipedia crawler
Disallow: /

您无需手动执行此操作，可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

站长工具

我们为站长量身定做的高效工具集。

查看全部工具

常见蜘蛛/爬虫

Common Spiders

Linquisitor crawler

Linquisitor crawler蜘蛛/爬虫属于链接检测类型，由Pavel Ageev开发运行。您可以继续阅读下方信息，以深入了解Linquisitor crawler基本信息，用户代理和访问控制等。

LinkChecker Pro bot

LinkChecker Pro bot蜘蛛/爬虫属于链接检测类型，由Local Profy LLC开发运行。您可以继续阅读下方信息，以深入了解LinkChecker Pro bot基本信息，用户代理和访问控制等。

Online Domain Tools

Online Domain Tools蜘蛛/爬虫属于监控类型，由AITIS s.r.o.开发运行。您可以继续阅读下方信息，以深入了解Online Domain Tools基本信息，用户代理和访问控制等。

UASlinkChecker

UASlinkChecker蜘蛛/爬虫属于链接检测类型，由Udger s.r.o.开发运行。您可以继续阅读下方信息，以深入了解UASlinkChecker基本信息，用户代理和访问控制等。

WPMU DEV crawler

WPMU DEV crawler蜘蛛/爬虫属于链接检测类型，由Incsub, LLC开发运行。您可以继续阅读下方信息，以深入了解WPMU DEV crawler基本信息，用户代理和访问控制等。

Wikipedia crawler

Dead Link Checker

Dead Link Checker蜘蛛/爬虫属于链接检测类型，由Slogical Corporation开发运行。您可以继续阅读下方信息，以深入了解Dead Link Checker基本信息，用户代理和访问控制等。

Urlcheckr

Urlcheckr蜘蛛/爬虫属于链接检测类型，由Device Independent开发运行。您可以继续阅读下方信息，以深入了解Urlcheckr基本信息，用户代理和访问控制等。

如何做搜索引擎蜘蛛日志分析

搜索引擎蜘蛛日志文件是一种非常强大但未被站长充分利用的文件，分析它可以获取有关每个搜索引擎如何爬取网站内容的相关信息点，及查看搜索引擎蜘蛛在一段时间内的行为。

什么是抓取预算（Crawl Budget）及如何最大化其利用价值

抓取预算（Crawl Budget），您又可以将之称为抓取频率、抓取量。这个量一般是由搜索引擎蜘蛛根据网站的质量度和权重给域名分配的。理解抓取预算的定义，重要性及最大化其效率，这有利于网站的索引、排名。

怎样才算有利于SEO的网站结构

众所周知，扁平且层级不超过三级的网站结构是最有利于搜索引擎蜘蛛爬取的。显浅的一句看似易懂但如深入，又未必是那么容易理解。下面我们将深入了解网站结构的定义，重要性及实践，以便于各位技术开发、站长和SEOer在未来的网站开发及运营中应用。

为什么要控制Googlebot抓取速度？

在本文中，我们将了解您为什么要控制Googlebot以及如何控制Googlebot和其他搜索引擎爬虫的抓取速度。

如何拦截Google和Bing访问您的网站？

在本文中，我们将解释如何屏蔽Googlebot和Bingbot，屏蔽爬虫后会发生什么以及出现爬取问题的常见原因。

Bing网站管理员工具Bingbot网站爬取频率设置

Bing网站管理员工具中的爬网空间功能允许网站管理员控制Bingbot抓取您的网站的速率。当您的网站上有访问者以适当地管理带宽时，需要进行爬网控制以限制Bingbot和Googlebot等搜索引擎蜘蛛的活动。

WordPress拦截IP地址的6种方法

当网站规模扩大时，您需要采取某些措施来限制来自评论垃圾邮件发送者、无效机器人和人类攻击者的流量。这对于保护您的服务器资源可用于真实用户以及您支付托管费用以获得真实访问者至关重要。在本文中，我们将解释在WordPress中拦截IP地址的6种方法。

如何禁止搜索引擎索引WordPress网站

您可能想要隐藏站点上的内容的原因有很多，但依靠“建议搜索引擎不索引本站点”选项并不是确保此类内容不被看到的最佳方法。除非您想在网络上隐藏您的整个网站，否则永远不要单击此选项，因为如果不小心切换，它会对您的SEO造成巨大损害。

闪电侠

(工作日 10:00 - 18:30 为您服务)

2026-07-31 04:21:58

您好，无论是售前、售后、意见建议……均可通过联系工单与我们取得联系。

您也可选择聊天工具与我们即时沟通或点击查看：

常见问题

您的工单我们已经收到，我们将会尽快跟您联系！

您想了解哪方面的问题？

如何查看主题或者插件报错信息
主题插件授权如何更换绑定域名？
插件激活提示“key使用次数超出限制范围”？
授权域名是否区分子域名或根域名？
购买主题是否可协助配置服务器？
主题插件授权域名可否更改？
主题插件是按年付费还是一次性付费？
主题插件授权支持多少个站点？

选择聊天工具：

Wikipedia crawler

基本信息

用户代理

访问控制

是否拦截Wikipedia crawler？

通过Robots.txt拦截

更多信息

关于InternetArchiveBot

InternetArchiveBot如何运作

启动和停止机器人

配置机器人

请求特定的文章

关于InternetArchiveBot的常见问题

站长工具

常见蜘蛛/爬虫

相关文章