iodc crawler

iodc crawler蜘蛛/爬虫属于工具类型,由Isle Of Dogs Company Ltd.开发运行。您可以继续阅读下方信息,以深入了解iodc crawler基本信息,用户代理和访问控制等。

基本信息

iodc crawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
iodc crawler
类型
工具
开发商
Isle Of Dogs Company Ltd.
当前状态
活动

用户代理

关于iodc crawler蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
odysseus 14964-100-030220154951-463
用户代理字符串
Mozilla/5.0 (iodc; odysseus 14964-100-030220154951-463; +https://iodc.co.uk)
首次出现
2020-02-03 15:50:51
最后出现
2020-02-03 15:50:51
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 23986-200-050120115257-485; +https://iodc.co.uk)
首次出现
2020-01-05 11:56:25
最后出现
2020-01-05 11:56:25
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 15338-100-030120110129-337; +https://iodc.co.uk)
首次出现
2020-01-03 11:01:58
最后出现
2020-01-03 11:01:58
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 25215-200-081219164513-241; +https://iodc.co.uk)
首次出现
2019-12-08 16:48:57
最后出现
2019-12-08 16:48:57
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 16380-100-071219084723-405; +https://iodc.co.uk)
首次出现
2019-12-07 08:54:17
最后出现
2019-12-07 08:54:17
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 23940-100-041119062235-438; +https://iodc.co.uk)
首次出现
2019-11-04 06:22:47
最后出现
2019-11-04 06:22:47
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 15217-200-031119031248-216; +https://iodc.co.uk)
首次出现
2019-11-03 03:13:04
最后出现
2019-11-03 03:13:04
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 15274-200-031019043606-274; +https://iodc.co.uk)
首次出现
2019-10-03 05:30:39
最后出现
2019-10-03 05:30:39
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 15180-100-030819012046-180; +https://iodc.co.uk)
首次出现
2019-08-03 02:23:15
最后出现
2019-08-03 02:23:15
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB
用户代理字符串
Mozilla/5.0 (iodc; odysseus 15201-200-030719080804-202; +https://iodc.co.uk)
首次出现
2019-07-03 09:10:14
最后出现
2019-07-03 09:10:14
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
81.130.224.104 host81-130-224-104.in-addr.btopenworld.com GB

访问控制

了解如何控制iodc crawler访问权限,避免iodc crawler抓取行为不当。

是否拦截iodc crawler?

可能不需要。工具类型爬虫通常为网站所有者使用此类工具对网站进行相关服务请求才会出现。当然,实际情况需站长判断后再作决定。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 iodc crawler 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: iodc crawler
Disallow: /
# robots.txt # 下列代码一般情况可以拦截该代理 User-agent: iodc crawler Disallow: /
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: iodc crawler
Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders

相关文章

Related Articles