Setoozbot
Setoozbot蜘蛛/爬虫属于其他类型,由SETU Software Systems (P) Ltd.开发运行。您可以继续阅读下方信息,以深入了解Setoozbot基本信息,用户代理和访问控制等。
基本信息
Setoozbot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- Setoozbot
- 类型
- 其他
- 开发商
-
SETU Software Systems (P) Ltd.
- 当前状态
-
无效
用户代理
关于Setoozbot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
SETOOZBOT/5.0
-
SETOOZBOT/5.0
-
Setoozbot/1.0
-
SETOOZBOT/0.30 a
-
SETOOZBOT/0.30
-
SETOOZBOT/0.30
-
OOZBOT/0.20 c
-
OOZBOT/0.20 b
-
OOZBOT/0.20
- 用户代理字符串
- SETOOZBOT/5.0 ( http://www.setooz.com/bot.html )
- 首次出现
- 2012-01-02 13:01:01
- 最后出现
- 2011-12-16 15:15:38
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
67.215.230.27 |
wc27.setooz.com |
US |
- 用户代理字符串
- Setooz/Nutch-1.0 (http://www.setooz.com)
- 首次出现
- 2011-06-10 20:53:36
- 最后出现
- 2011-07-09 05:10:16
- 遵循robots.txt
- 未知
- 来源
-
IP地址(6) |
服务器名称 |
所属国家 |
67.215.230.44 |
unassigned.quadranet.com |
US |
67.215.230.51 |
unassigned.quadranet.com |
US |
67.215.230.27 |
wc27.setooz.com |
US |
67.215.230.29 |
wc29.setooz.com |
US |
67.215.230.38 |
wc38.setooz.com |
US |
67.215.230.42 |
unassigned.quadranet.com |
US |
- 用户代理字符串
- Mozilla/5.0 ( compatible; SETOOZBOT/0.30 ; http://www.setooz.com/bot.html )
- 首次出现
- 2010-05-20 00:22:11
- 最后出现
- 2010-10-04 01:17:57
- 遵循robots.txt
- 未知
- 来源
-
IP地址(8) |
服务器名称 |
所属国家 |
67.215.230.23 |
wc23.setooz.com |
US |
67.215.230.35 |
wc35.setooz.com |
US |
67.215.230.29 |
wc29.setooz.com |
US |
67.215.230.28 |
wc28.setooz.com |
US |
67.215.230.22 |
wc22.setooz.com |
US |
67.215.230.20 |
wc20.setooz.com |
US |
67.215.230.24 |
wc24.setooz.com |
US |
67.215.230.25 |
wc25.setooz.com |
US |
- 用户代理字符串
- Mozilla/5.0 ( compatible; SETOOZBOT/0.30 ; http://www.setooz.com/bot.html ; agentname at setooz dot_com )
- 首次出现
- 2010-05-26 15:11:30
- 最后出现
- 2010-09-05 06:20:55
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
67.215.230.26 |
wc26.setooz.com |
US |
67.215.230.25 |
wc25.setooz.com |
US |
67.215.230.42 |
unassigned.quadranet.com |
US |
67.215.230.24 |
wc24.setooz.com |
US |
- 用户代理字符串
- Mozilla/5.0 ( compatible; SETOOZBOT/0.30 ; http://www.setooz.com/bot.html ; agentname at setooz dot_com )
- 首次出现
- 2010-05-26 15:11:30
- 最后出现
- 2010-09-05 06:20:55
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
67.215.230.24 |
wc24.setooz.com |
US |
67.215.230.25 |
wc25.setooz.com |
US |
67.215.230.42 |
unassigned.quadranet.com |
US |
- 用户代理字符串
- OOZBOT/0.20 ( http://www.setooz.com/oozbot.html ; agentname at setooz dot_com )
- 首次出现
- 2009-06-12 17:00:08
- 最后出现
- 2010-04-07 01:26:10
- 遵循robots.txt
- 未知
- 来源
-
IP地址(16) |
服务器名称 |
所属国家 |
67.215.230.20 |
wc20.setooz.com |
US |
67.215.230.35 |
wc35.setooz.com |
US |
67.215.230.25 |
wc25.setooz.com |
US |
67.215.230.16 |
wc16.setooz.com |
US |
67.215.230.45 |
unassigned.quadranet.com |
US |
67.215.230.47 |
unassigned.quadranet.com |
US |
67.215.230.46 |
unassigned.quadranet.com |
US |
67.215.230.44 |
unassigned.quadranet.com |
US |
67.215.230.23 |
wc23.setooz.com |
US |
67.215.230.49 |
unassigned.quadranet.com |
US |
67.215.230.24 |
wc24.setooz.com |
US |
67.215.230.14 |
wc14.setooz.com |
US |
67.215.230.22 |
wc22.setooz.com |
US |
67.215.230.48 |
unassigned.quadranet.com |
US |
67.215.230.21 |
wc21.setooz.com |
US |
67.215.230.42 |
unassigned.quadranet.com |
US |
- 用户代理字符串
- OOZBOT/0.20 ( Setooz výrazný ako say-th-uuz, znamená mosty. ; http://www.setooz.com/oozbot.html ; agentname at setooz dot_com )
- 首次出现
- 2009-05-11 05:50:00
- 最后出现
- 2009-06-09 08:56:26
- 遵循robots.txt
- 未知
- 来源
-
IP地址(10) |
服务器名称 |
所属国家 |
67.215.230.27 |
wc27.setooz.com |
US |
67.215.230.33 |
wc33.setooz.com |
US |
67.215.230.34 |
wc34.setooz.com |
US |
67.215.230.36 |
wc36.setooz.com |
US |
67.215.230.39 |
wc39.setooz.com |
US |
67.215.230.41 |
wc41.setooz.com |
US |
67.215.230.20 |
wc20.setooz.com |
US |
67.215.230.21 |
wc21.setooz.com |
US |
67.215.230.22 |
wc22.setooz.com |
US |
67.215.230.24 |
wc24.setooz.com |
US |
- 用户代理字符串
- OOZBOT/0.20 ( -- ; http://www.setooz.com/oozbot.html ; agentname at setooz dot_com )
- 首次出现
- 2009-05-11 05:50:00
- 最后出现
- 2009-06-09 06:26:09
- 遵循robots.txt
- 未知
- 来源
-
IP地址(21) |
服务器名称 |
所属国家 |
67.215.230.24 |
wc24.setooz.com |
US |
67.215.230.36 |
wc36.setooz.com |
US |
67.215.230.25 |
wc25.setooz.com |
US |
67.215.230.37 |
wc37.setooz.com |
US |
67.215.230.27 |
wc27.setooz.com |
US |
67.215.230.38 |
wc38.setooz.com |
US |
67.215.230.28 |
wc28.setooz.com |
US |
67.215.230.39 |
wc39.setooz.com |
US |
67.215.230.29 |
wc29.setooz.com |
US |
67.215.230.40 |
wc40.setooz.com |
US |
67.215.230.21 |
wc21.setooz.com |
US |
67.215.230.33 |
wc33.setooz.com |
US |
67.215.230.22 |
wc22.setooz.com |
US |
67.215.230.34 |
wc34.setooz.com |
US |
67.215.230.23 |
wc23.setooz.com |
US |
67.215.230.35 |
wc35.setooz.com |
US |
访问控制
了解如何控制Setoozbot访问权限,避免Setoozbot抓取行为不当。
是否拦截Setoozbot?
对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。
但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Setoozbot 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: Setoozbot
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。