Scrubby
Scrubby蜘蛛/爬蟲屬於工具型別,由Scrub The Web開發執行。您可以繼續閱讀下方資訊,以深入瞭解Scrubby基本資訊,使用者代理和訪問控制等。
基本資訊
Scrubby的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
- 蜘蛛/爬蟲名稱
- Scrubby
- 型別
- 工具
- 開發商
-
Scrub The Web
- 當前狀態
-
無效
使用者代理
關於Scrubby蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
Scrubby/3.2
-
Scrubby/3.2
-
Scrubby/3.2
-
Scrubby/2.2
-
Scrubby/2.2
-
Scrubby/2.1
-
Scrubby/3.0
-
Scrubby/3.1
- 使用者代理字串
- Mozilla/5.0 (compatible; Scrubby/3.2; +http://seotools.scrubtheweb.com/webpage-analyzer.html)
- 首次出現
- 2014-07-28 07:30:00
- 最後出現
- 2016-05-12 09:39:45
- 遵循robots.txt
- 否
- 來源
-
IP地址(4) |
伺服器名稱 |
所屬國家 |
66.93.156.36 |
scrubby.scrubtheweb.com |
US |
66.93.156.43 |
spider-5.scrubtheweb.com |
US |
66.93.156.52 |
ip-93.156.52.scrubtheweb.com |
US |
66.93.156.41 |
spider-3.scrubtheweb.com |
US |
- 使用者代理字串
- Mozilla/5.0 (compatible; Scrubby/3.2; +http://seotools.scrubtheweb.com/webpage-analyzer.html)
- 首次出現
- 2014-07-28 07:30:00
- 最後出現
- 2016-05-12 09:39:45
- 遵循robots.txt
- 否
- 來源
-
IP地址(4) |
伺服器名稱 |
所屬國家 |
66.93.156.43 |
spider-5.scrubtheweb.com |
US |
66.93.156.52 |
ip-93.156.52.scrubtheweb.com |
US |
66.93.156.41 |
spider-3.scrubtheweb.com |
US |
- 使用者代理字串
- Mozilla/5.0 (compatible; Scrubby/2.2; http://www.scrubtheweb.com/)
- 首次出現
- 2015-02-19 19:44:54
- 最後出現
- 2016-02-19 19:44:54
- 遵循robots.txt
- 未知
- 來源
-
IP地址(0) |
伺服器名稱 |
所屬國家 |
188.165.238.96 |
ns3280143.ip-188-165-238.eu |
FR |
- 使用者代理字串
- Mozilla/5.0 (compatible; Scrubby/2.2; http://www.scrubtheweb.com/)
- 首次出現
- 2015-02-19 19:44:54
- 最後出現
- 2016-02-19 19:44:54
- 遵循robots.txt
- 未知
- 使用者代理字串
- Scrubby/2.1 (http://www.scrubtheweb.com/)
- 首次出現
- 2014-12-27 12:03:44
- 最後出現
- 2015-12-27 12:03:44
- 遵循robots.txt
- 未知
- 使用者代理字串
- Scrubby/3.0 (+http://www.scrubtheweb.com/help/technology.html)
- 首次出現
- 2014-08-08 09:30:00
- 最後出現
- 2014-09-07 03:34:50
- 遵循robots.txt
- 未知
- 來源
-
IP地址(1) |
伺服器名稱 |
所屬國家 |
66.93.156.51 |
ip-93.156.51.scrubtheweb.com |
US |
- 使用者代理字串
- Mozilla/5.0 (compatible; Scrubby/3.1; +http://www.scrubtheweb.com/help/technology.html)
- 首次出現
- 2014-07-28 07:25:00
- 最後出現
- 2014-07-25 20:33:38
- 遵循robots.txt
- 未知
- 來源
-
IP地址(1) |
伺服器名稱 |
所屬國家 |
66.93.156.41 |
spider-3.scrubtheweb.com |
US |
訪問控制
瞭解如何控制Scrubby訪問許可權,避免Scrubby抓取行為不當。
是否攔截Scrubby?
可能不需要。工具型別爬蟲通常為網站所有者使用此類工具對網站進行相關服務請求才會出現。當然,實際情況需站長判斷後再作決定。
通過Robots.txt攔截
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Scrubby 或限制其訪問許可權。我們建議安裝 Spider Analyser
外掛,以檢查它是否真正遵循這些規則。
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Scrubby
Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Scrubby
Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。