My Nutch Spider

My Nutch Spider蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解My Nutch Spider基本資訊,使用者代理和訪問控制等。

基本資訊

My Nutch Spider的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
My Nutch Spider
型別
爬蟲
開發商
Unknown Author
當前狀態
活動

使用者代理

關於My Nutch Spider蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
My Nutch Spider/Nutch-1.18
使用者代理字串
My Nutch Spider/Nutch-1.18
首次出現
2022-07-08 10:19:30
最後出現
2022-07-28 19:11:23
遵循robots.txt
未知
來源
IP地址(3) 伺服器名稱 所屬國家
35.187.118.3 ? BE
158.174.80.2 h-158-174-80-2.a357.priv.bahnhof.se SE
3.84.214.146 ec2-3-84-214-146.compute-1.amazonaws.com US
使用者代理字串
My Nutch Spider/Nutch-1.16
首次出現
2020-03-29 18:08:43
最後出現
2020-03-29 18:08:43
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
35.187.118.3 ? BE
158.174.80.2 h-158-174-80-2.a357.priv.bahnhof.se SE
3.84.214.146 ec2-3-84-214-146.compute-1.amazonaws.com US
93.217.136.233 p5dd988e9.dip0.t-ipconnect.de DE
使用者代理字串
My Nutch Spider/Nutch-1.14
首次出現
2018-05-08 02:09:25
最後出現
2018-06-20 21:28:49
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
141.41.35.82 ? DE
193.136.212.194 gtdei-nat-cisuc.dei.uc.pt PT
使用者代理字串
My Nutch Spider/Nutch-1.12
首次出現
2017-03-14 06:24:26
最後出現
2017-04-04 03:37:21
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
193.136.212.204 gtdei-nat-servidores-alunos.dei.uc.pt PT
147.47.120.248 scalgateway.snu.ac.kr KR
使用者代理字串
My Nutch Spider/Nutch-1.9
首次出現
2015-01-25 08:49:33
最後出現
2016-09-07 14:14:16
遵循robots.txt
未知
來源
IP地址(6) 伺服器名稱 所屬國家
198.211.112.147 search.serend.io US
104.236.210.7 search.serend.io US
144.76.217.197 ? DE
104.236.223.91 search.serend.io US
195.113.209.154 doom14.metacentrum.cz CZ
69.203.107.29 cpe-69-203-107-29.nyc.res.rr.com US
使用者代理字串
My Nutch Spider/Nutch-1.11
首次出現
2016-01-28 20:52:36
最後出現
2016-07-13 06:43:43
遵循robots.txt
未知
來源
IP地址(13) 伺服器名稱 所屬國家
172.99.69.88 ? US
162.242.255.52 ? US
52.6.251.74 ec2-52-6-251-74.compute-1.amazonaws.com US
52.21.174.235 ec2-52-21-174-235.compute-1.amazonaws.com US
52.71.49.253 ec2-52-71-49-253.compute-1.amazonaws.com US
92.186.121.46 46.pool92-186-121.dynamic.orange.es ES
52.2.208.248 ec2-52-2-208-248.compute-1.amazonaws.com US
52.71.53.178 ec2-52-71-53-178.compute-1.amazonaws.com US
52.3.129.222 ec2-52-3-129-222.compute-1.amazonaws.com US
52.70.130.19 ec2-52-70-130-19.compute-1.amazonaws.com US
使用者代理字串
My Nutch Spider/Nutch-1.10
首次出現
2016-02-25 18:28:45
最後出現
2016-02-25 18:28:45
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
144.76.217.197 ? DE
使用者代理字串
My Nutch Spider/Nutch-1.6
首次出現
2014-02-23 06:21:57
最後出現
2015-06-12 19:46:17
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
46.17.203.253 f2.skbkontur.ru RU
使用者代理字串
My Nutch Spider/Nutch-1.5-SNAPSHOT
首次出現
2012-02-04 13:50:00
最後出現
2014-05-02 11:01:17
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
118.250.163.108 ? CN
129.100.16.86 lab400-dk.kdd.csd.uwo.ca CA
使用者代理字串
My Nutch Spider/Nutch-1.5
首次出現
2012-06-14 09:15:34
最後出現
2012-10-20 00:20:03
遵循robots.txt
未知
來源
IP地址(4) 伺服器名稱 所屬國家
184.73.9.68 ec2-184-73-9-68.compute-1.amazonaws.com US
204.236.227.151 ec2-204-236-227-151.compute-1.amazonaws.com US
205.168.84.133 ? US
69.165.131.132 69-165-131-132.dsl.teksavvy.com CA
使用者代理字串
My Nutch Spider/Nutch-1.5.1
首次出現
2012-08-04 16:23:42
最後出現
2012-09-07 12:47:53
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
72.9.5.148 d-72-9-5-148.cpe.metrocast.net US
使用者代理字串
My Nutch Spider/Nutch-1.4
首次出現
2012-04-23 10:15:35
最後出現
2012-04-23 10:15:35
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
50.57.109.72 50-57-109-72.static.cloud-ips.com US
使用者代理字串
My Nutch Spider/Nutch-1.3
首次出現
2011-10-14 12:56:27
最後出現
2011-10-22 20:27:01
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
69.28.58.15 ? US

訪問控制

瞭解如何控制My Nutch Spider訪問許可權,避免My Nutch Spider抓取行為不當。

是否攔截My Nutch Spider?

可以考慮攔截。。爬蟲通常會下載公開的網際網路內容,這些內容預設情況下可以免費訪問。不過,如果你不希望你的內容被用於未經授權的目的,你應該攔截它們。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 My Nutch Spider 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: My Nutch Spider
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: My Nutch Spider Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: My Nutch Spider
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

常見蜘蛛/爬蟲

Common Spiders
Crawler-IP-Fetcher
Crawler-IP-Fetcher蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解Crawler-IP-Fetcher基本資訊,使用者代理和訪問控制等。
DARPResearchBot
DARPResearchBot蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解DARPResearchBot基本資訊,使用者代理和訪問控制等。
xfa1
xfa1蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解xfa1基本資訊,使用者代理和訪問控制等。
MassScanner
MassScanner蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解MassScanner基本資訊,使用者代理和訪問控制等。
robots-bulk-crawler
robots-bulk-crawler蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解robots-bulk-crawler基本資訊,使用者代理和訪問控制等。
studyBot
studyBot蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解studyBot基本資訊,使用者代理和訪問控制等。
AASA-Bot
AASA-Bot蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解AASA-Bot基本資訊,使用者代理和訪問控制等。
Tranco Crawler
Tranco Crawler蜘蛛/爬蟲屬於爬蟲型別,由Unknown Author開發執行。您可以繼續閱讀下方資訊,以深入瞭解Tranco Crawler基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles