BUbiNG

BUbiNG蜘蛛/爬蟲屬於其他型別,由Universita degli studi di Milano.開發執行。您可以繼續閱讀下方資訊,以深入瞭解BUbiNG基本資訊,使用者代理和訪問控制等。

基本資訊

BUbiNG的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
BUbiNG
型別
其他
開發商
Universita degli studi di Milano.
當前狀態
活動

使用者代理

關於BUbiNG蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
BUbiNG
使用者代理字串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html)
首次出現
2013-10-04 13:20:30
最後出現
2019-11-22 21:51:48
遵循robots.txt
未知
來源
IP地址(570) 伺服器名稱 所屬國家
52.87.252.80 ec2-52-87-252-80.compute-1.amazonaws.com US
93.103.137.65 93-103-137-65.dynamic.t-2.net SI
89.212.20.214 89-212-20-214.dynamic.t-2.net SI
93.103.154.48 93-103-154-48.dynamic.t-2.net SI
195.78.123.5 ip005-123.netbone.cz CZ
64.62.252.163 ? US
64.62.252.164 ? US
64.62.252.162 ? US
147.229.8.39 athena2.fit.vutbr.cz CZ
64.62.252.169 ? US
使用者代理字串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html#dc)
首次出現
2018-03-03 03:13:56
最後出現
2018-03-25 22:51:46
遵循robots.txt
未知
來源
IP地址(8) 伺服器名稱 所屬國家
52.201.172.119 ec2-52-201-172-119.compute-1.amazonaws.com US
34.202.159.35 ec2-34-202-159-35.compute-1.amazonaws.com US
52.23.213.46 ec2-52-23-213-46.compute-1.amazonaws.com US
54.174.39.248 ec2-54-174-39-248.compute-1.amazonaws.com US
35.153.193.122 ec2-35-153-193-122.compute-1.amazonaws.com US
54.208.249.249 ec2-54-208-249-249.compute-1.amazonaws.com US
34.207.57.181 ec2-34-207-57-181.compute-1.amazonaws.com US
34.232.76.186 ec2-34-232-76-186.compute-1.amazonaws.com US
使用者代理字串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html#wc)
首次出現
2018-03-03 03:39:04
最後出現
2018-03-25 22:09:40
遵循robots.txt
未知
來源
IP地址(680) 伺服器名稱 所屬國家
147.229.8.59 knot38.fit.vutbr.cz CZ
147.229.8.170 knot36.fit.vutbr.cz CZ
147.229.8.167 knot37.fit.vutbr.cz CZ
147.229.8.39 athena2.fit.vutbr.cz CZ
147.229.8.130 knot30.fit.vutbr.cz CZ
147.229.8.140 knot35.fit.vutbr.cz CZ
147.229.8.136 knot33.fit.vutbr.cz CZ
147.229.8.224 knot04.fit.vutbr.cz CZ
147.229.8.105 athena5.fit.vutbr.cz CZ
147.229.8.135 athena9.fit.vutbr.cz CZ
52.87.252.80 ec2-52-87-252-80.compute-1.amazonaws.com US
93.103.137.65 93-103-137-65.dynamic.t-2.net SI
89.212.20.214 89-212-20-214.dynamic.t-2.net SI
93.103.154.48 93-103-154-48.dynamic.t-2.net SI
195.78.123.5 ip005-123.netbone.cz CZ
64.62.252.163 ? US
64.62.252.164 ? US
64.62.252.162 ? US
64.62.252.169 ? US
52.201.172.119 ec2-52-201-172-119.compute-1.amazonaws.com US
34.202.159.35 ec2-34-202-159-35.compute-1.amazonaws.com US
52.23.213.46 ec2-52-23-213-46.compute-1.amazonaws.com US
54.174.39.248 ec2-54-174-39-248.compute-1.amazonaws.com US
35.153.193.122 ec2-35-153-193-122.compute-1.amazonaws.com US
54.208.249.249 ec2-54-208-249-249.compute-1.amazonaws.com US
34.207.57.181 ec2-34-207-57-181.compute-1.amazonaws.com US
34.232.76.186 ec2-34-232-76-186.compute-1.amazonaws.com US
34.201.161.68 ec2-34-201-161-68.compute-1.amazonaws.com US
174.129.54.205 ec2-174-129-54-205.compute-1.amazonaws.com US
35.168.8.213 ec2-35-168-8-213.compute-1.amazonaws.com US
52.91.148.207 ec2-52-91-148-207.compute-1.amazonaws.com US
107.20.26.147 ec2-107-20-26-147.compute-1.amazonaws.com US
52.91.154.143 ec2-52-91-154-143.compute-1.amazonaws.com US
52.72.12.225 ec2-52-72-12-225.compute-1.amazonaws.com US
54.86.94.45 ec2-54-86-94-45.compute-1.amazonaws.com US
54.166.133.220 ec2-54-166-133-220.compute-1.amazonaws.com US
54.208.43.88 ec2-54-208-43-88.compute-1.amazonaws.com US
使用者代理字串
BUbiNG (+http://law.di.unimi.it/BUbiNG.html#wc)
首次出現
2018-03-03 03:39:04
最後出現
2018-03-25 22:09:40
遵循robots.txt
未知
來源
IP地址(680) 伺服器名稱 所屬國家
34.201.161.68 ec2-34-201-161-68.compute-1.amazonaws.com US
174.129.54.205 ec2-174-129-54-205.compute-1.amazonaws.com US
35.168.8.213 ec2-35-168-8-213.compute-1.amazonaws.com US
52.91.148.207 ec2-52-91-148-207.compute-1.amazonaws.com US
107.20.26.147 ec2-107-20-26-147.compute-1.amazonaws.com US
52.91.154.143 ec2-52-91-154-143.compute-1.amazonaws.com US
52.72.12.225 ec2-52-72-12-225.compute-1.amazonaws.com US
54.86.94.45 ec2-54-86-94-45.compute-1.amazonaws.com US
54.166.133.220 ec2-54-166-133-220.compute-1.amazonaws.com US
54.208.43.88 ec2-54-208-43-88.compute-1.amazonaws.com US

訪問控制

瞭解如何控制BUbiNG訪問許可權,避免BUbiNG抓取行為不當。

是否攔截BUbiNG?

對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的,也可能是壞的,這取決於它是什麼。所以說,這需要站長進一步分析判斷這些尚不明確的爬蟲行為,再作最終決定。 但,根據以往的經驗,未宣告行為目的及未命名的蜘蛛爬蟲,通常都有不可告人的祕密,我們理應對其行為進行控制,比如攔截。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 BUbiNG 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: BUbiNG
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: BUbiNG Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: BUbiNG
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

BUbiNG是一個可擴充套件的、完全分散式的爬蟲,目前正在開發中,它取代了UbiCrawler

BUbiNG支援機器人排除標準。如果你想排除你的網站被BUbiNG抓取,請參閱《網路機器人頁面》。

簡而言之,你可以在你想排除抓取的網路伺服器根目錄的robots.txt檔案中放入以下內容。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
User-agent: BUbiNG
Disallow: /
User-agent: BUbiNG Disallow: /
User-agent: BUbiNG
Disallow: /

目前,BUbiNG尊重robots.txt檔案的變化(通常每小時一次),但不支援META標籤的機器人排除。

如需任何資訊,請隨時傳送電子郵件至 law@di.unimi.it。

常見蜘蛛/爬蟲

Common Spiders
Fraunhofer crawler
Fraunhofer crawler蜘蛛/爬蟲屬於其他型別,由Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Fraunhofer crawler基本資訊,使用者代理和訪問控制等。
companyspotter
companyspotter蜘蛛/爬蟲屬於其他型別,由CompanySpotter BV開發執行。您可以繼續閱讀下方資訊,以深入瞭解companyspotter基本資訊,使用者代理和訪問控制等。
DataForSeo bot
DataForSeo bot蜘蛛/爬蟲屬於其他型別,由DataForSEO OU開發執行。您可以繼續閱讀下方資訊,以深入瞭解DataForSeo bot基本資訊,使用者代理和訪問控制等。
CloudFlare crawler
CloudFlare crawler蜘蛛/爬蟲屬於其他型別,由CloudFlare, Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解CloudFlare crawler基本資訊,使用者代理和訪問控制等。
Odin
Odin蜘蛛/爬蟲屬於其他型別,由Cyble, Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Odin基本資訊,使用者代理和訪問控制等。
Chrome Privacy Preserving Prefetch Proxy
Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬蟲屬於其他型別,由Google Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Chrome Privacy Preserving Prefetch Proxy基本資訊,使用者代理和訪問控制等。
EFF crawler
EFF crawler蜘蛛/爬蟲屬於其他型別,由Electronic Frontier Foundation開發執行。您可以繼續閱讀下方資訊,以深入瞭解EFF crawler基本資訊,使用者代理和訪問控制等。
Modat crawler
Modat crawler蜘蛛/爬蟲屬於其他型別,由Modat B.V.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Modat crawler基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles