MirrorWeb bot

基本資訊

MirrorWeb bot的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲，可能存在資訊不明的情況。

使用者代理

關於MirrorWeb bot蜘蛛或者爬蟲的使用者代理字串，IP地址和伺服器，所在地等資訊如下表格所示：

使用者代理字串: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36 +https://www.mirrorweb.com crawling on behalf of The National Archives UK Government Web Archive: http://www.nationalarchives.gov.uk/webarchive/; webarchive@nationalarchives.gov.uk

來源

IP地址(1)	伺服器名稱	所屬國家
18.132.198.41	ec2-18-132-198-41.eu-west-2.compute.amazonaws.com	?

訪問控制

瞭解如何控制MirrorWeb bot訪問許可權，避免MirrorWeb bot抓取行為不當。

對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的，也可能是壞的，這取決於它是什麼。所以說，這需要站長進一步分析判斷這些尚不明確的爬蟲行為，再作最終決定。但，根據以往的經驗，未宣告行為目的及未命名的蜘蛛爬蟲，通常都有不可告人的祕密，我們理應對其行為進行控制，比如攔截。

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 MirrorWeb bot 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛，以檢查它是否真正遵循這些規則。

# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: MirrorWeb bot
Disallow: /

您無需手動執行此操作，可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

mirrorweb對公共和門控網站進行存檔，無論其複雜程度如何，以支援您的合規性、監管和儲存義務。mirrorweb在直觀的、易於瀏覽的SaaS平臺上捕捉、儲存、索引和重放所有內容。

mirrorweb聲稱其網路歸檔技術是世界上最好的，可以捕捉到市場上最動態的內容。mirrorweb捕捉您的網路資產，並將其作為一個活的網站來重放。

MirrorWeb於2012年由英國曼徹斯特一家酒館上的一個小團隊創立。現在，我們在兩大洲設有辦事處，並在全球範圍內招聘員工，我們已經建立了一個充滿活力的團隊，並在不斷壯大。

基本資訊