

IP地址(1) | 伺服器名稱 | 所屬國家 |
---|---|---|
161.97.144.155 | vmi487123.contaboserver.net | DE |
IP地址(2) | 伺服器名稱 | 所屬國家 |
---|---|---|
161.97.144.155 | vmi487123.contaboserver.net | US |
104.238.159.242 | ? | DE |
對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的,也可能是壞的,這取決於它是什麼。所以說,這需要站長進一步分析判斷這些尚不明確的爬蟲行為,再作最終決定。 但,根據以往的經驗,未宣告行為目的及未命名的蜘蛛爬蟲,通常都有不可告人的祕密,我們理應對其行為進行控制,比如攔截。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Tomba Crawler 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: Tomba Crawler Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。
Tomba成立於2021年,其使命是為專業人士提供與重要人物建立新聯絡的力量。
TombaPublicWebCrawler是一個網路搜尋引擎的索引機器人,類似於谷歌。由Tomba技術網路服務有限公司(Tomba.io)建立,TombaPublicWebCrawler的專利技術不斷掃描數百萬個公司網站、新聞稿、電子新聞服務、SEC檔案和其他線上來源。利用先進的自然語言處理演算法,Tomba建立了一個下一代搜尋引擎,專注於尋找有企業和商業專業人士資訊的網頁。
Version: 3.0 Obeys Robots.txt: Yes User-Agent String: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tombascraper.com)
該機器人只分析公共網頁。
是的。絕對的。我們嚴格遵循robots.txt,包括禁止和允許規則。
如上所述,TombaPublicWebCrawler嚴格遵守您網站上的robots.txt檔案。因此,如果您需要,您可以完全控制您網站上的它。
要改變TombaPublicWebCrawler訪問您網站的頻率,您可以在Robots.txt檔案中指定我們的機器人連續兩次請求之間的最小可接受延遲。
User-agent: TombaPublicWebCrawler Crawl-Delay: [value]
其中Crawl-Delay值是以秒為單位的時間。如果由於某種原因,你想阻止TombaPublicWebCrawler訪問你的網站,請在你的伺服器上的robots.txt檔案中放入以下兩行。
User-agent: TombaPublicWebCrawler Disallow: /
請注意,TombaPublicWebCrawler可能需要一些時間來選擇robots.txt檔案中的變化。這將在每次預定抓取之前進行。
還請注意,如果您的robots.txt包含錯誤,TombaPublicWebCrawler將無法識別您的命令,它將繼續按照以前的方式抓取您的網站。
閱讀更多關於robots.txt的資訊:https://support.google.com/webmasters/answer/6062608?hl=en
如果您認為TombaPublicWebCrawler在您的網站上有某種程度的不當行為,或者您對它有任何疑問,請毫不猶豫地聯絡tomba的支援團隊:support@tomba.io。